张家口东方中学导学案年级:高二科目:数学选修2-31-1-1使用时间:2016-03-01编制:阎银燕审核:高二数学组1合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下.——《老子》《回归分析的基本思想及其初步应用》导学案【学习目标】1.了解回归分析的基本思想和方法,培养学生观察分析计算的能力【学习目标】学习重点:回归方程ybxa,学习难点:a、b公式的推到【学法指导】1.使(,)Q值最小时,,值的推到2.结论121()()()niiiniixxyyxxyx3.ybxa中a和b的含义是什么4.(,)xy一定通过回归方程吗?【教学过程】例1.研究某灌溉倒水的流速y与水深x之间的关系,测得一组数据如下:水深x(m)1.401.501.601.701.801.902.002.10流速y(m/s)1.701.791.881.952.032.102.162.21(1)求y与x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?分析:(1)y与x的回归直线方程为0.7330.6948yx(2)当水深为1.95m时,可以预测水的流速约为2.12m/s【当堂检测】1.对两个变量y和x进行回归分析,得到一组样本数据:112233(,),(,),(,),,(,).nnxyxyxyxy则下列说法不正确的是()A.由样本数据得到的回归方程ybxa必过样本中心(,)xyB.残差平方和越小的模型,拟合的效果越好C.用相关指数2R来刻画回归效果,2R越小,说明模型的拟合效果越好D.若变量y与x之间的相关系数0.9362r,则变量y与x之间具有线性相关关系2.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量yt之间的关系有如下数据:若x与y之间线性相关,求蔬菜年平均产量y与使用氮肥量x之间的回归直线方程,并估计每单位面积蔬菜的年平均产量.(已知1515211101,10.11,161,16076.8iiiiixyxxy)年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0张家口东方中学导学案年级:高二科目:数学选修2-31-1-1使用时间:2016-03-01编制:阎银燕审核:高二数学组2合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下.——《老子》课后练习与提高1、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ybxa;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)解:(1)由题设所给数据,可得散点图如下图一、预习目标通过截距a与斜率b分别是使21(,)()niiiQyx取最小值时,求,的值。二、预习内容:1.对于一组具有线性相关关系的数据112233(,),(,),(,),,(,).nnxyxyxyxy其回归直线方程的截距和斜率的最小二乘法估计公式:a=,b=2.x=,y=3.样本点的中心三、提出问题如何使(,)Q值最小,通过观察分析式子进行试探推到课内探究学案O123456x(产量:吨)y(能耗:吨标准煤)4.5432.5张家口东方中学导学案年级:高二科目:数学选修2-31-1-1使用时间:2016-03-01编制:阎银燕审核:高二数学组3合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下.——《老子》,回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用》导学案【学习目标】1了解相关系数r和相关指数R22了解残差分析3了解随机误差产生的原因【重点难点】学习重点1相关系数r2相关指数R23随机误差学习难点残差分析的应用【学法指导】1相关系数r①12211()()()()niiinniiiixxyyrxxyy②r0表明两个变量;r0表明两个变量;r的绝对值越接近1,表明两个变量相关性,r的绝对值越接近0,表示两个变量之间当r的绝对值大于认为两个变量具有很强的相关性关系。2随机误差①在线性回归模型:ybxae中,a和b为模型的,e是y与ybxa之间的,通常e为随机变量,称为随机误差,它的均值E(e)=,方差D(e)=20②线性回归模型的完整表达式为2()0,()ybxaeEeDe随机误差e的方差2越小,通过回归直线ybxa预报真实值y的精确度3残差分析①残差对于样本点112233(,),(,),(,),,(,).nnxyxyxyxy而言,相应于它们的随机误差为ie==(i=1,2,3,…,n)其估算值为ie==(i=1,2,3,…,n).称为相应于点(,)iixy的残差。②残差平方和:类比样本方差估计总体方差的思想,可以用2==(n2)作为2的估计量,其中aybx,121()()()niiiniixxyybxx,(,)Qab称为残差平方和,可以用2衡量回归方程的预报精度,2越小,预报精度③用图形来分析残差特性:用21R来刻画回归的效果。【教学过程】(一)导入41相关系数r=2r的性质:3随机误差的定义:4相关指数R2=5R2的性质:6残差分析的步骤:(二)深入学习例随着我国经济的快速发展,城乡居民的审核水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下:张家口东方中学导学案年级:高二科目:数学选修2-31-1-1使用时间:2016-03-01编制:阎银燕审核:高二数学组4合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下.——《老子》家庭编号12345678910x收入(千元)0.81.11.31.51.51.82.02.22.42.8y支出千元0.71.01.21.01.31.51.31.72.02.5(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程。思路点拨:利用散点图观察收入x和支出y是否线性相关,若呈现线性相关关系,可利用公式来求出回归系数,然后获得回归直线方程。【当堂检测】1山东鲁洁棉业公式的可按人员在7块并排形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg)施化肥量x15202530354045产量y330345365405445450455(1)画出散点图;(2)判断是否具有相关关系1在对两个变量x、y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(,),1,2,,iixyin;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图。如果根据可靠性要求能够作出变量x、y具有线性相关结论,则在下列操作顺序中正确的是()A①②⑤③④B③②④⑤①C②④③①⑤D②⑤④③①2三点(3,10),(7,20),(11,24)的线性回归方程为()A1.755.75yxB1.755.75yxC1.755.75yxD1.755.75yx3对有线性相关关系的两个变量建立的回归直线方程yabx中,回归系数b()A.可以大于0B大于0C能等于0D只能小于04废品率00x和每吨生铁成本y(元)之间的回归直线方程为2562yx,表明()A废品率每增加001,生铁成本增加258元;B废品率每增加001,生铁成本增加2元;C废品率每增加001,生铁成本每吨增加2元;D废品率不变,生铁成本增加256元;