统计案例线性回归方程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

◆数学•选修2-3•(配人教A版)◆3.1回归分析的基本思想及其初步应用3.1.1线性回归方程统计案例返回◆数学•选修2-3•(配人教A版)◆基础梳理1.回归分析是对具有________的两个变量进行统计分析的一种常用方法.例如:身高与体重有关系可以用______分析的方法来研究.()A.残差B.回归C.二维条形图D.独立检验相关关系B返回◆数学•选修2-3•(配人教A版)◆2.从散点图看,若样本点集中在某一条直线附近,则可用下面的线性回归模型来表示:________________.其中a和b为模型的未知参数,e称为________.把a和b称为未知参数a和b的________,例如:从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:^^^b=x1y1+x2y2+…+xnyn-nx-·y-x21+x22+…+x2n-nx2,^a=y-^bx.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359y=bx+a+e随机误差最好估计返回◆数学•选修2-3•(配人教A版)◆由此建立的身高与体重的回归模型为y=0.849x-85.712,用这个模型预报一名身高为172cm的女大学生的体重,则正确的叙述是()A.体重一定是60.316kgB.体重在60.316kg以上C.体重在60.316kg左右D.体重在60.316kg以下3.相关系数:r=.i=1nxi-xyi-yi=1nxi-x-2i=1nyi-y2C返回◆数学•选修2-3•(配人教A版)◆当r>0时,两个变量________相关;当r<0时,两个变量________相关;相关系数的绝对值越接近于1,两个变量的线性相关关系________,它们的散点图越接近________,这时用线性回归模型拟合这组数据就________.此时建立的线性回归模型是有意义的.4.总偏差平方和、残差平方和、回归平方和、相关指数:名称总偏差平方和残差平方和回归平方和说明所有单个样本值与样本均值差的平方和回归值与样本值差的平方和总偏差平方和-残差平方和公式正负越强一条直线越好i=1n(yi-y)2i=1n(yi-^yi)2i=1n(yi-y)2-i=1n(yi-^yi)2返回◆数学•选修2-3•(配人教A版)◆相关指数:____________________,R2的值越大,说明____________越小,模型的拟合效果________.例如:在两个变量y与x的回归模型中,分别选择了甲、乙两个不同的模型,它们的相关指数R2如下:R2甲=1-i=1nyi-^yi2i=1nyi-y2=0.845,R2乙=1-i=1nyi-^yi2i=1nyi-y2=0.82,R2=1-i=1nyi-^yi2i=1nyi-y2则________模型拟合的效果更好.越好残差平方和甲返回◆数学•选修2-3•(配人教A版)◆自测自评1.下列变量是相关关系的是()A.人的身高与视力B.角的大小与所对的圆弧长C.收入水平与消费水平D.人的年龄与身高2.若线性回归方程中的回归系数b=0,则相关系数为________.^D0返回◆数学•选修2-3•(配人教A版)◆3.(2011年长沙一中月考)在对两个变量x、y进行线性回归分析时一般有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可靠性要求能够判定变量x,y具有线性相关性,则在下列操作顺序中正确的是()A.①②⑤③④B.③②④⑤①C.②④③①⑤D.②⑤④③①D返回◆数学•选修2-3•(配人教A版)◆4.(2012年江门一模)有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如下表:根据以上数据,用线性回归的方法,求得销售额y与平均气温x之间线性回归方程y=x+的系数=-2.4.则预测平均气温为-8℃时该商品销售额为()A.34.6万元B.35.6万元C.36.6万元D.37.6万元平均气温/℃-2-3-5-6销售额/万元20232730ˆaˆbˆb返回◆数学•选修2-3•(配人教A版)◆解析:x=-164=-4,y=1004=25,由题意知,y^=-2.4x+a^过(-4,25),25=-2.4×(-4)+a^,得a^=25-9.6=15.4.所以y^=-2.4x+15.4.当x=-8时,y=19.2+15.4=34.6,故选A.答案:A返回◆数学•选修2-3•(配人教A版)◆线性回归分析研究某灌溉渠道水的流速y与水深x之间的关系,测得一组数据如下:(1)求y对x的回归直线方程;(2)预测水深为1.95m时水的流速是多少?水深x/m1.401.501.601.701.801.902.002.10流速y/(m·s-1)1.701.791.881.952.032.102.162.21返回◆数学•选修2-3•(配人教A版)◆分析:从散点图可以直观地看出变量x与y之间有无线性相关关系,为此把这8对数据描绘在平面直角坐标系中,得到平面上8个点,如下图所示.解析:数据列表如下:由图容易看出,x与y之间有线性相关关系.故可用线性回归模型解决.序号xyx2xy11.401.701.962.380返回◆数学•选修2-3•(配人教A版)◆21.501.792.252.68531.601.882.563.00841.701.952.893.31551.802.033.243.65461.902.103.613.99072.002.164.004.32082.102.214.414.641∑14.0015.8224.9227.993于是,x=18×14.00=1.75,y=18×15.82=1.9775.返回◆数学•选修2-3•(配人教A版)◆y对x的回归直线方程为y=0.694+0.733x.回归系数b=0.733的含义是,在此灌溉渠道中,水深每增加0.1m,水的流速平均增加0.733m/s,a=0.694可以解释为水的流速中不受水深影响的部分.(2)由(1)中求出的回归直线方程,把x=1.95代入,易得y=0.694+0.733×1.95≈2.12(m/s).计算结果表明,当水深为1.95m时可以预测渠水的流速约为2.12m/s.^b=27.993-8×1.75×1.977524.92-8×1.752=1115≈0.733.^a=1.9775-1115×1.75≈0.694.^^^^返回◆数学•选修2-3•(配人教A版)◆跟踪练习1.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为:12345价格x1.41.61.822.2需求量y1210753已知∑5i=1xiyi=62,∑5i=1x2i=16.6.(1)画出散点图;(2)求出y对x的回归方程;(3)如价格定为1.9万元,预测需求量大约是多少?(精确到0.01t)返回◆数学•选修2-3•(配人教A版)◆解析:(1)散点图如右图所示:(2)因为x=15×9=1.8,y=15×37=7.4,∑5i=1xiyi=62,∑5i=1x2i=16.6,所以b^=∑5i=1xiyi-5xy∑5i=1x2i-5x2=62-5×1.8×7.416.6-5×1.82=-11.5,a^=y-b^x=7.4+11.5×1.8=28.1.故y对x的回归方程为y^=28.1-11.5x.(3)y^=28.1-11.5×1.9=6.25(t).返回◆数学•选修2-3•(配人教A版)◆残差分析假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归方程,并对于基本苗数56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几.x15.025.830.036.644.4y39.442.942.943.149.2返回◆数学•选修2-3•(配人教A版)◆解析:(1)散点图如下:(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.设回归方程为y^=b^x+a^,x=30.36,y=43.5,∑5i=1x2i=5101.56,∑5i=1y2i=9511.43.x·y=1320.66,y2=1892.25,x2=921.7296,∑5i=1xiyi=6746.76.由b^=∑5i=1xiyi-5xy∑5i=1x2i-5x2≈0.29,a^=y-b^x≈34.67,返回◆数学•选修2-3•(配人教A版)◆故所求的回归直线方程为y^=34.67+0.29x.当x=56.7时,y^=34.67+0.29×56.7=51.113.估计成熟期有效穗为51.113.(3)由于y=bx+a+e,可以算出ei^=yi-yi^,分别为e^1=0.38,e^2=0.748,e^3=-0.47,e^4=-2.184,e^5=1.654.残差平方和:∑5i=1e^2i≈8.43.(4)∑5i=1(yi-y)2=50.18,∴R2=1-8.4350.18≈0.832.所以解释变量小麦基本苗数对总效应约贡献了83.2%.残差变量贡献了约1-83.2%=16.8%.返回◆数学•选修2-3•(配人教A版)◆跟踪练习2.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:(1)求回归方程;(2)判断(1)中所得回归模型拟合效果如何.编号12345678910零件数x/个102030405060708090100加工时间y/分626875818995102108115122返回◆数学•选修2-3•(配人教A版)◆解析:(1)根据表中数据作出散点图,从而可以判断出用线性回归模型来拟合数据.计算得加工时间对零件数的线性回归方程为y=0.668x+54.93.残差数据如下表:^编号12345残差e0.39-0.290.03-0.650.67编号678910残差e-0.010.31-0.37-0.050.27^^返回◆数学•选修2-3•(配人教A版)◆(2)以零件数为横坐标,残差为纵坐标作出残差图如图所示:由图可知,残差点分布较均匀,即用上述回归模型拟合数据效果很好.但需注意,由残差图也可以看出,第4个样本点和第5个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.返回◆数学•选修2-3•(配人教A版)◆非线性回归分析某地区不同身高的未成年男性的体重平均值如下表:试建立y与x之间的回归方程.身高x/cm60708090100110体重y/kg6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05返回◆数学•选修2-3•(配人教A版)◆由图看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令z=lny.解析:根据上表中的数据画出散点图如右图所示:x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.043.293.443.663.864.01返回◆数学•选修2-3•(配人教A版)◆画出散点图如下图所示.由表中数据可得z与x之间的回归直线方程:z=0.693+0.020x,则有y=e0.693+0.020x.^^返回◆数学•选修2-3•(配人教A版)◆跟踪练习3.若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,由例3中求出的回归方程,那么这个地区一名身高为175cm,体重为82kg的在校男生体重是否正常?解析:当x=175时,预测平均体重y=e0.693+0.020×175≈66.22,由于66.22×1.2≈79.4682,所以这个男生偏胖.^返回◆数学•选修2

1 / 47
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功