2015-2016高中数学11回归分析的基本思想及其初步应用练习新人教A版选修1-2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

11.1回归分析的基本思想及其初步应用基础梳理1.相关关系是一种非确定性关系,回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,函数关系是一种确定性关系.2.在线性回归模型y=bx+a+e中,最小二乘法估计a^和b^就是未知参数a和b的最好估计,其计算公式如下:b^=,a^=,其中,x-=1ni=1nxi,y-=1ni=1nyi.另外,称为样本点的中心,回归直线一定过样本点中心.3.衡量模型拟合效果.(1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为ei=yi-bxi-a,i=1,2,3,…,n,其估计值为e^i=yi-y^i=yi-b^xi-a^,i=1,2,…,n,e^i称为相应于点(xi,yi)的残差.(2)残差图:我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号、身高数据或体重估计值等,这样作出的图形称为残差图.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高.(3)残差分析:可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果.(4)相关指数:计算公式是R2=.其中残差平方和为总偏差平方和为R2的值越大说明残差平方和越小,也就是说模型的拟合效果越好,R2的值表示解释变量对预报变量变化的贡献率,R2的值越接近于1,表示回归的效果越好.,基础自测1.下列结论正确的是(C)2①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④解析:根据函数关系、相关关系、回归分析的概念可知选C.2.下列有关回归直线方程y^=b^x+a^的叙述:①反映y^与x之间的函数关系;②反映y与x之间的函数关系;③表示y^与x之间不确定关系;④表示最接近y与x之间真实关系的一条直线.其中正确的是(D)A.①②B.②③C.③④D.①④解析:y^=bx+a^表示y^与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系.故选D.3.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是(C)A.0.01B.0.02C.0.03D.0.04解析:(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.故选C.4.有下列数据:x123y35.9912.01下列四个函数中,模拟效果最好的为(A)A.y=3×2x-1B.y=log2xC.y=3xD.y=x2解析:当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,知A模拟效果最好.故选A.(一)重点通过实际操作进一步理解建立两相关变量的线性回归模型的思想,求线性回归方程,判3断回归模型拟合的好坏.(二)难点残差变量的解释与分析及指标R2的理解.(三)知识结构图(四)思维总结(1)求回归直线方程的一般方法.①作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,从而判断两个变量是否线性相关.②求回归系数a^,b^,其中称为残差平方和,残差平方和在一定程度上反映了所选回归模型的拟合效果.残差平方和越小,说明模型的拟合效果越好;残差平方和越大,说明拟合效果越差.③通过残差分析判断模型拟合效果:先计算出残差e^i=yi-y^i=yi-b^xi-a^,i=1,2,…,n,然后横坐标选取为样本编号、解释变量或预报变量,纵坐标为残差,作出残差图.通过图形分析,如果样本点的残差较大,就要分析样本数据的采集是否有错误;另一方面,可以通过残差点分布的水平带状区域的宽窄说明模型拟合效果,反映回归方程的预报精度.带状4区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高.(3)相关指数R2.①相关指数的计算公式是R2=其中为残差平方和.相关指数用来刻画回归模型拟合的效果,R2的值越大,说明模型的拟合效果越好;R2的值越小,说明拟合效果越差.②如果某组样本数据可以采取几种不同的回归模型进行回归分析,则可以通过比较R2的值来作出选择,即选择R2值大的模型作为这组数据的回归模型.③在线性回归模型中R2是刻画回归效果的量,即表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系.R2表示解释变量对预报变量变化的贡献率.1.建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.2.分析两个变量相关关系的常用方法有:(1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.(2)利用相关指数R2进行判断.3.对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.对于非线性回归问题,可以转化为线性回归问题去解决.51.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(B)A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R22.下列说法正确的有(C)①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的使用范围;④回归方程得到的预报值是预报变量的精确值.A.①②B.①③C.②③D.③④解析:①回归方程只适用于我们研究的样本和总体.②我们所建立的回归方程一般都有时间性.③样本取值的范围会影响回归方程的适用范围.④回归方程得到的预报值是预报变量的可能取值的平均值,并非准确值,故②③正确.3.已知回归直线方程中斜率的估计值为1.23,样本点的中心(4,5),则回归直线方程为(A)A.y^=1.23x+0.08B.y^=0.08x+1.23C.y^=1.23x+4D.y^=1.23x+5解析:回归直线方程过样本点的中心,把点(4,5)代入A项成立.4.某调查者从调查中获知某公司近年来科研费用支出(xi)万元与公司所获得利润(yi)万元的统计资料如下表:序号科研费用支出xi利润yixiyix2i1531155252114044012134301201645341702553257596220404合计301801000200则利润(yi)对科研费用支出(xi)的线性回归方程为________.解析:把表中数据代入公式求解得线性回归方程为y^=2x+20.61.一项研究要确定是否能够根据施肥量预测作物的产量,这里的解释变量是(B)A.作物的产量B.施肥量C.试验者D.降雨量或其他解释产量的变量解析:作物的产量为预报变量,故施肥量为解释变量.2.对两个变量x和y进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是(C)A.由样本数据得到的回归方程y^=b^x+a^必过样本点的中心(x-,y-)B.残差平方和越小的模型,拟合的效果越好C.用R2来刻画回归效果,R2的值越小,说明模型拟合的效果越好D.在研究身高和体重关系时,求得R2=0.64,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%,”所以身高对体重的效应比随机误差的效应大解析:R2的值越大,说明残差平方和越小,也就是说模型的拟合程度效果越好.3.下表是某工厂6~9月份电量(单位:万度)的一组数据:月份x6789用电量y6532由散点图可知,用电量y与月份x间有较好的线性相关关系,其线性回归直线方程是y^=-1.4x+a,则a等于(D)A.10.5B.5.25C.5.2D.14.5解析:由题知x-=7.5,y-=4,代入方程解得a=14.5,故选D.4.已知回归直线方程中斜率的估计值为5.43,样本点的中心(1,2),则回归直线在y轴上截距为(A)A.-3,43B.3,43C.1D.2解析:回归直线方程过样本点的中心,把点(1,2)代入求得y轴上截距为-3.43.5.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y^=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(A)7A.83%B.72%C.67%D.66%解析:将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.6.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小乘法得到的线性回归直线(如右图),以下结论正确的是(A)A.直线l过点(x-,y-)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同7.下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系,其中有相关关系的是________.(填序号)答案:①③④8.若施肥量x与水稻产量y的回归直线方程为y^=5x+250,当施肥量为80kg时,预报水稻产量为________.解析:当x=80kg时,y^=5×80+250=650kg.答案:650kg9.已知方程y^=0.85x-82.71是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,y^的单位是kg,那么针对某个体(160,53)的残差是________.解析:将x=160代入y^=0.85x-82.71,得y^=0.85×160-82.71=53.29,所以残差e^=y-y^=53-53.29=-0.29.答案:-0.2910.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.8x3456y2.5344.5(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解析:(1)所求散点图如下图所示:(2)i=14xiyi=3×2.5+4×3+5×4+6×4.5=66.5,x-=3+4+5+64=4.5,y-=2.5+3+4+4.54=3.5,故所求线性回归方程为y^=0.7x+0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能减少了90-70.35=19.65吨标准煤.►品味高考1.(2013·湖北卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求9得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.347x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确的结论的序号是(D)A.①②B.②③C.③④D.①④解析:由回归直线方程y^=b^x+a^,知当b^>0

1 / 10
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功