课下能力提升(一)[学业水平达标练]题组1线性回归分析1.关于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的也可以是负的C.在回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)2.为了研究变量x和y的线性相关性,甲、乙两人分别利用线性回归方法得到回归直线l1和l2,已知两人计算过程中x,y分别相同,则下列说法正确的是()A.l1与l2一定平行B.l1与l2重合C.l1与l2相交于点(x,y)D.无法判断l1和l2是否相交3.若某地财政收入x与支出y满足回归方程y^=b^x+a^+ei(单位:亿元)(i=1,2,…),其中b^=0.8,a^=2,|ei|0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.10亿元B.9亿元C.10.5亿元D.9.5亿元4.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如下表:甲乙丙丁R20.980.780.500.85哪位同学建立的回归模型拟合效果最好?()A.甲B.乙C.丙D.丁5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y^=b^x+a^,其中b^=-20,a^=y--b^x-;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)题组2残差分析6.关于残差图的描述错误的是()A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或预报变量C.残差点分布的带状区域的宽度越窄相关指数越小D.残差点分布的带状区域的宽度越窄残差平方和越小7.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是()解析:选A用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.8.在回归分析中,相关指数R2的值越大,说明残差平方和()A.越大B.越小C.可能大也可能小D.以上均错9.通过下面的残差图,我们发现在采集样本点的过程中,样本点数据不准确的为()A.第四个B.第五个C.第六个D.第七个10.在一段时间内,某淘宝网店一种商品的销售价格x元和日销售量y件之间的一组数据为:价格x元2220181614日销售量y件3741435056求出y关于x的回归方程,并说明该方程拟合效果的好坏.参考数据:i=15xiyi=3992,i=15x2i=1660.[能力提升综合练]1.如图所示是四个残差图,其中回归模型的拟合效果最好的是()2.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元3.某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:度)之间有下列数据:x-2-1012y54221甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①y^=-x+2.8,②y^=-x+3,③y^=-1.2x+2.6;其中正确的是()A.①B.②C.③D.①③4.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是()A.b^b′,a^a′B.b^b′,a^a′C.b^b′,a^a′D.b^b′,a^a′5.某种商品的广告费支出x与销售额y之间有如下关系:(单位:万元)x24568y3040605070y与x的线性回归方程为y^=6.5x+17.5,当广告费支出5万元时,残差为________.6.在研究气温和热茶销售杯数的关系时,若求得相关指数R2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=110xi=80,i=110yi=20,i=110xiyi=184,i=110x2i=720.(1)求家庭的月储蓄y关于月收入x的线性回归方程y^=b^x+a^;(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.答案[学业水平达标练]题组1线性回归分析1.解析:选D样本的相关系数应满足-1≤r≤1.2.解析:选C回归直线一定过样本点的中心(x,y),故C正确.3.解析:选Cy^=0.8×10+2+ei=10+ei,∵|ei|0.5,∴9.5<y^10.5.4.解析:选A相关指数R2越大,表示回归模型的拟合效果越好.5.解:(1)由于x=16(8+8.2+8.4+8.6+8.8+9)=8.5,y=16(90+84+83+80+75+68)=80.所以a^=y-b^x=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20x-3342+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.题组2残差分析6.解析:选C残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,相关指数R2的值越大,故描述错误的是选项C.7.解析:选A用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.8.解析:选B因为R2=1-i=1nyi-y^i2i=1nyi-y2,所以当R2越大时,i=1n(yi-y^i)2越小,即残差平方和越小.9.解析:选C由题图可知第六个数据的偏差最大,故选C.10.解:作出散点图(此处略),观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.因为x=22+20+18+16+145=18,y=37+41+43+50+565=45.4.所以b^=3992-5×18×45.41660-5×182=-2.35,a^=45.4-(-2.35)×18=87.7.所以回归方程为y^=-2.35x+87.7.yi-y^i与yi-y-的值如下表:yi-y^i10.3-2.4-0.11.2yi-y-8.4-4.4-2.44.610.6计算得i=15(yi-y^i)2=8.3,i=15(yi-y-)2=229.2,所以R2=1-8.3229.2≈0.964.因为0.964很接近于1,所以该模型的拟合效果比较好.[能力提升综合练]1.解析:选B选项A与B中的残差图都是水平带状分布,并且选项B的残差图散点分布集中,在更狭窄的范围内,所以B中回归模型的拟合效果最好,选B.2.解析:选B样本点的中心是(3.5,42),则a^=y--b^x-=42-9.4×3.5=9.1,所以回归直线方程是y^=9.4x+9.1,把x=6代入得y^=65.5.3.解析:选A回归方程y^=b^x+a^表示的直线必过点(x,y),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①,故选A.4.解析:选C过(1,0)和(2,2)的直线方程为y′=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然,b′b^,a^a′,故选C.5.解析:当广告费x=5时,y^=6.5×5+17.5=50,残差为60-50=10.答案:106.解析:由相关指数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.答案:85%15%7.解:(1)由题意知n=10,x=1ni=110xi=110×80=8,y=1ni=110yi=110×20=2,所以b^=i=110xiyi-nx-y-i=110x2i-nx-2=184-10×8×2720-10×82=2480=0.3,a^=y-b^x-=2-0.3×8=-0.4,故所求线性回归方程为y^=0.3x-0.4.(2)将x=7代入回归方程,可以预测家庭的月储蓄约为y^=0.3×7-0.4=1.7(千元).