第14章思考与练习

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

习题答案网第十四章直线回归分析【思考与习题】一、思考题1.试述建立直线回归方程的步骤以及散点图的作用。2.如何将方差分析运用于回归系数的假设检验?简述其思想。3.简述直线相关和直线回归的区别与联系。4.对回归系数进行假设检验可以采用哪些方法?二、案例辨析题某研究采用火箭电泳法对已知浓度的标准血清进行测量,其免疫球蛋白IgA浓度(μg/ml)和火箭电泳高度(mm)如表14-1所示。研究者据此数据建立直线回归方程,用于测定未知样品血清中的IgA浓度,以上分析正确吗?表14-1标准品的IgA浓度(μg/ml)和火箭电泳高度(mm)采用最小二乘法建立直线回归方程,得到ˆ5.3351.599yx,经假设检验得001.0P,故此回归方程可用于测定未知样品血清中的IgA含量。三、最佳选择题标准品的IgA浓度x火箭电泳高度y0.53.50.53.71.06.41.06.62.010.22.010.34.013.14.013.36.016.26.016.410.019.410.020.1习题答案网对于一组服从双变量正态分布的资料,经直线相关分析得相关系数0r,若对该资料拟合回归直线,其回归系数A.0bB.0bC.0bD.11bE.1b2.一组服从双变量正态分布的资料,经直线相关分析得相关系数1r,则有A.SS残总SSB.SSSS残回C.SSSS总回D.回残MSMSE.回总MSMS3.直线回归中x与y的标准差相等时,则有A.baB.brC.1bD.1rE.1a4.若直线回归系数0b,则一定有A.截距等于0B.截距等于yC.SS残等于0D.SS总等于0E.SS残等于SS回5.两组服从双变量正态分布的资料,若两样本12bb,12nn,则有A.12rrB.12bbtt习题答案网.12rrD.11brttE.12rrtt6.最小二乘法的原理是各观测点A.距回归直线的纵向距离相等B.距回归直线的纵向距离平方和最小C.距回归直线的垂直距离相等D.距回归直线的垂直距离平方和最小E.距回归直线的纵向距离最小7.直线回归分析中,按直线方程ˆ0.0040.0588yx,代入两点绘制回归直线,以下选项中正确的是A.所有实测点都应在回归直线上B.所绘回归直线必过点(,)xyC.回归直线必过原点D.x的取值范围为[1,1]E.实测值与估计值之差的平方和必小于零8.同一资料进行直线回归与直线相关分析时,下列说法正确的是A.0时,则0rB.||0r时,则0bC.0r时,则0bD.0r时,则0bE.||1b四、综合分析题1.为了研究女大学生胸围(cm)与肺活量(L)的关系,随机抽取某高校一年级女生15名,测量其胸围与肺活量数据如表14-2所示。表14-215名一年级女大学生的胸围(cm)与肺活量(L)学生编号胸围x肺活量y176.502.51习题答案网(1)建立肺活量y与胸围x的回归方程;(2)用两种方法对回归系数进行假设检验;(3)计算总体回归系数的95%置信区间;2.为研究肺癌患者肺组织中的DNA加合物含量(个/108核苷酸)与吸烟的关系,某研究者用“同位素标记法”测定了12名肺癌患者肺组织中DNA加合物含量(y),并调查其每日吸烟量(x),结果如表14-3所示。表14-3肺组织中DNA加合物含量(个/108核苷酸)与每日吸烟量(支/天)x5510151515202020252530y9.263.176.3414.927.7812.009.7015.6612.4011.4017.2019.34(1)问该资料有无可疑的离群点?(2)试建立直线回归方程来分析肺组织中DNA加合物含量y与每日吸烟量x之间的关系。【习题解析】一、思考题1.建立直线回归方程的步骤:①绘制自变量与应变量的散点图,观察是否有可习题答案网疑的离群值及两变量是否有直线趋势;②利用最小二乘法计算回归系数b及截距a,得到样本回归方程;③对回归系数进行假设检验。在此过程中应当注意考察资料是否满足模型假设条件,即应变量与自变量关系是否为线性、误差是否服从正态分布且方差相等、各观测值是否独立等。通过散点图可以初步考察两变量间是否有直线关系及识别可能的离群值。2.方差分析的基本思想是将总的变异按照设计和需要分解成2个或2个以上的部分,在对回归系数的假设检验中,将应变量y的变异总SS分解为可以用y与x的直线关系解释的部分回SS和不能用y与x的线性关系解释的部分残SS,如果两变量间直线关系确实存在,回归的均方应大于误差的均方,大到何种程度时可以认为具有统计学意义,可根据回SS与残SS的关系构造检验统计量F,//MSSSFMSSS回回回残残残。在0成立的假设下,F服从自由度为回、残的F分布,可根据F分布曲线下面积确定P值,作出统计推断结论。3.区别:①资料要求上:直线相关要求x、y服从双变量正态分布;而直线回归要求y在给定某个x值时服从正态分布,x须为可精确测量和严格控制的值。②应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明应变量y和自变量x在数量上的依存关系则用直线回归分析。③意义上:相关系数r说明两变量直线相关的方向与密切程度;回归系数b表示x每改变一个单位时,y的平均改变量。④计算:/xyxxyyrlll,xxxyllb/。⑤取值范围:11r,b。⑥r没有单位,b有单位。联系:①对于服从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,计算出的r与b符号一致。②对于同一样本,相关系数与回归系数的假设检验等价。③对于服从双变量正态分布的同一组资料,其相关系数r和回归系数b可以相互换算:xybSrS=。④用回归可以解释相关,决定系数总回SSSSR2。4.有以下方法:方差分析、总体回归系数的t检验、计算总体回归系数的置信区间。若资料服从双变量正态分布,除上述方法外,因为相关系数与回归系数的假设检验等价,还可采用总体相关系数的t检验、计算总体相关系数的置信区间等方法来推断总体回归关系是否成立。习题答案网二、案例辨析题要进行直线回归分析,首先应绘制自变量与应变量的散点图,观察两变量是否有直线趋势。如图14-1所示,两变量散点呈曲线趋势,不宜进行直线回归分析。108642021181512963图14-1火箭电泳高度与IgA浓度的关系因此直接用原始数据建立直线回归方程得到ˆ5.3351.599yx不正确。对自变量进行对数变换,令lg()xx,再观察y与x的散点图,如图14-2所示,可见对数转换后其直线趋势较为明显。1.00.80.60.40.20.0-0.2-0.421181512963图14-2火箭电泳高度与IgA浓度对数值的关系建立y与x的直线回归方程得到ˆ6.73712.259yx,对回归系数进行假设火箭电泳高度(mm)IgA浓度(μg/ml)火箭电泳高度(mm)IgA浓度的对数值习题答案网检验,得001.0P,回归方程有统计学意义。进一步检查两次回归的决定系数,直接以IgA浓度为自变量时2R=0.911,而以IgA浓度的对数值为自变量时2R=0.989,拟合效果更好。此案例强调了直线回归分析之前绘制散点图的重要性。三、最佳选择题1.A2.C3.B4.B5.D6.B7.B8.D四、综合分析题1.解:(1)建立肺活量y与胸围x的回归方程1)作两变量的散点图,以胸围为横坐标,肺活量为纵坐标绘制散点图(见SPSS结果),散点呈直线趋势,故可进行直线回归分析。2)由样本数据计算如下统计量81.18667x,2.78133y22()/289.73737xxlxxn22()/3.02857yylyyn()/26.62227xylxyxyn3)计算回归系数b及截距a0.09188xyxxlbl,4.67810aybx=-=-4)得直线回归方程为:ˆ4.678100.09188yx(2)对回归系数进行假设检验方法一:采用方差分析对回归系数进行假设检验1)建立检验假设,确定检验水准0H:0,即胸围与肺活量之间无直线回归关系1H:0,即胸围与肺活量之间有直线回归关系=0.052)计算检验统计量习题答案网()3.02857yySSyyl总2ˆ()0.58241SSyy残3.028570.582412.44616SSSSSS回总残/2.44616/154.601/0.58241/13MSSSFMSSS回回回残残残3)确定P值,作出统计推断11回,2213n残,查F界值表(附表4),12(,)0.01(1,13)9.07FF,得0.01P,按=0.05水准拒绝0H,回归方程有统计学意义,可以认为女大学生的胸围与肺活量之间有直线回归关系。方法二:采用t检验对回归系数进行假设检验1)建立检验假设,确定检验水准0H:0,即胸围与肺活量之间无直线回归关系1H:0,即胸围与肺活量之间有直线回归关系=0.052)计算检验统计量0.582410.211662152yxSSSn残0.211660.012435289.73737yxbxxSSl0.091887.3890.012435bbbtS3)确定P值,作出统计推断13,查t界值表(附表3),得0.001P,按=0.05水准拒绝0H,回归方程有统计学意义,可认为女大学生的胸围与肺活量之间有直线回归关系。(3)计算总体回归系数的95%置信区间由以上计算结果可知0.09188b,0.012435bS,13,查t界值表得0.05/2,132.160t。回归系数的95%置信区间为:0.091882.1600.012435,0.091882.1600.012435)(0.06502,0.11875)。习题答案网操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的胸围x、肺活量y,再点击DataView标签,录入数据(见图14-3,图14-4)。图14-3VariableView窗口内定义要输入的变量图14-4DataView窗口内录入数据分析:绘制散点图:Graphs→Scatter/Dot…→SimpleScatterDefineyAxis框:yxAxis框:xOK回归分析:Analyze→Regression→Linear…Dependent框:yIndependent(s)框:xStatistics→RegressionCoefficients习题答案网

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功