第11章多重线性回归分析思考与练习参考答案一、最佳选择题1.逐步回归分析中,若增加自变量的个数,则(D)。A.回归平方和与残差平方和均增大B.回归平方和与残差平方和均减小C.总平方和与回归平方和均增大D.回归平方和增大,残差平方和减小E.总平方和与回归平方和均减小2.下面关于自变量筛选的统计学标准中错误的是(E)。A.残差平方和(残差SS)缩小B.确定系数(2R)增大C.残差的均方(残差MS)缩小D.调整确定系数(2adR)增大E.pC统计量增大3.多重线性回归分析中,能直接反映自变量解释因变量变异百分比的指标为(C)。A.复相关系数B.简单相关系数C.确定系数D.偏回归系数E.偏相关系数4.多重线性回归分析中的共线性是指(E)。A.Y关于各个自变量的回归系数相同B.Y关于各个自变量的回归系数与截距都相同C.Y变量与各个自变量的相关系数相同D.Y与自变量间有较高的复相关E.自变量间有较高的相关性5.多重线性回归分析中,若对某一自变量的值加上一个不为零的常数K,则有(D)。A.截距和该偏回归系数值均不变B.该偏回归系数值为原有偏回归系数值的K倍C.该偏回归系数值会改变,但无规律D.截距改变,但所有偏回归系数值均不改变E.所有偏回归系数值均不会改变二、思考题1.多重线性回归分析的用途有哪些?答:多重线性回归在生物医学研究中有广泛的应用,归纳起来,可以包括以下几个方面:定量地建立一个反应变量与多个解释变量之间的线性关系,筛选危险因素,通过较易测量的变量估计不易测量的变量,通过解释变量预测反应变量,通过反应变量控制解释变量。2.多重线性回归模型中偏回归系数的含义是什么?答:偏回归系数的含义是:在控制其他自变量的水平不变的情况下,该自变量每改变一个单位,反应变量平均改变的单位数。3.请解释用于多重线性回归参数估计的最小二乘法的含义。答:最小二乘法的含义是:残差的平方和达到最小。4.如何判断和处理多重共线性?答:如果自变量之间存在较强的相关,则存在多重共线性。可以通过分析自变量之间的相关系数、计算方差膨胀因子和容忍度等指标判断是否存在多重共线性。如果自变量间存在多重共线性,最简单的处理办法是删除变量,即在相关性较强的变量中删除测量误差大的、缺失数据多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量。其次,也可采用主成分回归方法。5.如何判断、分析自变量间的交互作用?答:基于专业背景知识,构造可能的交互作用项,并检验交互作用项是否有统计学意义。6.多重线性回归模型的基本假定有哪些?如何判断资料是否满足这些假定?如果资料不满足假定条件,常用的处理方法有哪些?答:多重线性回归的前提条件是线性、独立性、正态性和等方差性,可以借助残差分析等方法判断资料是否满足条件。如果资料不满足前提条件,可以采用变量变换和非线性回归等方法处理。三、计算题为确定老年妇女进行体育锻炼还是增加营养会减缓骨骼损伤,一名研究者用光子吸收法测量了骨骼中无机物含量,对三根骨头主侧和非主侧记录了测量值,结果见教材表11-20。分别用两种桡骨测量结果作为反应变量对其他骨骼测量结果作多重线性回归分析,提出并拟合适当的回归模型,分析残差。解:答案提示,需要对自变量进行筛选,而且要考虑是否存在多重共线性,如果存在,应进行适当的处理。教材表11-20骨骼中无机物的含量受试者编号主侧桡骨桡骨主侧肱骨肱骨主侧尺骨尺骨11.1031.0522.1392.2380.8730.87220.8420.8591.8731.7410.5900.74430.9250.8731.8871.8090.7670.71340.8570.7441.7391.5470.7060.67450.7950.8091.7341.7150.5490.65460.7870.7791.5091.4740.7820.57170.9330.8801.6951.6560.7370.80380.7990.8511.7401.7770.6180.68290.9450.8761.8111.7590.8530.777100.9210.9061.9542.0090.8230.765110.7920.8251.6241.6570.6860.668120.8150.7512.2041.8460.6780.546130.7550.7241.5081.4580.6620.595140.8800.8661.7861.8110.8100.819150.9000.8381.9021.6060.7230.677160.7640.7571.7431.7940.5860.541170.7330.7481.8631.8690.6720.752180.9320.8982.0282.0320.8360.805190.8560.7861.3901.3240.5780.610200.8900.9502.1872.0870.7580.718210.6880.5321.6501.3780.5330.482220.9400.8502.3342.2250.7570.731230.4930.6161.0371.2680.5460.615240.8350.7521.5091.4220.6180.664250.9150.9361.9711.8690.8690.868资料来源:《实用多元统计分析》(第4版),RichardA.Johnson&DeanW.Wichern,陆璇译,清华大学出版社。(郝元涛张岩波)