线性回归的显著性检验1.回归方程的显著性在实际问题的研究中,我们事先并不能断定随机变量y与变量pxxx,,,21之间确有线性关系,在进行回归参数的估计之前,我们用多元线性回归方程去拟合随机变量y与变量pxxx,,,21之间的关系,只是根据一些定性分析所作的一种假设。因此,和一元线性回归方程的显著性检验类似,在求出线性回归方程后,还需对回归方程进行显著性检验。设随机变量Y与多个普通变量pxxx,,,21的线性回归模型为ppxbxbbY110其中服从正态分布),0(2N对多元线性回归方程的显著性检验就是看自变量若接受pxxx,,,21从整体上对随机变量y是否有明显的影响。为此提出原假设0,,0,0:210pbbbH如果0H被接受,则表明随机变量y与pxxx,,,21的线性回归模型就没有意义。通过总离差平方和分解方法,可以构造对0H进行检验的统计量。正态随机变量nyyy,,,21的偏差平方和可以分解为:niiiniininiiiiiyyyyyyyyyy12121122)ˆ()ˆ()ˆˆ()(niiTyyS12)(为总的偏差平方和,niiRyyS12)ˆ(为回归平方和,niiiEyyS12)ˆ(为残差平方和。因此,平方和分解式可以简写为:ERTSSS回归平方和与残差平方和分别反映了0b所引起的差异和随机误差的影响。构造F检验统计量则利用分解定理得到:)1(pnQpQFER在正态假设下,当原假设0,,0,0:210pbbbH成立时,F服从自由度为)1,(pnp的F分布。对于给定的显著水平,当F大于临界值)1,(pnp时,拒绝0H,说明回归方程显著,yx与有显著的线性关系。实际应用中,我们还可以用复相关系数来检验回归方程的显著性。复相关系数R定义为:TRSSR平方和分解式可以知道,复相关系数的取值范围为10R。R越接近1表明ES越小,回归方程拟合越好。2.回归系数的显著性若方程通过显著性检验,仅说明pbbbb,,,210不全为零,并不意味着每个自变量对y的影响都显著,所以就需要我们对每个自变量进行显著性检验。若某个系数0jb,则jx对y影响不显著,因此我们总想从回归方程中剔除这些次要的,无关的变量。检验ix是否显著,等于假设pjbHjj,,2,1,0:0已知])(,[~ˆ12XXBNB,pjicXXij,,2,1,0,)(1)(记,可知],[~ˆ2ijjjcbNb,,,2,1,0pj据此可构造t统计量jjjjcbtˆ其中回归标准差为niiiniiyypnepn1212)ˆ(1111当原假设0:0jjbH成立时,则jt统计量服从自由度为1pn的t分布,给定显著性水平,当2ttj时拒绝原假设0:0jjbH,认为jx对y影响显著,当2ttj时,接受原假设0:0jjbH,认为jx对y影响不显著。