7.6一家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做定量分析,以便找出控制不良贷款的方法。表7-5是该银行所属25家分行2002年的有关业务数据。(1)计算y与其余4个变量的简单相关系数。由系数表可知,y与其余4个变量的简单相关系数分别为0.844,0.732,0.700,0.519.(2)建立不良贷款对4个自变量的线性回归方程,所得的回归系数是否合理?由上表可知,回归方程为为:022.1029.0015.0148.04.0ˆ4321xxxxy从上表可看出,方程的自变量2x、3x、4x未通过t检验,说明回归方程不显著,而且由实际意义出发,4x的系数不能是负的,所以所得的回归系数不合理。(3)分析回归模型的共线性。由上表可知,所有自变量对应的VIF全部小于10,所以自变量之间不存在共线性。但进行特征根检验见下表:由这个表可以看出来,第5行中1x、3x的系数分别为0.87和0.63,可以说明这两个变量之间有共线性。(4)采用后退法和逐步回归法选择变量,所得的回归系数是否合理?是否还存在共线性?采用后退法(见上表),所得回归方程为972.0029.0149.0041.0yˆ421xxx采用逐步回归法(见上表),所得回归方程为443.0032.005.0ˆ41xxy所得4x的系数不合理(为负),说明存在共线性.(5)建立不良贷款y对4个变量的岭回归。由软件输出的岭迹图可以看出,变量4x的岭回归系数从负值变为正值。其他的变量都很稳定。说明4x变量与其他变量存在多重共线性,所以剔除4x.(6)对(4)剔除变量后的回归方程再做岭回归.0.200000.150000.100000.050000.000000.6000000.4000000.2000000.000000x3Kx2Kx1KKRIDGETRACE剔除之后岭回归系数变化幅度减小很多,并且有上面的图可以看出k值,基本稳定。(7)某研究人员希望做y对各项贷款余额、本年累计应收贷款、贷款项目个数这3个自变量的回归方程,你认为这样做可行吗?如果可行应怎么做?由(6)可知,y对1x、2x、3x的岭回归稳定,所以作y对1x、2x、3x的岭回归是可行的。