3.11研究货运总量y(万吨)与工业总产值1x(亿元)、农业总产值2x(亿元)、居民非商品支出3x(亿元)的关系。数据如表3-9所示。(1)计算出y,1x,2x,3x的相关系数矩阵。所以y,1x,2x,3x的相关系数矩阵为:1547.0398.0724.0547.01113.0731.0398.0113.01556.0724.0731.0556.01(2)求y关于1x,2x,3x的三元线性回归方程。由系数表可以知道,y关于1x,2x,3x的三元线性回归方程为:280.348447.12101.7574.3321xxxy编号12345678910货运总量y(万吨)160260210265240220275160275250工业总产值x1(亿元)70756574726878667065农业总产值x2(亿元)35404042384542364442居民非商品支出x3(亿元)1.02.42.03.01.21.54.02.03.23.0(3)对所求得的方程作拟合优度检验。由模型汇总可知,样本的决定系数为0.806,所以可以认为回归方程为样本观测值的拟合程度较好,即回归方程的显著性较高。(4)对回归方程作显著性检验。对方差分析表可以知道p值为0.0150.05说明自变量1x,2x,3x对因变量y产生的线性影响较显著。而F=8.28374.405.0F时,就拒绝原假设,认为在显著性水平0.05下,y与1x,2x,3x有显著的线性关系,即回归方程是显著的。(5)对每一个回归系数作显著性检验。由系数表可以知道,1x,2x的P值分别为0.1和0.049说明回归系数较显著,3x的P值为0.2840.05说明3x的回归系数不显著,应该予以剔除。(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,作回归方程的显著性检验和回归系数的显著性检验。由系数表可以知道,重新建立的回归方程:624.459971.8676.4211xxy由方差分析表可知,P值为0.07说明自变量1x,2x对因变量y产生的线性影响较显著。由系数表可知,此时各个回归系数的P值均很小,说明回归系数的显著性较高。(7)求出每一个回归系数的置信水平为95%的置信区间。由上表可知,1x的系数的95%的置信区间为(0.381,8.970)2x的系数的95%的置信区间为(3.134,14.808)(8)求标准化回归方程。由系数表可知,标准化后的回归方程为62110*441.6676.0479.0xxy(9)求当01x=75,02x=42,03x=3.1时的0ˆy,给定置信水平为95%,用SPSS软件计算精确置信区间,手工计算近似预测区间。由上表可知,0ˆy=267.80y的置信水平为95%的置信区间为(260.05895,334.12038)0yE的置信水平为95%的近似区间估计为(241.63377,298.54556)(10)结合回归方程对问题作一些基本分析。对于前面的分析,虽然R方的值蛮大的,但这并不能说明回归方程显著,此时还需要通过对回归方程以及回归方程系数进行检验。当一个回归方程通过显著性检验之后,并不能说明这个方程中所以自变量都对因变量y有显著影响,因此还需对回归系数进行检验。