多元线性回归SPSS实验报告

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

回归分析基本分析:将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图输入/移去的变量模型输入的变量移去的变量方法1教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),普通高校数(所),发表科技论文数量(篇),在校学生数(万人)a.输入a.已输入所有请求的变量。模型汇总模型RR方调整R方标准估计的误差1.999a.998.9979.822a.预测变量:(常量),教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),普通高校数(所),发表科技论文数量(篇),在校学生数(万人)。注解:模型的拟合优度检验:第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。第三列:被解释向量(毕业人数)和解释向量的判定系数=0.998。第四列:被解释向量(毕业人数)和解释向量的调整判定系数=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。第五列:回归方程的估计标准误差=9.822Anovab模型平方和df均方FSig.1回归449287.911674881.319776.216.000a残差675.288796.470总计449963.19913a.预测变量:(常量),教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),普通高校数(所),发表科技论文数量(篇),在校学生数(万人)。b.因变量:毕业生数(万人)回归方程的显著性检验-回归分析的方差分析表F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-544.366327.704-1.661.141普通高校数(所).032.047.068.683.516研究与试验发展机构数(个).009.008.1421.086.313发表科技论文数量(篇).001.000.6323.749.007专利申请授权数(件).000.000-.103-1.454.189在校学生数(万人)-.100.301-.296-.333.749教职工总数(万人)3.0464.394.556.693.511a.因变量:毕业生数(万人)注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。第三列:偏回归系数的标准误差。第四列:标准化偏回归系数。第五列:偏回归系数T检验的t统计量。第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。于是,多元线性回归方程为:̂=-544.366+0.032++0.001-0.1+3.046回归分析的进一步分析:1.多重共线性检验系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF(常量)-544.366327.704-1.661.141普通高校数(所).032.047.068.683.516.02245.569研究与试验发展机构数(个).009.008.1421.086.313.01280.022发表科技论文数量(篇).001.000.6323.749.007.008132.540专利申请授权数(件).000.000-.103-1.454.189.04323.189在校学生数(万人)-.100.301-.296-.333.749.0003672.177教职工总数(万人)3.0464.394.556.693.511.0002996.649a.因变量:毕业生数(万人)从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量共线性诊断a模型维数特征值条件索引方差比例(常量)普通高校数(所)研究与试验发展机构数(个)发表科技论文数量(篇)专利申请授权数(件)在校学生数(万人)教职工总数(万人)116.6281.000.00.00.00.00.00.00.002.3524.340.00.00.00.00.04.00.003.01520.902.00.00.00.00.09.00.004.00439.311.00.00.35.00.65.00.005.001107.450.00.96.09.02.15.00.006.000154.065.00.00.08.96.06.01.0075.520E-61095.777.99.04.49.02.00.981.00a.因变量:毕业生数(万人)注解:第二列:特征根第三列:条件指数从条件指数看,第3、4、5、6、7个条件指数都大于10,说明变量之间存在多重共线性。第4-10列:各特征根解释各解释变量的方差比。从方差比看,第5个特征根解释投入普通高校人数96%;发表科技论文数49%;可以认为:这些变量存在多重共线性。需要建立回归方程。2.重建回归方程输入/移去的变量b模型输入的变量移去的变量方法1教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),普通高校数(所),发表科技论文数量(篇),在校学生数(万人)a.输入2.在校学生数(万人)向后(准则:F-to-remove=.100的概率)。3.普通高校数(所)向后(准则:F-to-remove=.100的概率)。4.研究与试验发展机构数(个)向后(准则:F-to-remove=.100的概率)。5.专利申请授权数(件)向后(准则:F-to-remove=.100的概率)。a.已输入所有请求的变量。b.因变量:毕业生数(万人)注解:引入/剔除变量表分别剔除在校学生数(万人),普通高校数(所),研究与试验发展机构数(个),专利申请授权数(件)四个变量模型汇总f模型RR方调整R方标准估计的误差更改统计量Durbin-WatsonR方更改F更改df1df2Sig.F更改1.999a.998.9979.822.998776.21667.0002.999b.998.9989.260.000.11117.7493.999c.998.9988.967.000.44018.5264.999d.998.9979.697.0002.69319.1355.999e.998.9979.774.0001.176110.3041.917a.预测变量:(常量),教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),普通高校数(所),发表科技论文数量(篇),在校学生数(万人)。b.预测变量:(常量),教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),普通高校数(所),发表科技论文数量(篇)。c.预测变量:(常量),教职工总数(万人),专利申请授权数(件),研究与试验发展机构数(个),发表科技论文数量(篇)。d.预测变量:(常量),教职工总数(万人),专利申请授权数(件),发表科技论文数量(篇)。e.预测变量:(常量),教职工总数(万人),发表科技论文数量(篇)。f.因变量:毕业生数(万人)注解:利用向后筛选策略建立回归模型,经过四步完成回归方程的建立,最终模型为第五个模型,依次剔除的变量是在校学生数(万人),普通高校数(所),研究与试验发展机构数(个),专利申请授权数(件)模型五的负相关系数R=0.999。判别系数=0.998.调整判别系数=0.997,若将作用不显著的变量引入方程,则该系数会减少。估计的标准误差=9.774。模型二中偏F检验的概率P值=0.749,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量在校大学生人数的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。模型三中偏F检验的概率P值=0.526,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量普通高校数的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。模型四中偏F检验的概率P值=0.135,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量研究与试验发展机构数(个)的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。模型五中偏F检验的概率P值=0.304,对于显著性水平0.05,接受原假设(剔除变量的偏回归系数与0无显著性差异),认为:剔除的变量专利申请授权数(件)的偏回归系数与0无显著性差异。该变量对被解释变量的线性解释没有显著性贡献,不应保留在回归方程中。最终保留的回归方程的变量有:教职工总数和发表论文数回归方程的DW检验值=1.971,表现残差序列存在正相关。说明该回归方程没有充分说明被解释变量的变化规律,可能方程中遗漏了一些重要的解释变量

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功