多元统计分析作业一(第三题)

f9900228
1 ℃
2020-03-13

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

课程名称：多元统计回归分析实验项目：边远及少数民族聚居区和会经济发展水平实验类型：验证性学生学号：学生姓名：学生班级：课程教师：实验日期：2016-03-281.实验目的：利用spss软件验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。2.实验内容:现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标，验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。边远及少数民族聚居区社会经济发展水平的指标数据地区人均GDP（元）三产比重（%）人均消费（元）人口增长（%）文盲半文盲（%）内蒙古506831.121418.2315.83广西407634.220409.0113.32贵州234229.8155114.2628.98云南435531.3205912.125.48西藏371643.5155115.957.97宁夏427037.3194713.0825.56新疆622935.4274512.8111.44甘肃345632.8161210.0428.65青海436740.9204714.4842.92资料来源：《中国统计年鉴（1998）》，北京，中国统计出版社，1998。五项指标的全国平均水平为：0(6212.01,32.87,2972,9.5,15.78)μ¢=3.实验步骤及结果:解：（1）先利用SPSS软件检验各变量是否遵从多元正态分布（见输出结果1-1）输出结果1-1正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量DfSig.统计量dfSig.人均GDP.2199.200*.9589.781三产比重.1459.200*.9259.437人均消费.2099.200*.8739.131人口增长.1509.200*.9499.682文盲半文盲.2469.124.8989.242*.这是真实显著水平的下限。a.Lilliefors显著水平修正上表给出了对每一个变量进行正态性检验的结果，因为该例中样本数n=9，所以此处选用Shapiro-Wilk统计量。则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平，由此可以知道，人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布，即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。（2）提出原假设及备选假设00:Hμμ=10:Hμμ¹（3）做出统计判断，最后对统计判断作出具体的解释SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选AnalyzeGeneralLinearModelMultivariate……进入Multivariate对话框，将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框，将分类指标选入FixedFactor(s)框，点击OK运行，则可以得到如下结果（见输出结果1-2）。输出结果1-2主体间因子值标签N分类1.00边远及少数民族聚居区社会经济发展水平92.00全国经济平均发展水平1多变量检验a效应值F假设df误差dfSig.截距Pillai的跟踪.99081.986b5.0004.000.000Wilks的Lambda.01081.986b5.0004.000.000Hotelling的跟踪102.48281.986b5.0004.000.000Roy的最大根102.48281.986b5.0004.000.000分类Pillai的跟踪.8344.029b5.0004.000.101Wilks的Lambda.1664.029b5.0004.000.101Hotelling的跟踪5.0374.029b5.0004.000.101Roy的最大根5.0374.029b5.0004.000.101a.设计:截距+分类b.精确统计量上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表，该表给出了几个统计量。由Sig.值可以看到，无论从哪个统计量来看，两个分类的经济发展水平是无显著差别的。实际上，GLM模型是拟合了下面的模型：01YββXε=++式中Y=(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)X=分类上面多变量检验表实际上是对该线性模型显著性的检验，此处有常数项0是因为不能肯定模型过原点。而模型没有通过显著性检验，意味着分类中的不同取值对Y的取值无显著影响，也就是说，不同分类的经济发展水平是相同的。但是，在实际中，我们往往更希望知道差别主要来自哪些分类，或者不同分类经济发展水平的比较。对此，对GLM模块的选项作如下设置：在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框，在ChangeContrasts框架中打开Contrasts右侧的下拉框并选择Simple，此时下侧的ReferenceCategory被激活，默认是Last被选中，表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较，点击Change按钮，Continue继续，OK进行，得到如下结果（见输出结果1-3）输出结果1-3对比结果（K矩阵）分类简单对比a因变量人均GDP三产比重人均消费人口增长文盲半文盲级别1和级别2对比估算值-2003.2322.274-1006.1112.71212.014假设值00000差分（估计-假设）-2003.2322.274-1006.1112.71212.014标准误差1129.2654.912395.8602.76115.688Sig..114.656.035.355.466差分的95%置信区间下限-4607.321-9.053-1918.967-3.655-24.162上限600.85713.602-93.2569.07948.190a.参考类别=2见输出结果1-3表示（1）在显著性水平0.05?的水平下，可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466，由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别，即全国的平均人均消费大于边远及少数民族聚居区人均消费，相差值为1006.111元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。（2）在显著性水平0.01?的水平下，可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466均大于显著性水平，我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。输出结果1-4多变量检验结果值F假设df误差dfSig.Pillai的跟踪.8344.029a5.0004.000.101Wilks的lambda.1664.029a5.0004.000.101Hotelling的跟踪5.0374.029a5.0004.000.101Roy的最大根5.0374.029a5.0004.000.101a.精确统计量4.实验结果（或心得体会）：通过实验，得出输出结果1-4是上面多重比较可信性的度量，并且由Sig.值可以让我们看到，比较检验是可信的。利用spss可将多指标数据进行良好的分析。5.指导教师点评（总分100分，所列分值仅供参考，以下部分打印时不可以断页）实验内容出色完成30分良好完成25分基本完成20分部分完成15分初步完成5分实验步骤精益求精30分比较完善25分合乎要求20分缺少步骤15分少重要步骤5分实验结论(心得体会)分析透彻20分分析合理17分合乎要求14分结论单薄8分难圆其说4分工作态度勇于探索20分能够务实17分中规中矩14分华而不实8分态度不端正0分总分有抄袭剽窃行为则实验成绩记为零分，并且严重警告！！教师签字：日期：年月日注：验证性实验仅上交电子文档，设计性试验需要同时上交电子与纸质文档进行备份存档。