Spss大作业

anshuiyouling
1 ℃
2020-06-30

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1大作业汽车市场研究问题描述以往在我国各地汽车需求量的研究中，主要是根据国家政策、国民经济发展情况、各地区公路状况等，总和不同时期汽车保有量，对汽车市场进行定性分析和决策，这样往往带有主观因素，下面为一组可能影响汽车保有量的数据，部分数据如图1.1，用合理的方法对数据进行研究。图1.1一层次聚类1.1、求解思路用层次聚类的方法，分析与预测各个地区的汽车市场发展情况。首先对原始数据进行标准化变换处理，经过运算使得每列数据的平均值为0，方差为1，这样原始数据中5列具有不同比较标准的数据就能放在一起比较；然后用标准化后的30个不同地区数据求出欧式距离；最后采用Wald离差平方和法。1.2、问题求解与分析通过SPSS软件求解的结果与分析：结果分析：图1.2为层次分析的凝聚状态表，第一列为聚类步骤，表示共进行了29个步骤的分析；第二列和第三列表示某部聚类分析中，哪两个样本或聚类成了一类；第四列表示两个样本或类间距，从图看出，距离小的样本之间先聚类；2第五列和第六列表示某步聚类分析中，参与聚类的是样本还是类，0表示样本；第七列表示本步聚类分析结果在下面聚类的第几步中用到。AgglomerationScheduleStageClusterCombinedCoefficientsStageClusterFirstAppearsNextStageCluster1Cluster2Cluster1Cluster211216.010001721420.02500153726.04000104530.0560013534.0810096829.107002372427.13600881324.16907129315.213502610718.2693024111922.3280017121321.395801513517.469401914211.5590020151314.65012219162328.7660022171219.88711124181101.0150021195131.16013152320291.3141402521161.509180252223251.7351602723582.04919627247122.44610172625123.08221202926374.06292428275235.27723222828357.951262729291313.88625280图1.2结果分析：图1.3将30个样本分为三类，第一类包括1、2、6、9、10、11，第二3类包括3、4、7、12、15、16、18、19、22、26，第三类包括5、8、13、14、17、20、21、23、24、25、27、28、29、30。ClusterMembershipCase3Clusters1:北京12:天津13:河北24:山西25:内蒙古36:辽宁17:吉林28:黑龙江39:上海110:江苏111:浙江112:安徽213:福建314:江西315:山东216:河南217:湖北318:湖南219:广东220:广西321:海南322:四川223:贵州324:云南325:西藏326:陕西227:甘肃328:青海329:宁夏330:新疆3图1.3结果分析：图1.4是层次聚类分析的树形图，由于部分样本或小类之间的距离较4小，因此光从该图很难清晰看出哪几个样本先聚类，这时应借助于图1.2进行判别。*******************HIERARCHICALCLUSTERANALYSIS*******************DendrogramusingWardMethodRescaledDistanceClusterCombineCASE0510152025LabelNum+---------+---------+---------+---------+---------+安徽12─┐河南16─┼─┐广东19─┤│四川22─┘├─────┐吉林7─┐││陕西26─┼─┘├─────────────┐湖南18─┘││河北3─┐││山西4─┼───────┘│山东15─┘├─────────────────────────┐贵州23─┐││青海28─┼─────────┐││西藏25─┘│││黑龙江8─┬─┐├───────────┘│宁夏29─┘│││内蒙古5─┐├───────┘│新疆30─┤││湖北17─┤││江西14─┼─┘│广西20─┤│云南24─┤│甘肃27─┤│福建13─┤│海南21─┘│天津2─┐│浙江11─┼───┐│上海9─┘├───────────────────────────────────────────┘北京1─┐│江苏10─┼───┘辽宁6─┘图1.45总分析：第一类反应的是我国经济发展较发达地区与相对欠发达地区。1、2、9代表为北京、天津、上海三个直辖市，在全国具有举足轻重的地位，它们的汽车市场发展仍将处于全国领先水平；6、10、11代表辽宁、江苏、浙江，由于地理、人口、气候及交通等原因，汽车市场的发展将作为今后发展的重要因素，带动这些地区经济的腾飞。第二类中10个元素，分别代表陕西、山东、陕西等，这些地区从经济发展看处于中等水平，将是今后汽车发展的大市场。第三类为内蒙古、宁夏、新疆等，这些地区相对来说经济发展较慢，汽车发展空间不大。二多元线性回归分析2.1求解思路用多远线性回归的方法，分析国内生产总值、地区人口总数、地区公路长度、全社会货运量对汽车保有量是否有影响。首先自变量强制进入，不用管个因素质量如何，对回归方程是否有影响；然后选择输出默认输出项，输出回归系数的标准误差、标准回归系数等；最后选择Modelfit和Descriptives,输出判定系数、自变量与因变量的均值、标准差等。2.2问题求解与分析通过SPSS软件求解的结果与分析：DescriptiveStatisticsMeanStd.DeviationN汽车总保有量（万辆）34.667324.3379330国内生产总值（亿元）1.9211E31474.8060330地区人口总数（万人）4008.772794.88830地区公路长度（km）3.79E422292.14030全社会货运量（万吨）3.13E421233.21530图2.1结果分析：图2.1为四个自变量和一个因变量的平均值、方差和个案数为30。6VariablesEntered/RemovedbModelVariablesEnteredVariablesRemovedMethod1全社会货运量（万吨）,地区公路长度（km）,国内生产总值（亿元）,地区人口总数（万人）a.Entera.Allrequestedvariablesentered.b.DependentVariable:汽车总保有量（万辆）图2.2结果分析：图2.2中第二列为被引入的变量，第三列为从回归方程中被剔除的各个变量，第四列为进入方式。ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.916a.838.81210.54444a.Predictors:(Constant),全社会货运量（万吨）,地区公路长度（km）,国内生产总值（亿元）,地区人口总数（万人）图2.3结果分析：图2.3输出常用统计量关系数R为0.916，调整的判定系数为0.812，回归估计的标准误差S=10.54444。7ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression14398.08243599.52132.374.000aResidual2779.63125111.185Total17177.71429a.Predictors:(Constant),全社会货运量（万吨）,地区公路长度（km）,国内生产总值（亿元）,地区人口总数（万人）b.DependentVariable:汽车总保有量（万辆）图2.4结果分析：图2.4为方差分析表，统计量F=32.374；相伴概率p=0,说明多个变量与因变量之间存在线性回归关系。CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBeta1(Constant)1.6264.027.404.690国内生产总值（亿元）.010.003.6063.530.002地区人口总数（万人）-.004.002-.506-2.828.009地区公路长度（km）.000.000.2371.709.100全社会货运量（万吨）.001.000.6033.429.002a.DependentVariable:汽车总保有量（万辆）图2.5结果分析：图2.5为回归系数分析，UnstandardizedCoefficients为非标准化系数，StandardizedCoefficients为标准化系数，t为回归系数检验统计量，Sig为相伴概率，从图看出各个自变量与因变量的线性回归分析关系不显著。总分析：四个因变量对因变量的影响作用不显著。