第二章课后习题1.现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。边远及少数民族聚居区社会经济发展水平的指标数据地区人均GDP(元)三产比重(%)人均消费(元)人口增长(%)文盲半文盲(%)内蒙古506831.121418.2315.83广西407634.220409.0113.32贵州234229.8155114.2628.98云南435531.3205912.125.48西藏371643.5155115.957.97宁夏427037.3194713.0825.56新疆622935.4274512.8111.44甘肃345632.8161210.0428.65青海436740.9204714.4842.92资料来源:《中国统计年鉴(1998)》,北京,中国统计出版社,1998。五项指标的全国平均水平为:)15.789.5297232.8701.6212(0解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)输出结果1-1正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量DfSig.统计量dfSig.人均GDP.2199.200*.9589.781三产比重.1459.200*.9259.437人均消费.2099.200*.8739.131人口增长.1509.200*.9499.682文盲半文盲.2469.124.8989.242*.这是真实显著水平的下限。a.Lilliefors显著水平修正上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,所以此处选用Shapiro-Wilk统计量。则Sig.值分别为0.781、0.437、0.131、0.682、0.242均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。(2)提出原假设及备选假设00:H01:H(3)做出统计判断,最后对统计判断作出具体的解释SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选AnalyzeGeneralLinearModelMultivariate……进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入FixedFactor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。输出结果1-2主体间因子值标签N分类1.00边远及少数民族聚居区社会经济发展水平92.00全国经济平均发展水平1多变量检验a效应值F假设df误差dfSig.截距Pillai的跟踪.99081.986b5.0004.000.000Wilks的Lambda.01081.986b5.0004.000.000Hotelling的跟踪102.48281.986b5.0004.000.000Roy的最大根102.48281.986b5.0004.000.000分类Pillai的跟踪.8344.029b5.0004.000.101Wilks的Lambda.1664.029b5.0004.000.101Hotelling的跟踪5.0374.029b5.0004.000.101Roy的最大根5.0374.029b5.0004.000.101a.设计:截距+分类b.精确统计量上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表,该表给出了几个统计量。由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。实际上,GLM模型是拟合了下面的模型:XY10式中YGDP? (人均第三产业比重人均消费支出人口自然增长率文盲半文盲)X分类上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项0是因为不能肯定模型过原点。而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较。对此,对GLM模块的选项作如下设置:在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框,在ChangeContrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的ReferenceCategory被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)输出结果1-3对比结果(K矩阵)分类简单对比a因变量人均GDP三产比重人均消费人口增长文盲半文盲级别1和级别2对比估算值-2003.2322.274-1006.1112.71212.014假设值00000差分(估计-假设)-2003.2322.274-1006.1112.71212.014标准误差1129.2654.912395.8602.76115.688Sig..114.656.035.355.466差分的95%置信区间下限-4607.321-9.053-1918.967-3.655-24.162上限600.85713.602-93.2569.07948.190a.参考类别=2见输出结果1-3表示(1)在显著性水平0.05的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为1006.111元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。(2)在显著性水平0.01的水平下,可以看到Sig.值分别为0.114、0.656、0.035、0.355、0.466均大于显著性水平,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。输出结果1-4多变量检验结果值F假设df误差dfSig.Pillai的跟踪.8344.029a5.0004.000.101Wilks的lambda.1664.029a5.0004.000.101Hotelling的跟踪5.0374.029a5.0004.000.101Roy的最大根5.0374.029a5.0004.000.101a.精确统计量输出结果1-4是上面多重比较可信性的度量,由Sig.值可以看到,比较检验是可信的。2、为研究某系列杀虫剂的杀虫效果,随机抽取一批标准试验田分别使用该系列三种不同杀虫剂(1、2、3),结果如spss所示。试比较杀虫剂对玉米和棉花的作用,并分析杀虫剂与农作物是否存在交互作用。解:在SPSS中依次选择:分析一般线性模型多变量后将效果1和效果2选入因变量中,将杀虫剂和农作物选入固定因子对话框中,在对比对话框中,将杀虫剂用差值进行对比;在绘制中,将杀虫剂选入水平轴,农作物选入单图;将杀虫剂进行两两比较;在选型对话框中进行方差齐性检验,得到以下输出结果:输出结果2-1主体间因子N杀虫剂182838农作物012112由上表知,杀虫剂共有三类,所含个体数均为8个;农作物分为两个,所含个体数均为12个。输出结果2-2协方差矩阵等同性的Box检验aBox的M17.133F.812df115df21772.187Sig..665检验零假设,即观测到的因变量的协方差矩阵在所有组中均相等。a.设计:截距+杀虫剂+农作物+杀虫剂*农作物由该表知,检验统计量是Box’M,由Sig.值可以认为观测到的因变量的协方差矩阵在所有组中是均相等的。输出结果2-3误差方差等同性的Levene检验aFdf1df2Sig.效果11.509518.236效果2.499518.773检验零假设,即在所有组中因变量的误差方差均相等。a.设计:截距+杀虫剂+农作物+杀虫剂*农作物由上表知,在显著性水平位0.05下,Sig.值分别为0.236、0.773,它们均大于,则不应该拒绝原假设,即认为效果1和效果2的误差方差是相等的。输出结果2-4主体间效应的检验源因变量III型平方和df均方FSig.校正模型dimension1效果1344.708a568.94220.944.000效果2165.500b533.1007.401.001截距dimension1效果11617.04211617.042491.253.000效果21536.00011536.000343.453.000杀虫剂dimension1效果1308.0832154.04246.797.000效果2147.250273.62516.463.000农作物dimension1效果130.375130.3759.228.007效果216.667116.6673.727.069杀虫剂*农作物dimension1效果16.25023.125.949.406效果21.5832.792.177.839误差dimension1效果159.250183.292效果280.500184.472总计dimension1效果12021.00024效果21782.00024校正的总计dimension1效果1403.95823效果2246.00023a.R方=.853(调整R方=.813)b.R方=.673(调整R方=.582)见输出结果2-4我们可以知道,在杀虫剂中,效果1和效果2的Sig.值均为0小于,拒绝原假设,我们认为三种类型的杀虫剂在效果1和效果2上存在显著差别;在农作物中,效果1和效果2的Sig.值分别为0.007、0.069均大于,不应拒绝原假设,即认为两种不同的农作物(玉米和棉花)在效果1和效果2上没有显著差别;在杀虫剂*农作物中,效果1和效果2的Sig.值分别为0.406、0.839均大于,不应拒绝原假设,即认为杀虫剂与农作物综合考虑条件下在效果1和效果2上是没有显著差别的。输出结果2-5见输出结果2-4知,①在效果1的估算边际均值中两条线之间接近平行,没有相交,则我们认为在效果1中杀虫剂与农作物之间不存在交互作用;②在效果2的估算边际均值中两条线之间接近平行,没有相交,则我们认为在效果2中杀虫剂与农作物之间不存在交互作用;