spss统计软件期末课程考试题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《SPSS统计软件》课程作业要求:数据计算题要求注明选用的统计分析模块和输出结果;并解释结果的意义。完成后将作业电子稿发送至1.某单位对100名女生测定血清总蛋白含量,数据如下:74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.073.573.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。解:描述统计量标准误血清总蛋白含量均值73.6680.39389均值的95%置信区间下限72.8864上限74.44965%修整均值73.6533中值73.5000方差15.515标准差3.93892极小值64.30极大值84.30范围20.00四分位距4.60偏度.054.241峰度.037.478样本均值为:73.6680;中位数为:73.5000;方差为:15.515;标准差为:3.93892;最大值为:84.30;最小值为:64.30;极差为:20.00;偏度为:0.054;峰度为:0.037;均值的置信水平为95%的置信区间为:【72.8864,74.4496】。2.绘出习题1所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。解:正态性检验Kolmogorov-SmirnovaShapiro-Wilk统计量dfSig.统计量dfSig.血清总蛋白含量.073100.200*.990100.671a.Lilliefors显著水平修正*.这是真实显著水平的下限。表中显示了正态性检验结果,包括统计量、自由度及显著性水平,以K-S方法的自由度sig.=0.671,明显大于0.05,故应接受原假设,认为数据服从正态分布。3.正常男子血小板计数均值为922510/L,今测得20名男性油漆工作者的血小板计数值(单位:910/L)如下:220188162230145160238188247113126245164231256183190158224175问油漆工人的血小板计数与正常成年男子有无异常?解:下表给出了单样本T检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误差:单个样本统计量N均值标准差均值的标准误血小板计数值20192.150042.236529.44437单个样本检验检验值=225tdfSig.(双侧)均值差值差分的95%置信区间下限上限血小板计数值-3.47819.003-32.85000-52.6173-13.0827本例置信水平为95%,显著性水平为0.05,从上表中可以看出,双尾检测概率P值为0.003,小于0.05,故原假设不成立,也就是说,油漆工人的血小板计数与正常成年男子有异常。4.在某次考试中,随机抽取男女学生的成绩各10名,数据如下:男:99795989798999828085女:88545623756573508065假设总体服从正态分布,比较男女得分是否有显著性差异。解:组统计量性别N均值标准差均值的标准误成绩a1084.000011.527743.64539b1062.900018.453855.83562上表给出了本例独立样本T检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误差。独立样本检验方差方程的Levene检验均值方程的t检验差分的95%置信区间FSig.tdfSig.(双侧)均值差值标准误差值下限上限成绩假设方差相等1.607.2213.06718.00721.100006.880656.6442935.55571假设方差不相等3.06715.096.00821.100006.880656.4423535.75765根据上表“方差方程的Levene检验”中的sig.为0.221,远大于设定的显著性水平0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本T检验的结果应该看上表中的“假设方差相等”一行,第5列为相应的双尾检测概率(Sig.(双侧))为0.007,在显著性水平为0.05的情况下,T统计量的概率p值小于0.05,故应拒绝零假设,,即认为两样本的均值不是相等的,在本例中,能认为男女得分有显著性差异。5.设有5种治疗荨麻疹的药,要比较它们的疗效。假设将30个病人分成5组,每组6人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面的记录:药物类别治愈所需天数15,8,7,7,10,824,6,6,3,5,636,4,4,5,4,347,4,6,6,3,559,3,5,7,7,6问所有药物的效果是否一样?解:ANOVA治愈所需天数平方和df均方F显著性组间36.46749.1173.896.014组内58.500252.340总数94.96729上表是几种药物分析的结果,组间(BetweenGroups)平方和(SumofSquares)为36.467,自由度(df)为4,均方为9.117;组内(WithinGroups)平方和为58.500,自由度为25,均方为2.340;F统计量为3.896。由于组间比较的相伴概率Sig.(p值)=0.0140.05,故应拒绝H0假设(五种药物对人的效果无显著差异),说明五种药物对人的效果有显著性差异。通过上面的步骤,只能判断5种药物对人的效果是否有显著差异。如果想进一步了解究竟是哪种药物与其他组有显著性的均值差别(即哪种药物更好)等细节问题,就需要在多个样本均值间进行两两比较。由于第3步检验出来方差具有齐性,故选择一种方差相等的方法,这里选LSD方法;显著性水平默认取0.05;多重比较因变量:治愈所需天数(I)药物类别(J)药物类别均值差(I-J)标准误显著性95%置信区间下限上限LSD1.002.002.50000*.88318.009.68114.31893.003.16667*.88318.0011.34774.98564.002.33333*.88318.014.51444.15235.001.33333.88318.144-.48563.15232.001.00-2.50000*.88318.009-4.3189-.68113.00.66667.88318.457-1.15232.48564.00-.16667.88318.852-1.98561.65235.00-1.16667.88318.198-2.9856.65233.001.00-3.16667*.88318.001-4.9856-1.34772.00-.66667.88318.457-2.48561.15234.00-.83333.88318.354-2.6523.98565.00-1.83333*.88318.048-3.6523-.01444.001.00-2.33333*.88318.014-4.1523-.51442.00.16667.88318.852-1.65231.98563.00.83333.88318.354-.98562.65235.00-1.00000.88318.268-2.8189.81895.001.00-1.33333.88318.144-3.1523.48562.001.16667.88318.198-.65232.98563.001.83333*.88318.048.01443.65234.001.00000.88318.268-.81892.8189*.均值差的显著性水平为0.05。从整个表反映出来五种药物相互之间均存在显著性差异,从效果来看是第1种最好。上图为几种药物均值的折线图,可以看均值差异较大。6.某公司在各地区销售一种特殊化妆品。该公司观测了15个城市在某月内对该化妆品的销售量Y及各地区适合使用该化妆品的人数X1和人均收入X2,得到数据如下:地区销售(箱)人数(千人)人均收入(元)116227424502120180325432233753802413120528385678623476169265378278198300881923302450911619521371055532560112524304020122323724427131442362660141031572088152123702605(1)画出这三个变量的两两散点图,并计算出两两之间的相关系数。解:相关性人均收入X2销售Y人均收入X2Pearson相关性1.639*显著性(双侧).010平方与叉积的和7473615.733405762.200协方差533829.69528983.014N1515销售YPearson相关性.639*1显著性(双侧).010平方与叉积的和405762.20053901.600协方差28983.0143850.114N1515*.在0.05水平(双侧)上显著相关。其中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。从表中可看出,相关系数为0.6390,说明呈正相关相关性人数X1人均收入X2人数X1Pearson相关性1.569*显著性(双侧).027平方与叉积的和191088.933679452.467协方差13649.21048532.319N1515人均收入X2Pearson相关性.569*1显著性(双侧).027平方与叉积的和679452.4677473615.733协方差48532.319533829.695N1515*.在0.05水平(双侧)上显著相关。其中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。从表中可看出,相关系数为0.5690,说明呈正相关相关性销售Y人数X1销售YPearson相关性1.995**显著性(双侧).000平方与叉积的和53901.600101031.400协方差3850.1147216.529N1515人数X1Pearson相关性.995**1显著性(双侧).000平方与叉积的和101031.400191088.933协方差7216.52913649.210N1515**.在.01水平(双侧)上显著相关。表格中包括了叉积离差矩阵、协方差矩阵、Pearson相关系数及相伴概率p值。从表中可看出,相关系数为0.9950,说明呈正相关(2)12试建立Y与X,X之间的线性回归方程,并研究相应的统计推断问题。同时预测适合购买此化妆品的人数为220千人,人均收入为2500元的某城市对该化妆品的销量。输入/移去的变量模型输入的变量移去的变量方法1人均收入X2,人数X1a.输入a.已输入所有请求的变量。表中显示回归模型编号、进入模型的变量、移出模型的变量和变量的筛选方法。可以看出,进入模型的自变量为“人均收入X2和人数X1”。模型汇总模型RR方调整R方标准估计的误差更改统计量R方更改F更改df1df2Sig.F更改1.999a.999.9992.17722.9995679.466212.000a.预测变量:(常量),人均收入X2,人数X1。R=0.999,说明自变量与因变量之间的相关性很强。R方(R2)=0.999,说明自变量“人均收入和人数”可以解释因变量“销售量”的99.9%的差异性。Anovab模型平方和df均方FSig.1回归53844.716226922.3585679.466.000a

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功