SPSS练习题1、现有两个SPSS数据文件,分别为“学生成绩一”和“学生成绩二”,请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。先排序data---sortcases再合并data---mergefiles2、有一份关于居民储蓄调查的数据存储在EXCEL中,请将该数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。转换Data---transpose,输题目3、利用第2题的数据,将数据分成两份文件,其中第一份文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000-2000之间的调查数据,第二份数据文件是按照简单随机抽样所选取的70%的样本数据。选取数据data---selectcases4、利用第2题数据,将其按常住地(升序)、收入水平(升序)存款金额(降序)进行多重排序。排序data---sortcases一个一个选,加5、根据第1题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。计算transform---count按个输,把所有课程选取,define设区间,再排序6、根据第1题的完整数据,计算每个学生课程的平均分和标准差,同时计算男生和女生各科成绩的平均分。描述性统计,先转换Data---transpose学号放下面,全部课程(poli到his)放上面,ok,analyze---descriptivestatistics---descriptives,全选,options。先拆分data---splitfile按性别拆分,analyze---descriptivestatistics---descriptives全选所有课程options---mean7、利用第2题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。数据分组Transform---recode---下面一个,输名字,change,old,range,newvalue---add挨个输,从小加到大,等距8、在第2题的数据中,如果认为调查“今年的收入比去年增加”且“预计未来一两年收入仍会会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。(计算transform---count或)选取data---selectcases9、利用第2题数据,采用频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。Analyze---descriptivestatistics---frequencies10、利用第2题数据,从数据的集中趋势、离散程度和分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准分布曲线进行对比,进一步,对不同常住地住房存款金额的基本特征进行对比分析。AnDSdAnalyze---DescriptiveStatistics---Descriptives,选择存款金额到Variable(s)中。按Option,然后选择Mean,std.deviation,Minlmum,Variance,Maximum,Range,Kutosis,Skewness,Variablelist.然后按continue,ok11、将第1题的数据看作来自总体的样本,试分析男生和女生的课程平均分是否存在显著差异;试分析哪些课程的平均差异不显著。Transformcompute课程平均分=mean()analyze-comparemeans-independent-samplesT;选择若干变量作为检验变量到testvariables框(课程平均分);选择代表不同总体的变量(sex)作为分组变量到groupingvariable框;.定义分组变量的分组情况DefineGroups...:(填1,2)。1.两总体方差是否相等F检验:F的统计量的观察值为0.257,对应的P值为0.614,;如果显著性水平为0.05,由于概率P值大于0.05,两种方式的方差无显著差异.看eaualvariancesassumend。2.两总体均值的检验:.T统计量的观测值为-0.573,对应的双尾概率为0.569,T的P值>显著水平0.05,故不能推翻原假设,所以女生男生的课程平均分无显著差异。配对差异:analyze-comparemeans-paired-samplesT…pairedvariables框中每科与不同科目配对很麻烦略12、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75,现从雇员中随机随出11人参加考试,得分如下:80、81、72、60、78、65、56、79、77、87、76,请问该经理的宣称是否可信?步骤:采用单样本T检验(原假设H0:u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:Analyze-comparemeans-one-samplesTtest;指定检验值:在test后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(stderrormean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。13、利用促销方式数据,试分析这三种推销方式是否存在显著差异,绘制各组均值的对比图,并利用LSD方法进行多重比较检验。单因素方差分析对比图为options中的descriptivesLSD为post…中的P值大于a接受所以无关14、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死亡率相差是否显著?(example1.sav)(显著性水平为5%)表1:急性心肌梗塞患者治疗后24小时生死情况生存死亡用单参注射液18711未用单参注射液366合计22317··提提出出假假设设::HH00:是否接受治疗的急性心肌梗塞患者的病死率相差不显著HH11:是否接受治疗的急性心肌梗塞患者的病死率相差显著··操操作作步步骤骤::1、打开数据文件:file-open-data-example1.sav2、对count变量进行weightcases处理:data-weightcases选中weightcasesby;在Frequenciesvariable中加入变量count。3、对数据进行交叉汇总,如得出的下列频次交叉表,如图表3-1:用descriptive-crosstab过程,column填status,row填group。在cell选项中,选中percentages,以计算频数百分比。··统统计计表表格格及及分分析析::表3-1是否接受治疗与生存状况的相关性检验成果表(Chi-SquareTests)ValuedfAsymp.Sig.(2-sided)PearsonChi-Square6.040(b)1.014Linear-by-LinearAssociation6.0151.014有效个案数240表3-1是相关性卡方检验成果表。表中依次列出了Pearson卡方系数、线性相关的值(Value)、自由度(df)和双尾检验的显著水平(Asymp.Sig.(2-sided))。表3-2显示了根据是否使用单参注射液对急性心肌梗塞患者进行分组后,患者的生存和死亡状况频数和所占总数的百分比。表3-2急性心肌梗塞患者是否治疗与生死情况的列联表状况(status)总数生存死亡分组(group))用单参注射液Count18510195%within分组(group)94.9%5.1%100.0%未用单参注射液Count38745%within·分组(group)84.4%15.6%100.0%总数Count22317240%within·分组(group)92.9%7.1%100.0%··结结论论::根据表3-1可以看出,双侧检验的显著性概论为0.014,小于显著性水平0.05;因此否定原假设,接受备择假设,即两组患者的完全缓解率之间差别显著。15、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别?(example2.sav)(显著性水平为5%)表2:两化疗组的缓解率比较治疗组缓解未缓解合计单纯化疗21012复合化疗141327合计162339同上小于拒绝显著16、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成比有无差别?(example3.sav)(显著性水平为5%)同上小于拒绝显著表3:我国南北方鼻咽癌患者病理组织学分类构成地域淋巴上皮癌未分化癌磷癌其他合计南方四省7161618111东北三省89182251180合计16024386929117、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。1、打开数据文件:file-open-data-child.sav2、均值比较与检验:Analyze-Comparemeans-means3、在independentVar.中选性别,dependentVar.中选体重和身高4、在option子框中选择median/mean/Std.Deviation1、男性儿童的平均身高为109.962厘米;平均体重为18.202千克;中位身高为109.10厘米;中位体重为17.50千克;身高的标准差为6.084厘米;体重的标准差为2.786千克。2、女性儿童的平均身高为109.896厘米;平均体重为18.389千克;中位身高为109.450厘米;中位体重为17.750千克;身高的标准差为5.770厘米;体重的标准差为3.235千克。3、两性儿童的平均身高为109.930厘米;平均体重为18.292千克;中位身高为109.250厘米;中位体重为17.605千克;身高的标准差为5.905厘米;体重的标准差为2.995千克。18、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响?(显著性水平为5%)··提提出出假假设设::1、HH00::身高与体重受到年龄的影响不显著HH11::身高与体重受到年龄的影响显著2、HH00::身高与体重受到性别的影响不显著HH11::身高与体重受到性别的影响显著··操操作作步步骤骤::1、打开数据文件:file-open-data-child.sav2、均值比较与检验:analysis-comparemeans-means3、在independentVar.中选性别和年龄,dependentVar.中选体重和身高4、在option子框中选择median/mean/Std.Deviation在statisticforfirstlayer区域内勾上ANOVAtableandeta复选框··统统计计表表格格及及分分析析::表7-1体重、身高与年龄的方差分析表SumofSquaresdfMeanSquareFSig.体重(x4,kg)*年龄(age)BetweenGroups286.2152143.10723.518.000WithinGroups565.918936.085Total852.13395身高(x5,cm)*年龄(age)BetweenGroups1757.7072878.85352.567.000WithinGroups1554.8559316.719Total3312.56295在表7-1中,分别列出了平方和