SPSS数据分析报告第一部分:原始资料和数据资料来源:某班级29名同学实际情况编号姓名性别学科背景年龄身高体重体测成绩1吕鑫0文科20.5164.254.2812王阳0文科20158.346.2753洪华阳0理科2117157.2714刘卫秀0理科21165.554755吴梦琦0文科21166.248696韩玮0文科20164.347617汤丽娟0文科21162.848.2668江桂英0理科20157.244.2709熊如意0文科20166.554.57310余婵0文科19.5156.245.57711彭茜0文科20165.452.46612赵丹0文科20.5174.355.67613安怡君0文科2017556.27214武阳帆0文科20.5162.455.56715倪亚萍0文科22157.548.67416张明辉1文科21.5170607117张春旭1理科20.5168.557.88018刘晓伟1文科21170.559.57019黄炜1文科20.517162.27620李强1文科20.5167.556.56821温明煌1文科21.5170607522雷翀翀1理科21168.5607923陈志强1文科2218070.47924尹传萍1文科21.5165.255.67825郑南1理科21.5168.555.96426幸恒恒1文科21.5168.5587927李拓1理科21.517268.16628张发宝1理科21160.552.57329杨涛1理科21.517670.572第二部分:数据分析一、描述统计打开文件“某班级29名同学的身高、体重、年龄数据”,通过菜单兰中的分析选项,进行描述性分析,选择年龄、体重和身高,求最大值、最小值、方差、偏度、峰度和均值,得到如下结果:表1-1统计量描述分析表1-2年龄分布表图1-3身高分布直方图描述统计量N极小值极大值均值方差偏度峰度统计量统计量统计量统计量统计量统计量标准误统计量标准误身高29156.20180.00167.017233.840-0.0150.434-0.1460.845体重2944.2070.5055.665546.7800.4370.4340.159有效的N(列表状态)290.845年龄频率百分比有效百分比累积百分比有效19.5013.43.43.420.00620.720.724.120.50620.720.744.821.00724.124.169.021.50724.124.193.122.0026.96.9100.0合计29100.0100.0图1-4体重分布条形图文字描述:从SPSS分析结果中可以得出,有效数据共有29个。其中年龄主要分布在19.5-22.0岁之间,其中又以20.5-21.5之间最多。身高的极小值为156.20cm,极大值为180.00cm,均值为167.01,方差为33.84,该项指标方差过大,说明身高存在较大差异,当然极值的出现对此影响较大,从条形分布图中看出身高在165-175之间人数较多,身高的偏度为负,呈现右偏分布状态。体重的极小值为44.20kg,极大值为70.5kg,均值为55.67kg,方差为46.78,该指标方差偏大,个体之间差异性显著,从条形图中可以看出50-60kg之间分布较多,体重的偏度为负,呈现出右偏分布状态,峰度为负,分布呈低峰态。这些数据都可以从图表中轻易得出。二、相关分析(以身高和体测成绩为例进行相关性分析)图4-1身高和体测成绩之间的散点图表4-1身高和体测成绩之间的相关性分析按【图形】→【旧对话框】→【散点图】的流程,以身高为横轴,体测成绩为纵轴,得到如上如所示的散点图,可以看出各点分布较多零散,相关性不强。再做【分析】→【相关】→【双变量】操作,得出如4-1所示的表格,可以看出相关系数仅为0.097,相关性较弱,与上面散点图所呈现出的状态相符合。这表明身高和体测成绩之间的相关性不大。三、均值检验(在此以身高为例,其他指标分析类似)易知该样本总体服从正态分布,从中选出吴梦琪166.20cm,熊如意166.50cm,刘晓伟170.00cm,尹传萍165.20cm共4个数据。计算得出的平均值为166.975。我们现在以单样本T检验为例,对身高进行均值检验。建立原假设H0:总体均值与检验值之间不存在显著性差异。下面我们对此进行分析:选择菜单【分析】→【比较均值】→【单样本t检验】得出结果如下图表2-1,单样本T检验分析结果由图表可知:样本总体均值为167.02,标准差为5.82,均值标准误差为1.08023.样本检验值为166.975,第二列是统计量的观测值0.039;第三列是自由度;第四列是统计量观测值的双尾概率P值;第五列是样本均值与检验的差值;第六列和第七列是总体均值与原假设值差的身高体测成绩身高Pearson相关性1.097显著性(双侧).615N2929体测成绩Pearson相关性.0971显著性(双侧).615N2929单个样本统计量N均值标准差均值的标准误身高29167.01725.817221.08023单个样本检验检验值=166.975tdfSig.(双侧)均值差值差分的95%置信区间下限上限身高0.039280.9690.04224-2.17052.255095%的置信区间,因为167.0172在置信区间(164.8045,169.23)内,所以我们有95%的把握认为总体均值和样本均值之间不存在显著性差异。四、回归分析(在此以身高和体重之间的关系为例进行分析)有科学研究表明,身高和体重存在一定得线性相关关系,在此我们以某班级29个样本为例为此作出分析。选择【分析】→【回归】→【线性】进行分析,得到如下的输出结果:表5-1表5-2从表5-2中可以看出相关系数R=0.847,即身高和体重之间存在较强的线性相关关系。输入/移去的变量b模型输入的变量移去的变量方法1体重a.输入a.已输入所有请求的变量。b.因变量:身高模型汇总模型RR方调整R方标准估计的误差1.847a.717.7063.15356a.预测变量:(常量),体重。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)126.9394.88625.982.000体重.720.087.8478.263.000a.因变量:身高从上图中可以得出体重x对身高y的线性关系可以用二元线性函数表示,a=0.72,b=126.939.相应的直线方程为y=0.72x+126.939.Anovab模型平方和df均方FSig.1回归679.0071679.00768.276.000a残差268.514279.945总计947.52128a.预测变量:(常量),体重。b.因变量:身高系数Bootstrap模型BBootstrapa偏差标准误差显著性水平(双侧)93.3%置信区间下限上限1(常量)126.939-.7195.924.033113.641139.147体重.720.014.104.033.514.962a.Unlessotherwisenoted,bootstrapresultsarebasedon29bootstrapsamples