spss16-03(统计描述)

a84737478
40 ℃
2020-02-24

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

SPSS16实用教程第3章统计描述均值（Mean）和均值标准误差（S.E.mean）3.1中位数（Median）3.2众数（Mode）3.3全距（Range）3.4方差（Variance）和标准差（StandardDeviation）3.5四分位数（Quartiles）、十分位数（Deciles）和百分位数（Percentiles）3.6频数（Frequency）3.7峰度（Kurtosis）3.8偏度（Skewness）3.9标准化Z分数及其线性转换3.10探索分析3.11交叉列联表分析3.12多选项分析3.13基本统计分析的报表制作3.14SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习，可以对要分析数据的总体特征有比较准确的把握，从而有助于选择其他更为深入的统计分析方法。本章主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。3.1均值（Mean）和均值标准误差（S.E.mean）3.1.1统计学上的定义和计算公式定义：均值（平均值、平均数）表示的是某变量所有取值的集中趋势或平均水平。例如，学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。计算公式如下。总体平均数：若一组数据X1，X2，…，XN，代表一个大小为N的有限总体，则其总体平均数为样本平均数：若一组数据x1，x2，…，xn，代表一个大小为n的有限样本，则其样本平均数为样本数据来自总体。样本的统计描述量可以反映总体数据的特征，但由于抽样等原因，使得样本数据不一定能够完全准确地反映总体，它可能与总体的真实值之间存在一定的差异。进行不同次抽样，会得到若干个不同的样本均值，它们与总体均值存在着不同的差异。均值标准误差（StandardErrorofMean，S.E.mean）就是描述这些样本均值与总体均值之间平均差异程度的统计量。3.1.2SPSS中实现过程研究问题求某班级学生在一次数学测验中的平均成绩，数据如表3-1所示。数学成绩998879595489795689992389705067788956表3-1某班级的数学成绩实现步骤图3-1在菜单中选择“Frequencies”命令图3-2“Frequencies”对话框（一）图3-3“Frequencies：Statistics”对话框（一）3.1.3结果和讨论3.2中位数（Median）3.2.1统计学上的定义和计算公式定义：把一组数据按递增或递减的顺序排列，处于中间位置上的变量值就是中位数。它是一种位置代表值，所以不会受到极端数值的影响，具有较高的稳健性。计算公式：一个大小为的数列，要求其中位数，首先应把该数列按大小顺序排列好，如果为奇数，那么该数列的中位数就是位置上的数；如果N为偶数，中位数则是该数列中第与第+1位置上两个数值的平均数。12N2N2N3.2.2SPSS中实现过程研究问题求某班级学生身高的中位数，数据如表3-2所示。表3-2某班级学生的身高身高（cm）174168164174176150183162171146189167实现步骤图3-4“Frequencies：Statistics”对话框（二）3.2.3结果和讨论3.3众数（Mode）3.3.1统计学上的定义和计算公式定义：众数是指一组数据中，出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如，制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。计算公式：手工计算众数比较麻烦，需要统计数据的次数分布。3.3.2SPSS中实现过程研究问题求某医院当天出生新生儿的体重的众数，数据如表3-3所示。表3-3新生儿的体重体重（斤）8767545687564765.574实现步骤图3-5“Frequencies:Statistics”对话框（三）3.3.3结果和讨论3.4.1统计学上的定义和计算公式3.4全距（Range）定义：全距也称为极差，是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据，全距大的一组数据要比全距小的一组数据更为分散。计算公式：最大值－最小值。3.4.2SPSS中实现过程研究问题求某班级学生数学成绩的全距，数据如表3-4所示。表3-4某班级的数学成绩数学成绩998879595489795689992389705067788956实现步骤图3-6“Frequencies:Statistics”对话框（四）3.4.3结果和讨论3.5.1统计学上的定义和计算公式3.5方差（Variance）和标准差（StandardDeviation）定义：方差是所有变量值与平均数偏差平方的平均值，它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根，它表示了一组数据关于平均数的平均离散程度。方差和标准差越大，说明变量值之间的差异越大，距离平均数这个“中心”的离散趋势越大。3.5.2SPSS中实现过程研究问题求某班级学生数学成绩的方差和标准差，数据如表3-1所示。实现步骤图3-7在菜单中选择“Descriptives”命令图3-8“Descriptives”对话框（一）图3-9“Descriptives：Options”对话框（一）3.5.3结果和讨论3.6四分位数（Quartiles）、十分位数（Deciles）和百分位数（Percentiles）3.6.1统计学上的定义定义：四分位数是将一组个案由小到大（或由大到小）排序后，用3个点将全部数据分为四等份，与3个点上相对应的变量称为四分位数，分别记为Q1（第一四分位数）、Q2（第二四分位数）、Q3（第三四分位数）。其中，Q3到Q1之间的距离的一半又称为四分位差，记为Q。四分位差越小，说明中间的数据越集中；四分位数越大，则意味着中间部分的数据越分散。十分位数是将一组数据由小到大（或由大到小）排序后，用9个点将全部数据分为十等份，与9个点位置上相对应的变量称为十分位数，分别记为D1，D2，…，D9，表示10%的数据落在D1下，20%的数据落在D2下，…，90%落在D9下。百分位数是将一组数据由小到大（或由大到小）排序后分割为100等份，与99个分割点位置上相对应的变量称为百分位数，分别记为P1，P2，…，P99，表示1%的数据落在P1下，2%的数据落在P2下，…，99%落在P99下。3.6.2SPSS中实现过程研究问题1求某班级学生数学成绩的四分位数，数据如表3-1所示。实现步骤图3-10“Frequencies:Statistics”对话框（五）研究问题2测量54个某种机械零件的重量（克），求零件重量的D6，数据如表3-5所示。表3-5零件的重量零件重量（克）465159544653375250514944494443465647525250475549475252424540606354405550564649534655444557525049554858425259实现步骤图3-11“Frequencies:Statistics”对话框（六）图3-12“Frequencies:Statistics”对话框（七）研究问题3测量出54个某种机械零件的重量（克），求零件重量的P37，数据如表3-5所示。实现步骤图3-12“Frequencies:Statistics”对话框（七）3.6.3结果和讨论研究问题1的程序运行结果如下表所示。研究问题2的程序运行结果如下表所示。研究问题3的程序运行结果如下表所示。3.7频数（Frequency）3.7.1统计学上的定义和计算公式定义：频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况，需要计算出学生所有分数取值，以及每个分数取值有多少个人，这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段，它可以使人们非常清楚地了解变量取值的分布情况。3.7.2SPSS中实现过程研究问题10个学生在某次数学、语文、化学考试中成绩如表3-6所示，试求学生在3门课程上的频数分布。表3-6学生成绩姓名数学语文化学hxh99.0098.00100.00yaju88.0089.0045.00yu99.0080.0056.00shizg89.0078.0067.00hah94.0078.0078.00lisa90.0089.0087.00watet79.0087.0089.00jess75.0076.0097.00wish89.0056.0076.00iiakii80.0076.00100.00实现步骤图3-13“Frequencies”对话框（二）3.7.3结果和讨论程序运行结果如下表所示。3.8峰度（Kurtosis）3.8.1统计学上的定义和计算公式定义：峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量，峰度为0表示其数据分布与正态分布的陡缓程度相同；峰度大于0表示比正态分布高峰要更加陡峭，为尖顶峰；峰度小于0表示比正态分布的高峰要平坦，为平顶峰。具体的计算公式为3.8.2SPSS中实现过程研究问题某班级40个学生的年龄分布如表3-7所示，试求学生年龄峰度。表3-7学生年龄年龄人数1811972022218222实现步骤图3-14在Data菜单中选择“WeightCases”命令3.8.3结果和讨论3.9偏度（Skewness）3.9.1统计学上的定义和计算公式定义：偏度也是描述数据分布形态的，它是描述某变量取值分布对称性的统计量。具体的计算公式为这个统计量是与正态分布相比较的量，偏度为0表示其数据分布形态与正态分布偏度x相同；偏度大于0表示正偏差数值较大，为正偏或右偏，即有一条长尾巴拖在右边；偏度小于0表示负偏差数值大，为负偏或左偏，有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。3.9.2SPSS中实现过程研究问题某班级41个学生的身高分布如表3-8所示，试求学生身高分布偏度。表3-8学生身高身高（cm）人数1651168717022173817521801实现步骤图3-17“Frequencies:Statistics”对话框（九）3.9.3结果和讨论3.10标准化Z分数及其线性转换3.10.1统计学上的定义和计算公式3.10.2SPSS中实现过程研究问题1求某班级学生数学成绩的Z分数，数据如表3-1所示。实现步骤图3-18“Descriptives”对话框（二）图3-19“Descriptives：Options”对话框（二）图3-20数据编辑窗口研究问题2从图3-20中可以看到学生数学成绩的Z分数有正有负，而且小数点位数较多，因此可以把它线性转换为T分数。实现步骤图3-21在菜单中选择“ComputeVariable”命令图3-22“ComputeVariable”对话框图3-23“ComputeVariable：Type”对话框图3-24数据编辑窗口3.10.3结果和讨论从Z分数（图3-20）和T分数（图3-24）的结果中可以看出此班级学生数学成绩的T分数比之前的Z分数简洁多了，比较起来一目了然。3.11探索分析3.11.1统计学上的定义和计算公式定义：调用此过程可对变量进行更为深入详尽的描述性统计分析，故称之为探索分析。它在一般描述性统计指标的基础上，增加有关数据其他特征的文字与图形描述，显得更加细致与全面，有助于用户思考对数据进行进一步分析的方案。1．探索分析的内容包括下面几个方面检查数据是否有错误：过大或过小的数据均有可能是奇异值、影响点或错误数据。要找出这样的数据，并分析原因，然后决定是否从分析中删除这些数据。因为奇异值和影响点往往对分析的影响较大，不能真实反映数据的总体特征。对数据规律的初步观察：通过初步观察获得数据的一些内部规律，例如，两个变量间是否线性相关。2．探索分析的考察方法探索分析一般通过数据文件在分组与不分组的情况下，获得常用统计量和图形。一般以图形方式输出，直观帮助用户确定奇异值、影响点、进行假设检验，以及确定