均值(Mean)和均值标准误差(S.E.mean)3.1中位数(Median)3.2众数(Mode)3.3全距(Range)3.4方差(Variance)和标准差(StandardDeviation)3.5四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)3.6频数(Frequency)3.7峰度(Kurtosis)3.8偏度(Skewness)3.9标准化Z分数及其线性转换3.10探索分析(Explore)3.11交叉列联表分析(Crosstabs)3.12多选项分析(MultipleResponse)3.13基本统计分析的报表制作(Reports)3.14SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。本章主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。图3-1在菜单中选择“Frequencies”命令在哪里操作?一、频数分析(Frequencies)频数分析:适用于离散型数据,即名义变量(Nominal)(分类数据)和顺序变量(Ordinal)(顺序数据),其功能是描述离散型变量的分布特征。Analyze→Descriptivestatistics→frequencies频数分析包括三个部分Statistics(统计量).Charts(图形).Format(输出格式).Statistics1)Quartiles是四分位数,包括上四分位和下四分位。2)Cutpointsforequalgroups是每隔指定的百分位间距输出一个百分位数的选项。3)Percentiles是直接指定输出的百分位数。如指定输出位于2.5%和97.5%的变量的值ChartsformatAscendingvalues是按变量值的升序。Ascendingcounts是按频数的升序。MultipleVariables:多变量选项栏。适用于用两个以上变量做频数表。Comparevariables(比较变量):将结果在同一个频数表中输出显示。Organizeoutputbyvariables(按各变量单独输出):将结果在不同的输出表中显示。SuppressTableswithmorethanNcategories:激活了than后面的窗口。输入的数字N是频数表分组数的最大设定。当频数表的分组数大于设定的N值时,禁止它在结果中输出,以避免产生巨型表格。二、描述统计(Descriptives)•描述统计(Descriptives):将描述统计的各个统计量作为分析结果输出。•Analyze→DescriptiveStatistics→Descriptives0ptions3.1均值(Mean)和均值标准误差(S.E.mean)3.1.1统计学上的定义和计算公式定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。计算公式如下。总体平均数:若一组数据X1,X2,…,XN,代表一个大小为N的有限总体,则其总体平均数为样本平均数:若一组数据x1,x2,…,xn,代表一个大小为n的有限样本,则其样本平均数为样本数据来自总体。样本的统计描述量可以反映总体数据的特征,但由于抽样等原因,使得样本数据不一定能够完全准确地反映总体,它可能与总体的真实值之间存在一定的差异。进行不同次抽样,会得到若干个不同的样本均值,它们与总体均值存在着不同的差异。均值标准误差(StandardErrorofMean,S.E.mean)就是描述这些样本均值与总体均值之间平均差异程度的统计量。它是由这n个样本统计出来的标准差除上其样本数n,然后再开方所得。3.1.2SPSS中实现过程研究问题求某班级学生在一次数学测验中的平均成绩,数据如表3-1所示。数学成绩998879595489795689992389705067788956表3-1某班级的数学成绩实现步骤图3-1在菜单中选择“Frequencies”命令图3-2“Frequencies”对话框(一)图3-3“Frequencies:Statistics”对话框(一)3.1.3结果和讨论3.5.1统计学上的定义和计算公式3.5方差(Variance)和标准差(SD:StandardDeviation)定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。3.5.2SPSS中实现过程研究问题求某班级学生数学成绩的方差和标准差,数据如表3-1所示。实现步骤图3-7在菜单中选择“Descriptives”命令图3-8“Descriptives”对话框(一)图3-9“Descriptives:Options”对话框(一)3.5.3结果和讨论3.2中位数(Median)3.2.1统计学上的定义和计算公式定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。计算公式:一个大小为的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果为奇数,那么该数列的中位数就是位置上的数;如果N为偶数,中位数则是该数列中第与第+1位置上两个数值的平均数。12N2N2N3.2.2SPSS中实现过程研究问题求某班级学生身高的中位数,数据如表3-2所示。表3-2某班级学生的身高身高(cm)174168164174176150183162171146189167实现步骤图3-4“Frequencies:Statistics”对话框(二)3.2.3结果和讨论3.3众数(Mode)3.3.1统计学上的定义和计算公式定义:众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。3.3.2SPSS中实现过程研究问题求某医院当天出生新生儿的体重的众数,数据如表3-3所示。表3-3新生儿的体重体重(斤)8767545687564765.574实现步骤图3-5“Frequencies:Statistics”对话框(三)3.3.3结果和讨论3.4.1统计学上的定义和计算公式3.4全距(Range)定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。计算公式:最大值-最小值。3.4.2SPSS中实现过程研究问题求某班级学生数学成绩的全距,数据如表3-4所示。表3-4某班级的数学成绩数学成绩998879595489795689992389705067788956实现步骤图3-6“Frequencies:Statistics”对话框(四)3.4.3结果和讨论3.6四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles)3.6.1统计学上的定义定义:四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的数据越分散。十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为D1,D2,…,D9,表示10%的数据落在D1下,20%的数据落在D2下,…,90%落在D9下。百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,…,P99,表示1%的数据落在P1下,2%的数据落在P2下,…,99%落在P99下。3.6.2SPSS中实现过程研究问题1求某班级学生数学成绩的四分位数,数据如表3-1所示。数学成绩998879595489795689992389705067788956实现步骤图3-10“Frequencies:Statistics”对话框(五)研究问题2测量54个某种机械零件的重量(克),求零件重量的D6,数据如表3-5所示。表3-5零件的重量零件重量(克)465159544653375250514944494443465647525250475549475252424540606354405550564649534655444557525049554858425259实现步骤图3-11“Frequencies:Statistics”对话框(六)输入的数字都默认是百分数的分子,如果是四分数设置,则为25,50,75,100;如果是10分位设置,则为10,20,30…100,如果是百分位设置则为1,2,3,…100研究问题3测量出54个某种机械零件的重量(克),求零件重量的P37,数据如表3-5所示。实现步骤图3-12“Frequencies:Statistics”对话框(七)3.6.3结果和讨论研究问题1的程序运行结果如下表所示。研究问题2的程序运行结果如下表所示。研究问题3的程序运行结果如下表所示。3.7频数(Frequency)3.7.1统计学上的定义和计算公式定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。3.7.2SPSS中实现过程研究问题10个学生在某次数学、语文、化学考试中成绩如表3-6所示,试求学生在3门课程上的频数分布。表3-6学生成绩姓名数学语文化学hxh99.0098.00100.00yaju88.0089.0045.00yu99.0080.0056.00shizg89.0078.0067.00hah94.0078.0078.00lisa90.0089.0087.00watet79.0087.0089.00jess75.0076.0097.00wish89.0056.0076.00iiakii80.0076.00100.00实现步骤图3-1在菜单中选择“Frequencies”命令实现步骤图3-13“Frequencies”对话框(二)基本概念频数(frequency):也称次数,指落在各类别中的数据个数。比例(proportion):一个总体中各个部分的数值占全部数值的比重,通常用于反映总体的构成或结构。百分比(percentage):将比例乘以100就是百分数,将对比的基数抽象为100计算出来的。以个案总个数为分母计算ValidPercent是有效百分比(以有效数据总数为分母计算)累积频数(cumulativefrequencies):将有序类别或组的频数逐级累加起来。3.7.3结果和讨论程序运行结果如下表所示。3.8峰度(Kurtosis)3.8.1统计学上的定义和计算公式定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为3.8.2SPSS中实现过程研究问题某班级40个学生的年龄分布如表3-7所示,试求学生年龄峰度。表3-7学生年龄年龄人数