IBM-SPSS第3章统计描述分析描述性统计分析是进行其他统计分析的基础和前提。在描述性分析中,通过各种统计图表及数字特征量可以对样本来自的总体特征有比较准确的把握,从而选择正确的统计推断方法。主要内容1:频数分布分析(Frequencies)2:描述性统计分析(Descriptives)3:探索性分析(Explore)第一节SPSS频数分布分析一、基本概念频数分布分析主要通过频数分布表、条图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征。模块解读“频率”(Frequencies)主对话框统计量”(Frequencies:Statistics)对话框1、百分位值(PercentileValues)栏为复选项,在此栏中可选择多项。四分位数(Quartile)割点(Cutpoints):选择此项,在后面的文本框中输入数值,假设为N(N为在2100之间的整数),则计算并显示N分位数。百分位数(Percentile(s)):选择此项,在后面的文本框中输入数值,可以有选择地显示百分位数。在文本框中可以输入0到100之间的数,输入后,单击“添加”(Add)按钮,将对应的百分位数添加到方框内的列表框中,利用“更改”(Change)按钮和“删除”(Remove)按钮,可以对列表框中的选项进行修改和删除。2、离散(Dispersion)栏(复选项):标准差(StdDeviation)最小值(Minimum)方差(Variance)最大值(Maximum)范围(极差)(Range)均值的标准误(S.E.Mean)3、集中趋势(CentralTendency)栏(复选项):均值(Mean)、中位数(Median)、众数(Mode)、合计(Sum)。4、分布栏(Distribution)(复选项):峰度(Kurtosis)、偏度(Skewness)。5、单击“图表”(Charts)按钮,打开“频率:图表”(Frequencies:Charts)对话框,如图3-3所示。在该对话框中,用户可以选择频数分析的图表类型。该对话框中各选项的具体意义如下:1、图表类型(ChartType)(单选项):无(None)(系统默认选项)、条形图(Barcharts)、饼形图(Piecharts)、直方图(Histograms)。如果选择输出“直方图”,可以选择是否在输出的直方图中添加正态分布曲线。如果需要输出正态分布曲线,则可勾选“带正态曲线”(Withnormalcurve)复选框。2、图表值(ChartValues)(单选项组):可选择图形中分类值的表现形式。频率(Frequencies):如果图表类型是直方图,则直方图的纵轴为频数;如果图表类型是饼形图,则饼形图中每块表示属于该组观测值的频数。百分比(Percentage):如果图表类型是直方图,则直方图的纵轴为百分比;如果图表类型是饼形图,则饼形图中每块表示该组的观测量数占总数的百分比。“频率:图表”(Frequencies:Charts)对话框在该对话框中,用户可以设置频率分布表的输出格式。对话框中各选项的意义如下:1、排序方式(Orderby)栏:单选项组,用户可以选择频数分布表中数值及其对应频率的排列顺序。按值的升序排序(Ascendingvalues):系统默认选项,频数分布表中将按照数值从小到大排列。按值的降序排序(Descendingvalues):频数分布表中将按照数值从大到小排列。按计数的升序排序(Ascendingcounts):频数分布表中将按照计数从小到大排列。按计数的降序排序(Descendingcounts):频数分布表中将按照计数从大到小排列。2、多个变量(MultipleVariables)栏:单选项组,当“频率(Frequencies)”主对话框的“变量”(Variable(s))列表框中有多个变量时,利用“多个变量”栏可以设置表格的显示方式。比较变量(Comparevariables):系统默认选项,SPSS将所有变量的描述统计的结果显示在同一张表格中,方便用户进行比较分析。按变量组织输出(Organizeoutputbyvariable):SPSS将对应每个变量分别输出单独的描述统计表格。“频率:格式”(Frequencies:Format)对话框实例讲解例3.1:从某单位职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果;见“胆固醇.sav”。第二节spss描述性统计分析一、基本概念描述性统计分析主要用以计算描述集中趋势和离散趋势的各种统计量,此外还有一个重要功能是对变量做标准化变换,即Z变换。模块解读描述性统计分析对话框描述性统计分析选项对话框实例讲解例3.2:分析不同性别演员获得奥斯卡的年龄差异性;见“演员.sav”.第三节SPSS探索性分析一、基本概念探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。二、探索性分析有以下几个目的:1.对数据进行初步检查,判断有无离群点和极端值。2.对前提条件假设,如正态分布和方差齐性进行检查,不满足正态分布和方差齐性时,提示数据转换方法,最后决定使用参数方法或非参数方法。3.了解组间差异的特征。探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。模块解读探索性分析主对话框统计量对话框“描述性(Descriptives)”:选择此项,将生成描述性统计表格。表中显示样本数据的描述统计量,包括平均值、中位数、5%调整平均数、标准误、方差、标准差、最大值、最小值、组距、四分位数、峰度、偏度及峰度和偏度的标准误。“均值的置信区间”(ConfidenceIntervalforMean):用户还可输入数值指定均值的置信区间的置信度,系统默认的置信度为95%。“M-估计量(M-estimators)”:选择此项,将计算并生成稳健估计量。M估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近而变化,通过给远离中心值的数据赋予较小的权重来减小异常值的影响。“界外值(Outliers)”:选择此项,将输出分析数据中的5个最大值和5个最小值作为异常嫌疑值。“百分位数(Percentiles)”:选择此项,将计算并显示指定的百分位数,包括5%、10%、25%、50%、75%、90%和95%等。统计图对话框“箱图(Boxplots)栏(单选项组)”:箱图,又称箱锁图。“按因子水平分组(Factorlevelstogether,系统默认)”:选择此项,将为每个因变量创建一个箱锁图,在每个箱锁图内根据分组变量的不同水平的取值创建箱形单元。“不分组(Dependentstogether)”:选择此项,将为每个分组变量的水平创建一个箱锁图,在每个箱锁图内用不同的颜色区分不同因变量所对应的箱形单元,方便用户进行比较。“无(None)”:选择此项,不创建箱图。“描述性(Descriptive)栏(复选项)”:选择该组内的选项,可以生成茎叶图和(或)直方图。“茎叶图(Stem-and-leaf,系统默认)”:茎叶图主要由3个部分组成,即频率(Frequency)、茎(Stem)和叶(Leaf),在图中按从左到右的顺序依次排列,在图的底端,注明了茎的宽(StemWidth)和每一叶所代表的观测量数(EachLeaf)。图3-13为本例分析结果之一。本例茎宽10,每片叶子代表一例。“直方图(Histogram)”:直接绘制直方图“带检验的正态图(Normalityplotswithtest,复选框)”:选择此项,将进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。“伸展与级别Levene检验(SpreadvslevelwithLeveneTest)栏(单选项组)”:对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归直线的斜率及方差齐性的Levene检验,但如果没有指定分组变量,则此选项无效。探索性分析的选项对话框在该对话框中,可选择缺失值的处理方式,SPSS提供了3种处理方式:“按列表排除个案(Excludecaseslistwise,系统默认)”:选择此项,对所有的分析过程剔除分组变量和因变量中所有带有缺失值的观测量数据;“按对排除个案(Excludecasespairwise)”:同时剔除带缺失值的观测量及与缺失值有成对关系的观测量。在当前分析过程中用到的变量数据中剔除带有缺失值的观测量数据,在其他分析过程中可能包含缺失值;“报告值(Reportvalues)”:选择此项,将分组变量的缺失值单独分为一组,在输出频数表的同时输出缺失值。实例讲解例3.3:分析中国南北城市的温度差异;见“南北差异温度.sav”.THEEND