2019/12/181第四章数据特征的描述统计分析22019/12/18SPSS的主要分析工具——Analyze菜单•报告--Reports•描述性统计分析--DescriptiveStatistics菜单•表格--Tables•均值间的比较--CompareMeans菜单•一般线性模型――GeneralLinearModel菜单•相关分析――Correlate菜单•多元线性回归与曲线拟合――Regression菜单•对数线性模型——Loglinear菜单•聚类分析与判别分析——Classify菜单•因子分析与对应分析——DataReduction菜单•信度分析与多维尺度分析——Scale菜单•非参数检验――NonparametricTests菜单•时间序列分析--Timeseries32019/12/18描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在DescriptiveStatistics菜单中,包括:Frequencies:频数分析过程,特色是产生频数表(主要针对分类变量)Descriptives:数据描述过程,进行一般性的统计描述(主要针对数值型变量)Explore:数据探察过程,用于对数据概况不清时的探索性分析Crosstabs:多维频数分布交叉表分析(列联表分析)Ratiostatistics:比率分析42019/12/18•第一节报告分析(Report)•第二节描述性统计分析•第三节比率分析•第四节Means过程•第五节多选项分析主要内容2019/12/185第一节报告分析(Report)•1、OLAP在线分析处理过程•2、CaseSummaries个案汇总分析过程•3、报告摘要分析过程ReportSummariesinRows行形式摘要报告ReportSummariesinColumns列形式摘要报告2019/12/186按Analyze—Reports—OLAPCubes顺序单击打开如下对话框:摘要变量框:进入此框变量为数值型变量分层变量框:进入此框变量为数值型或字符型变量1、OLAP(在线分析处理过程)2019/12/187可选择的统计量:Sum总和NumberofCases个案数目Mean均值StandardDeviation标准差PercentofTotalSum占总和的百分比PercentofTotalN占观察量总数的百分比Median中位数GroupingMedian分组中位数Std.ErrorofMean均值标准误Minimum最小值Maximum最大值Range极差First首值Last尾值Variance方差Skewness偏度Std.ErrorofSkewness偏度的标准误Kurtosis峰度Std.ErrorofKurtosis峰度的标准误HarmonicMean调和平均数GeometricMean几何平均数2019/12/188标题对话框输入统计量的标题输入注解,这些注解将显示在统计量输出栏的下面04-1下面举例说明2019/12/18930名少儿身高数据表4-12019/12/1810(1)操作步骤:1)按Analyze—Reports—OLAPCubes顺序单击打开OLAPCubes对话框2)打开数据文件“少儿身高.sav”,将height变量选入SummaryVariable框中,将sex变量作为分组变量选入GroupingVariable框中;3)单击Statistics按钮,在Statistics框中选择Sum、Mean、Median项作为要输出的统计量;4)单击Title按钮,在Title框中输入“少儿身高分层报告”,单击Continue返回;单击OK2019/12/18112019/12/1812少儿身高分层报告性别:Total4003.5133.450133.750身高SumMeanMedian表4-3个案处理摘要表4-2说明个案的一些基本情况,包括总个数、有效值个数和缺省值个数。表4-3是分层报告,输出了总和、均值和中位数。CaseProcessingSummary30100.0%0.0%30100.0%身高*性别NPercentNPercentNPercentIncludedExcludedTotalCases表4-2(2)输出结果及分析2019/12/18132、个案汇总分析过程Ⅰ、主要功能计算指定变量的分组统计量,分组变量可能是一个,也可以有多个。如是多个,则将所有水平进行交叉分组。每个组中,变量值可以显示或不显示。Ⅱ、个案汇总分析按Analyze—Reports—CaseSummaries顺序单击打开CaseSummaries对话框。2019/12/1814可在参数框中输入数值,该数值表示分析过程只对前几个个案进行带有缺省值的个案不被显示在列出个案的同时,显示个案的序号分组变量:可选择一个或多个待分析变量:数值型或字符型变量。SummarizeCases对话框见下图2019/12/1815输入脚注在输出结果中显示各分组统计量的标题在分析过程中剔除带有缺失值的个案键入一个字符以便在输出结果中标记缺失值输入标题Ⅲ、例题分析:对表4-1资料(数据文件为“04-1少儿身高.sav”)进行个案汇总分析。Options对话框2019/12/18161)打开数据文件“04-1少儿身高.sav”2)打开CaseSummaries对话框,将height选入Variables框中,作为汇总分析的变量,将sex和grade选入GroupingVariables框中作为分组变量。3)清除Displaycases复选框。4)单击Statistics按钮,在Statistics框中选择Numberofcases、Mean、Median项作为要输出的统计量;单击Continue返回。5)单击OK(1)操作步骤2019/12/18172019/12/1818CaseProcessingSummary30100.0%0.0%30100.0%HEIGHT*SEX*GRADENPercentNPercentNPercentIncludedExcludedTotalCases表4-4个案处理摘要表4-4说明个案的总个数、有效值个数和缺省值个数以及各占的百分比。(2)输出结果及分析2019/12/1819CaseSummariesHEIGHT5133.440135.5006131.333130.4004134.575134.10015132.900132.60015134.000136.70015134.000136.7005133.440135.50021133.238133.0004134.575134.10030133.450133.750GRADE456Total5Total456TotalSEX男女TotalNMeanMedian分组统计量表4-5分三部分,1、男生身高的基本统计量,2、女生身高的基本统计量,3、全部身高的基本统计量。在每部分中又包括分年级进行的统计和总的统计,这就是交叉分组。表4-52019/12/1820Ⅰ、主要功能把个案的统计结果用一种简单扼要的表格输出,有助于更好地把握数据的分布特征。Ⅱ、行形式报告摘要按Analyze—Reports—ReportSummariesinRows顺序,打开SummariesinRows对话框。3、报告摘要分析过程2019/12/18212019/12/1822输入变量的列标题,不输入则将输出变量的标签或名称选择列标题对齐的方式选择变量值所处的位置以缩进的形式输出,可输入缩进数值;变量值位于列中央键入列宽数值,如不设列宽,则:如输出数值标签,则列宽为数值标签中的最长者;如输出变量值,则列宽为变量所定义的宽度;如设置了列标题,则列宽为标题的最长者;如未设置列标题,则列宽为输出的变量标签的最长者。选择输出的内容:将输出变量值将输出变量标签Format对话框2019/12/1823输出列变量之和。输出列变量的均值。输出列变量中的最小值。输出列变量中的最大值。输出列变量中个案的数目。输出列变量中高于Value框中设定值的个案占总数的百分比输出列变量中低于Value框中设定值的个案占总数的百分比输出列变量中位于Low和Hight框中设定值之间的个案占总数的百分比输出标准差。输出输出峰度。输出方差。输出偏度。Summary对话框2019/12/1824Report栏的Option对话框进行缺失值和输出页码的设置:剔除带有缺失值的观测量输入一个代表系统的和用户的缺失值字符设置报告的起始页码可进行页面设置:可输入分组变量间的间距行数(不超过20)每个分组变量都在新的一页输出在新的一页输出下一个分组变量,并接着上一页的页码输出下一页的页码输入设置分组标题和报告内容之间的间距,最多可插入20行空白BreakColumn中的Options对话框2019/12/1825所输数值表示报告的每一页输出从第几行开始所输数值表示报告的每一页输出在第几行结束规定每一页输出的左边间距规定每一页输出的右边间距选择报告输出内容的对齐方式设置页面的标题、脚注和页面的距离:设置标题与报告的距离设置注脚与报告的距离决定分组变量显示的位置:所有的分组变量值均位于第一列,激活Indentaneachbreak参数框在此框中设置分类变量值缩进的位置。默认为2空格设置列标题的输出格式:在标题下添加下划线设置列标题下的空白行(默认为2)选择列标题的对齐方式设置分组变量的显示位置:显示在统计量的上一行显示于统计量的同一行,并覆盖统计量标题设置分组变量与统计量之间的空白行数Report栏的Layout对话框2019/12/1826按Next进入下一行的设置,按Previous返回上一行对齐方式选择特殊变量的值作为标题与注脚在此对话框可规定标题与注脚的输出内容和格式,最多可设置10行Report栏的Titles对话框2019/12/1827Ⅲ、列形式报告摘要列形式报告摘要与行形式报告摘要不同之处在于:行形式报告摘要中汇总统计量位于行上,而列形式报告摘要中汇总统计量位于列上。按Analyze—Reports—ReportSummariesinColumns顺序,打开SummariesinColumns对话框。2019/12/1828SummariesinColumns对话框将要分析的变量选入此框,每选一个变量进入框内,可以单击Format按钮,打开Format对话框(与前同),设置该变量输出格式(其他方面设置见下图)。2019/12/18291、DataColumns栏1)Summary对话框与行形式基本同,不同是只能选择一个统计量2)Format对话框与行形式同3)InsertTotal按钮按Summary按钮,出现Summary对话框(如右)InsertTotal按钮的Summary对话框至少挑选2个参与计算合计的变量,并将其移入右边变量框。在SummariesinColumns对话框中单击InsertTotal按钮,新增Total变量2019/12/18301)Options对话框(见下图)2)Format对话框与“行形式”同3)SortSequence栏:确定分组变量升降排序规则4)Dataarealreadysorted复选框,已将分组变量排序2、BreakColumns栏显示每一类分组变量小计结果,在Label框中键入分组变量的标签在此栏中设置页面:•分组变量间的间距行数,输入值不超过20•每个分组变量都在新的一页输出•在新的一页输出下一个分组变量,并接着上一页顺序编写页码在此栏中设置小计前的空白行数2019/12/18313、Preview复选框:只输出报告的第一页,便于用户预览4、Report栏Options如下图Layout对话框与“行形式”同Titles对话框与“行形式”同Options对话框在每一页的底部显示该列的总和,在Label框中键入