SPSS基础入门基于spss16.0报告人:张淑洁目录CONTENTS数据分析DataAnalysis03注意事项Attentions06结果解读ResultInterpretation05SPSS软件概述SoftwareOverview01数据录入DataInput03SPSS操作入门IntroductiontoOperation022SPSS软件概述SPSS的发展SPSS的特点SPSS的功能3软件概述SPPS的发展4SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,有Windows和MacOSX等版本。最初软件全称为“社会科学统计软件包”(SolutionsStatisticalPackagefortheSocialSciences)但是随着SPSS产品服务领域的扩大和服务深度的增加正式将英文全称更改为“统计产品与服务解决方案”(StatisticalProductandServiceSolutions)软件概述SPPS的发展5•SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织、在芝加哥组建了SPSS总部。•2009年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS已出至版本22.0,而且更名为IBMSPSS。迄今,SPSS公司已有40余年的成长历史。数据录入统计分析SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。结果呈现软件概述SPSS的功能SPSS针对初学者、熟练者及精通者都比较适用。只需要掌握简单的操作分析,大多青睐于SPSS。能够读取及输出多种格式的文件。比如*.dbf文件,ASCⅡ数据文件,*.xls文件等。具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。软件概述SPSS的特点界面非常友好,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成SPSS操作入门8操作入门SPSS的界面数据视图变量视图数据编辑窗口SPSSDataEditor操作入门SPSS的界面结果管理窗口SPSSOutputViewer数据录入数据的直接录入录入的步骤外部数据的获取录入的格式1112数据录入123姓名、性别、成绩...地区、时间、营业额...身高、体重、智力...定义变量名变量名、变量标签值、变量的储存类型、缺失值、变量的测量尺度指定每个变量的各种属性变量名不能与SPSS保留字相同。SPSS的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。录入数据数据录入数据录入的步骤1301第一不同观测对象的数据不能在同一记录中出现,即同一观测数据应当独占一行。02第二每一个测量指标或影响因素只能占据一列的位置,即同一指标的观测值都应当录入到同一个变量中去。数据录入数据录入的格式“一个观测占一行,一个变量占一列”数据录入数据录入的格式•Name:变量名。变量名必须以字母、汉字及@开头,总长度不超过8个字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个字符不能是句号。•Type:变量类型。变量类型有8种,最常用的是Numeric数值型变量。其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数加一个逗号)等。•Width:变量所占的宽度。•Decimals:小数点后位数。•Label:变量标签。关于变量涵义的详细说明。•Values:变量值标签。关于变量各个取值的涵义说明。•Missing:缺失值的处理方式。•Columns:变量在DateView中所显示的列宽(默认列宽为8)。•Align:数据对齐格式(默认为右对齐)。•Measure:数据的测度方式。名义尺度、定序尺度和等间距尺度三种(默认为等间距尺度)。数据录入数据的直接录入示例1,将下面的数据按要求录入到SPSS中姓名性别期末成绩小王男96.5小张女90要求:①姓名:字符型;宽度8;小数点0;列宽8;左对齐;称名变量②性别:数字型;宽度8;小数点0;1代表男,2代表女;列宽8;左对齐;称名变量期末成绩:数字型;宽度10;小数点1;列宽8;右对齐;等比变量数据录入外部数据获取SPSS中可以直接读入许多常用格式的数据文件,选择菜单File→OpenData或直接单击快捷键工具栏上的快捷按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能够看到可以直接打开的数据文件格式。示例2数据分析及结果解读描述性分析相关与回归分析方差分析1718Frequencies:频数分布Descriptives:一般性描述数据分析描述性分析Explore:探索性分析Crosstabs:交叉列表调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存入数据库,所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。它在一般描述性统计指标的基础上,增加有关数据其它特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。调用此过程可进行计数资料和某些等级资料的交叉表分析,在分析中,可对二维至多维交叉表资料进行统计描述和x2检验,并计算相应的百分数。调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。19数据分析描述性分析数据分析描述性分析示例2待分析的变量是否显示频数表定义需要计算的统计量定义需要绘制的统计图频数分布表(Frequencies)定义表格百分位数分布特征描述离散趋势集中趋势Frequencies:定义统计量统计图类型直方图加上正态曲线以频数绘制条图或饼图Frequencies:定义统计图无图形条图饼图直方图以构成比绘制条图或饼图频数表排列次序Frequencies:定义表格按数值升序按数值降序按频数升序按频数降序Frequencies:结果解释Mean均数Std.ErrorofMean标准误Median中位数Mode众数Std.Deviation标准差Variance方差Skewness峰度系数Std.ErrorofSkewness峰度系数的标准误Kurtosis偏度系数Std.ErrorofKurtosis偏度系数的标准误Range全距Minimum最小值Maximum最大值Sum合计Percentiles2525%位数5050%位数7575%位数Frequencies:结果解释FrequencyPercentValidPercentCumulativePercent频数百分比有效百分比累积百分比Frequencies:结果解释是否保存标准变换后的数据一般性描述(Descriptives)Descriptives:定义统计量Descriptives:结果解释Descriptives:结果解释此外,系统以z成绩为变量名将原始数据转换成标准z分值,存放在原数据库中。新变量具有均值为0、标准差为1的特征,亦即变量的标准化过程。探索性分析(Explore)两者均有统计量图分组变量列表待分析变量列表Explore:定义统计量Descriptives:输出均数、均数的95%可信区间、去掉5%极端值的均数、中位数、方差、标准差、最小值、最大值、全距、四分位数间距、偏度系数、峰度系数。M-estimators:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。Outliers:输出五个最大值与五个最小值。Percentiles:输出第5%、10%、25%、50%、75%、90%、95%位数。箱图绘制方式茎叶图正态性检验/正态分布图Explore:定义统计图直方图Excludecaselistwise:不分析有任一缺失值的记录Excludecasepairwise:不分析计算某统计量时有缺失值的记录Reportvalues:报告缺失值缺失值的处理方式Explore:缺失值的处理Explore:结果解释原始数据的基本情况:男性有效数据4,缺失0,合计4;女性有效数据6,缺失0,合计6。Explore:结果解释Explore:结果解释左面为箱图,图中方箱为四分位数,中心粗线为中位数,两端线为最大值与最小值。交叉列表(Crosstabs)行列Crosstabs:定义统计量X2检验Crosstabs:定义交叉表内容实际观察数理论数行百分数列百分数合计百分数残差Crosstabs:结果解释CaseProcessingSummary99999.9%1.1%1000100.0%曾经吸过烟*性别NPercentNPercentNPercentValidMissingTotalCasesCrosstabs:结果解释红底数字为实际观察值;黄底数字为列百分数。曾经吸过烟*性别Crosstabulation10851362123.5%95.2%62.2%2832030361.5%3.7%30.3%6967515.0%1.1%7.5%460539999100.0%100.0%100.0%Count%within性别Count%within性别Count%within性别Count%within性别从来都不吸吸,现在仍在吸以前吸过,现在已经不吸了曾经吸过烟Total男女性别TotalCrosstabs:结果解释Chi-SquareTests542.476a2.000615.6192.000456.3251.000999PearsonChi-SquareLikelihoodRatioLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis34.53.a.数据分析方差分析单因素方差分析•单因变量的单因素方差分析主要解决多于两个总体样本或变量间均值的比较问题。是一种对多个(大于两个)总体样本的均值是否存在显著差异的检验方法。其目的也是对不同的总体的数据的均值之间的差异是否显著进行检验。•单因素方差分析的应用条件:在不同的水平(因素变量取不同值)下,各总体应当服从方差相等的正态分布。示例3,某企业需要一种零件,现有三个不同的地区的企业生产的同种零件可供选择,为了比较这三个零件的强度是否相同,每个地区的企业抽出6件产品进行强度测试,其值如表所示。假设每个企业零件的强度值服从正态分布,试检验这三个地区企业的零件强度是否存在显著差异。解:首先建立假设H0:三个地区的零件强度无显著差异;H1:三个地区的零件强度有显著差异。12311161108929810385310011899411510673583107976105116102•1、单击AnalyzeCompareMeansOne-WayANOVA,打开One-WayANOVA对话框。•2、从左框中选择因变量“零件强度”进入Dependentlist框内,选择因素变量‘地区”进入Factor框内。点击OK就可以得到方差分析下表。•3、单击Option按纽,打开Option对话框如图所示:在Option选项中选择输出项。主要有不同水平下样本方差的齐性检验,缺失值的处理方式及均值的图形。本例中选择Homogeneityofvariancetest进行不同水平间方差齐性的检验以及Descriptive基本统