1/16实验三SPSS初步【实验项目】419023003-03【实验说明】SPSS是世界上最早的统计分析软件。1968年美国斯坦福大学的三位研究生NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent研究开发成功,最初软件全称为“社会科学统计软件包”(SolutionsStatisticalPackagefortheSocialSciences)。1975年在芝加哥组建了SPSS总部。1984年首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,并很快地被应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。2000年SPSS公司战略方向做出重大调整,将英文全称更改为“统计产品与服务解决方案”(StatisticalProductandServiceSolutions)。2009年SPSS公司重新包装旗下的SPSS产品线,定位为“预测统计分析软件”(PASW:PredictiveAnalyticsSoftware)。2010年SPSS公司被IBM公司收购,所有产品不再以PASW为名,统一更名为IBMSPSS,并于每年的8月发布新版本,目前最新版本为2013年8月发布的IBMSPSSStatistics22.0。SPSS是世界上最早采用图形菜单驱动界面的统计软件,操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,有专门的绘图系统,可以根据数据绘制各种图形。存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。SPSSforWindows是一个组合式软件包,它集数据录入、整理、分析功能于一身。其基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。【实验目的与要求】本实验主要介绍IBMSPSS软件的界面、数据文件管理基本功能(包括设置文件结构、新建数据文件、读取外部数据文件、数据编辑、数据保存、数据排序、数据筛选等)、数据分析基本功能(此处主要指数据的描述统计)。2/16【实验内容】1、熟悉SPSS软件的界面、数据文件管理的基本方法以及软件的基本功能2、掌握SPSS中数据文件的基本操作(包括新建数据文件、读取外部数据文件、数据文件编辑、保存、排序、筛选等)、SPSS中描述统计工具的使用方法【实验步骤】一、SPSS基础1、主界面图3.1SPSS主界面(数据视图界面)菜单栏:包括11个菜单项,如文件、编辑、视图、数据、转换、分析、直销、图形、实用程序、窗口、帮助等。通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。工具栏:为了方便用户操作,SPSS软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。如果用户对系统预设的工具栏设置不满意,也可以用[视图]→[工具栏]→[设定]命令对工具栏按钮进行定义。编辑栏:可以输入数据,以使它显示在内容区指定的方格里。变量名栏:列出了数据文件中所包含变量的变量名。观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。状态栏:用于说明显示SPSS当前的运行状态。2、数据文件管理菜单栏工具栏编辑栏观测序号变量名栏窗口切换标签状态栏3/162.1SPSS数据文件结构SPSS数据文件由数据的结构和数据的内容两部分构成,数据文件中的一列数据称为一个变量,一行数据称为一条个案或观测量(Case)。一个典型的SPSS数据文件如表3.1所示。表3.1SPSS数据文件结构2.2SPSS变量的属性在SPSS数据编辑窗口中单击“变量视图”标签,进入变量视图界面(图3.2所示)即可对变量的各个属性进行设置。图3.2变量视图界面SPSS中的变量共有11个属性,分别是名称(Name)、类型(Type)、变量格式宽度(Width)、小数点位数(Decimals)、变量名称标签(Label)、变量值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)、度量标准(Measure)和角色(Role)等。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。○1变量名称:变量名称是变量存取的唯一标志。在定义SPSS数据属性时,应首先给出每列变量的变量名。变量命名应遵循下列基本规则:●SPSS变量长度不能超过64个字符(32个汉字);●首字母必须是字母或汉字;4/16●变量名的结尾不能是圆点、句号或下划线;●变量名必须是唯一的;●变量名不区分大小写;●SPSS的保留字不能作为变量名,例如ALL、NE、EQ和AND等;●如果用户不指定变量名,SPSS软件会以“VAR”开头来命名变量,后面跟5个数字,如VAR00001、VAR00019等。注意:为了方便记忆,用户所取的变量名最好与其代表的数据含义相对应。○2变量类型SPSS中的变量类型共有8种(图3.3),在变量对话框中单选每一种类型,出现相应的设置选项,如数值型...、逗号型...、点型..、科学计数法型......变量需要设置“宽度”和“小数位”;日期型...、美元型...和设定货币型.....需要选择相应的表达形式;字符串...需要设置字符串的长度,如果字符串的实际长度大于设定的长度,多余的字符将不会显示。另外一个中文字符相当于两个英文字符。图3.3“变量类型”对话框○3变量格式宽度:在数据窗口中变量列所占的单元格的列宽度,一般用户采用系统默认选项即可。值得注意的是,如果变量宽度大于变量格式宽度,数据窗口中显示变量名的字符数不够,变量名将被截去尾部作不完全显示,被截去的部分用“*”号代替。○4变量小数位数:文本框可以设置变量的小数位数,系统默认为两位。○5变量名称标签:变量名标签是对变量名含义的进一步解释说明,可以增强变量名的可视性和统计分析结果的可读性,特别是在处理大规模数据时,变量数目繁多,对每个变量的含义加以标注,有利于用户弄清每个变量代表的实际含义。变量名标签可用中文,总长度可达120个字符。○6变量值标签:变量值标签是对变量的可能的取值的含义进行进一步说明,对于数值型变量表示非数值5/16型变量时尤其有用。○7缺失值:在统计分析中,收集到的数据可能会出现这样的情况:一是数据中出现明显的错误或不合理的情形;另一种是有些数据项的数据漏填了。○8数据列的显示宽度栏:主要用于定义列宽,单击其向上和向下的箭头按钮选定列宽度。系统默认宽度等于8。○9变量对齐方式:主要用于定义变量对齐方式,用户可以选择Left(左对齐)、Right(右对齐)和Center(居中对齐)。系统默认变量右对齐。○10度量标准:主要用于定义变量的测度水平,用户可以选择名义、序号、度量等。○11角色:主要用于定义变量在后续统计分析中的功能作用,用户可以选择输入、目标、两者都、无、分区和拆分等类型的角色。二、数据文件操作本实验以教材P49表3.1.2“甘肃省各气象站纬度、海拔及降水量与蒸发量(多年平均)”为例说明SPSS中数据的基本操作方法。操作步骤1、创建一个数据文件数据文件的创建分成三个步骤:○1.选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入主界面(数据视图界面)。○2单击左下角【变量视图】标签进入变量视图界面,根据数据结构定义每个变量属性(图3.4)。图3.4定义变量属性○3变量定义完成以后,单击【数据视图】标签进入主界面,将每个具体的变量值录入数据库单元格内(图3.5)。6/16图3.5数据录入后的表格(部分)2、读取外部数据(以读取Excel格式数据为例)○1按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择“Excel(*.xls,*.xlsx,*.xlsm,)”,如图3.6所示。图3.6“打开数据”对话框,选择Excel格式数据○2选择文件“实验3-1气象台站地理位置及多年平均降水量与蒸发量.xls”,在“打开Excel数据源”对话框中,进行相应的选择(图3.7),其中在“工作表”下拉列表选择被读取数据所在的Excel工作表,在“范围”输入框输入被读取数据在Excel工作表中的位置,若非需要,“范围”和“字符串列的最大宽度”选择默认值。图3.7“打开Excel数据源”对话框○3打开的Excel表格数据如图3.8所示,点击“变量视图”,查看表格数据的变量属性(图3.9)。7/16图3.8打开的Excel表格数据(数据视图)图3.9打开的Excel表格数据的变量属性(变量视图)3、数据编辑对数据进行基本编辑操作的功能集中在“编辑”和“数据”菜单中。如在“编辑”菜单中可以进行“插入变量”、“插入个案”等操作,在“选项”还可以自定义用户界面的语言。4、数据保存数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。在数据保存对话框(图3.10)中根据不同要求进行SPSS数据保存。图3.10数据保存对话框8/165、数据整理数据整理的功能主要集中在“数据”和“转换”两个主菜单下,现介绍“数据排序”和“数据筛选”两种操作,其他功能的可以自行操作。5.1数据排序对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览,基本操作说明如下:选择菜单【数据】→【排列个案】,打开“排序个案”对话框(图3.11),设置“排序依据”变量、“排序顺序”,点击“确定”后得到排序结果(图3.12)图3.11“排序个案”对话框图3.12排序结果(部分)(思考:Excel和SPSS进行排序操作的不同点)5.2数据抽样或筛选在统计分析中,有时不需要对所有的观测进行分析,而可能只对某些特定的对象有兴趣。利用SPSS的“选择个案”命令可以实现样本筛选的功能。○1选择菜单【数据】→【选择个案】,打开“选择个案”对话框(图3.13),在“选择”项下设置筛选条件。9/16图3.13“选择个案”对话框○2本实验拟对“年降水量≥500”的站点进行筛选:选择“如果条件满足”,点击“如果(I)…”按钮,在“选择个案:If”对话框(图3.14)中将左侧边栏中的变量“年降水量”通过箭头加到右上输入框,并通过点击红色方框中的相应按钮,输入如图3.14中的条件公式,其他项默认,点击“继续”按钮,回到“选择个案”对话框(图3.15),此时设置的条件出现在相应的位置。图3.14“选择个案:If”对话框10/16○3在设置条件后的“选择个案”对话框(图3.15)的“输出”项中可以选择“过滤掉未选定的个案”、“将选定个案复制到新数据集”、“删除未选定个案”三者之一。本实验选择第一个选项。图3.1