SPSS统计与分析统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。常见的统计软件有SAS,SPSS,MINITAB,EXCEL等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS和SPSS是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS在各类院校以及科研机构中更为流行。SPSS(StatisticalProductandServiceSolutions,意为统计产品与服务解决方案)。自20世纪60年代SPSS诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSSforWindows大同小异,在本试验课程中我们选择PASWStatistics18.0作为统计分析应用试验活动的工具。1.SPSS的运行模式SPSS主要有三种运行模式:(1)批处理模式这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSSforWindows]→[ProductionModeFacility]程序运行。(2)完全窗口菜单运行模式这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。(3)程序运行模式这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。2.SPSS的启动(1)在windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS12.0forWindows”即可启动SPSS软件,进入SPSSforWindows对话框,如图1.1,图1.2所示。2图1.1SPSS启动图1.1PASWStatistics启动对话框3.SPSS软件的退出SPSS软件的退出方法与其他Windows应用程序相同,有两种常用的退出方法:♦按File→Exist的顺序使用菜单命令退出程序。♦直接单击SPSS窗口右上角的“关闭”按钮,回答系统提出的是否存盘的问题之后即可安全退出程序。4.SPSS的主要窗口介绍3SPSS软件运行过程中会出现多个界面,各个界面用处不同。其中,昀主要的界面有三个:数据编辑窗口、结果输出窗口和语句窗口。(1)数据编辑窗口启动SPSS后看到的第一个窗口便是数据编辑窗口,如图1.3所示。在数据编辑窗口中可以进行数据的录入、编辑以及变量属性的定义和编辑,是SPSS的基本界面。主要由以下几部分构成:标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。图1.3数据浏览界面♦标题栏:显示数据编辑的数据文件名。♦菜单栏:通过对这些菜单的选择,用户可以进行几乎所有的SPSS操作。关于菜单的详细的操作步骤将在后续实验内容中分别介绍。为了方便用户操作,SPSS软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,如果用户对系统预设的工具栏设置不满意,也可以用[视图]→[工具栏]→[设定]命令对工具栏按钮进行定义。♦编辑栏:可以输入数据,以使它显示在内容区指定的方格里。♦变量名栏:列出了数据文件中所包含变量的变量名菜单栏工具栏编辑栏观测序号变量名栏窗口切换标签状态栏标题栏4♦观测序号:列出了数据文件中的所有观测值。观测的个数通常与样本容量的大小一致。♦窗口切换标签:用于“数据视图”和“变量视图”的切换。即数据浏览窗口与变量浏览窗口。数据浏览窗口用于样本数据的查看、录入和修改。变量浏览窗口用于变量属性定义的输入和修改。♦状态栏:用于说明显示SPSS当前的运行状态。SPSS被打开时,将会显示“PASWStatisticsProcessor”的提示信息。(2)结果输出窗口在SPSS中大多数统计分析结果都将以表和图的形式在结果观察窗口中显示。窗口右边部分显示统计分析结果,左边是导航窗口,用来显示输出结果的目录,可以通过单击目录来展开右边窗口中的统计分析结果。当用户对数据进行某项统计分析,结果输出窗口将被自动调出。当然,用户也可以通过双击后缀名为.spo的SPSS输出结果文件来打开该窗口。试验1数据文件管理一、试验目的与要求通过本试验项目,使学生理解并掌握SPSS软件包有关数据文件创建和整理的基本操作,学习如何将收集到的数据输入计算机,建成一个正确的SPSS数据文件,并掌握如何对原始数据文件进行整理,包括数据查询,数据修改、删除,数据的排序等等。二、试验原理SPSS数据文件是一种结构性数据文件,由数据的结构和数据的内容两部分构成,也可以说由变量和观测两部分构成。一个典型的SPSS数据文件如表2.1所示。表2.1SPSS数据文件结构姓名性别年龄…张三145…李四223………………………王五245…SPSS变量的属性SPSS中的变量共有10个属性,分别是变量名(Name)、变量类型(Type)、长度(Width)、小数点位置(Decimals)、变量名标签(Label)、变量名值标签(Value)、缺失值(Missing)、数据列的显示宽度(Columns)、对其方式(Align)和度量尺度(Measure)。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以暂时采用系统默认值,待以后分析过程中如果有需要再对其进行设置。在spss数据编辑窗口中单击“变量视窗”标签,进入变量视窗界面(如图2.1所示)即可对变量的各个属性进行设置。观测变量数据内容6图2.1变量视窗三、试验内容与步骤1.创建一个数据文件数据文件的创建分成三个步骤:(1)选择菜单【文件】→【新建】→【数据】新建一个数据文件,进入数据编辑窗口。窗口顶部标题为“PASWStatistics数据编辑器”。(2)单击左下角【变量视窗】标签进入变量视图界面,根据试验的设计定义每个变量类型。(3)变量定义完成以后,单击【数据视窗】标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。2.读取外部数据当前版本的SPSS可以很容易地读取Excel数据,步骤如下:(1)按【文件】→【打开】→【数据】的顺序使用菜单命令调出打开数据对话框,在文件类型下拉列表中选择数据文件,如图2.2所示。7图2.2OpenFile对话框(2)选择要打开的Excel文件,单击“打开”按钮,调出打开Excel数据源对话框,如图2.3所示。对话框中各选项的意义如下:工作表下拉列表:选择被读取数据所在的Excel工作表。范围输入框:用于限制被读取数据在Excel工作表中的位置。图2.3OpenExcelDataSource对话框83.数据编辑在SPSS中,对数据进行基本编辑操作的功能集中在Edit和Data菜单中。4.SPSS数据的保存SPSS数据录入并编辑整理完成以后应及时保存,以防数据丢失。保存数据文件可以通过【文件】→【保存】或者【文件】→【另存为】菜单方式来执行。在数据保存对话框(如图2.5所示)中根据不同要求进行SPSS数据保存。图2.5SPSS数据的保存5.数据整理在SPSS中,数据整理的功能主要集中在【数据】和【转换】两个主菜单下。(1)数据排序(SortCase)对数据按照某一个或多个变量的大小排序将有利于对数据的总体浏览,基本操作说明如下:♦选择菜单【数据】→【排列个案】,打开对话框,如图2.7所示。(2)抽样(SelectCase)在统计分析中,有时不需要对所有的观测进行分析,而可能只对某些特定的对象有兴趣。利用SPSS的SelectCase命令可以实现这种样本筛选的功能。以SPSS安装配套数据文件Growthstudy.sav为例,选择年龄大于10的观测,基本操作说明9图2.7排列个案对话框如下:♦打开数据文件Growthstudy.sav,选择【数据】→【选择个案】命令,打开对话框,如图2.8图2.8选择个案对话框♦指定抽样的方式:【全部个案】不进行筛选;【如果条件满足】按指定条件进行筛选。本例设置:产品数量150,如图2.9所示;10图2.9选择个案对话框设置完成以后,点击continue,进入下一步。♦确定未被选择的观测的处理方法,这里选择默认选项【过滤掉未选定的个案】。♦单击ok进行筛选,结果如图2.10图2.10选择个案的结果(3)增加个案的数据合并(【合并文件】→【添加个案】)将新数据文件中的观测合并到原数据文件中,在SPSS中实现数据文件纵向合并的方法如下:11选择菜单【数据】→【合并文件】→【添加个案】,如图2.11,选择需要追加的数据文件,单击打开按钮,弹出AddCases对话框,如图2.12。图2.11选择个体数据来源的文件图2.12选择变量12(4)增加变量的数据合并(【合并文件】→【添加变量】)增加变量时指把两个或多个数据文件实现横向对接。例如将不同课程的成绩文件进行合并,收集来的数据被放置在一个新的数据文件中。在SPSS中实现数据文件横向合并的方法如下:选择菜单【数据】→【合并文件】→【添加变量】,选择合并的数据文件,单击“打开”,弹出添加变量,如图2.12所示。图2.12♦单击Ok执行合并命令。这样,两个数据文件将按观测的顺序一对一地横向合并。(5)数据拆分(SplitFile)在进行统计分析时,经常要对文件中的观测进行分组,然后按组分别进行分析。例如要求按性别不同分组。在SPSS中具体操作如下:♦选择菜单【数据】→【分割文件】,打开对话框,如图2.13所示。13图2.13分割文件对话框♦选择拆分数据后,输出结果的排列方式,该对话框提供了3种方式:对全部观测进行分析,不进行拆分;在输出结果种将各组的分析结果放在一起进行比较;按组排列输出结果,即单独显示每一分组的分析结果。♦选择分组变量♦选择数据的排序方式♦单击ok按钮,执行操作(6)计算新变量在对数据文件中的数据进行统计分析的过程中,为了更有效地处理数据和反映事务的本质,有时需要对数据文件中的变量加工产生新的变量。比如经常需要把几个变量加总或取加权平均数,SPSS中通过【计算】菜单命令来产生这样的新变量,其步骤如下:♦选择菜单【转换】→【计算变量】,打开对话框,如图2.14所示。14图2.14ComputeVariable对话框♦在目标变量输入框中输入生成的新变量的变量名。单击输入框下面类型与标签按钮,在跳出的对话框中可以对新变量的类型和标签进行设置。♦在数字表达式输入框中输入新变量的计算表达式。例如“年龄20”。♦单击【如果】按钮,弹出子对话框,如图2.15所示。包含所有个体:对所有的观测进行计算;如果个案满足条件则包括:仅对满足条件的观测进行计算。♦单击Ok按钮,执行命令,则可以在数据文件中看到一个新生成的变量。15图2.15如果…子对话框四、备择试验某航空公司38名职员性别和工资情况的调查数据,如表2.3所示,试在SPSS中进行如下操作:(1)将数据输入到SPSS的数据编辑窗口中,将gender定义为字符型变量,将salary定义为数值型变量,并保存数据文件,命名为“试验1-1.sav”。(2)插入一个变量income,定义为数值型变量。(3)将数据文件按性别分组(4)查找工资大于40000美元的职工(5)当工资大于40000美元时,职工的奖金是工资的20%;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入=工资+奖金,计算所有职工的实际收入,并添加到income变量中。表2.3某航空公司38名职员情况的调查数据表IdGenderSalaryIdGenderSalary1M$5700020F$26250162M$4020021F$388503F$2145022M$217504F$2190023F$240005M$45000