SPSS16实用教程第2章变量、数据文件、系统参数定义变量2.1数据的输入与保存2.2数据的编辑2.3变量的操作2.4数据文件的合并和分组2.5读入其他格式文件数据2.6SPSS运行环境设置2.7SPSS对数据的处理是以变量为前提的,因此本章首先介绍定义变量、输入数据,再介绍保存数据、操作数据文件,最后介绍SPSS运行环境和系统参数的设置。2.1定义变量启动SPSS后,出现如图2-1所示数据编辑窗口。由于目前还没有输入数据,因此显示的是一个空文件。图2-1数据编辑窗口输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。单击数据编辑窗口左下方的“VariableView”标签或双击列的题头(Var),进入如图2-2所示的变量定义视图窗口,在此窗口中即可定义变量。图2-2变量定义视图窗口2.1.1变量的定义信息在图2-2所示的窗口中每一行表示一个变量的定义信息,包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等。1.定义变量名(Name)SPSS默认的变量为Var00001、Var00002等,用户也可以根据自己的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下。变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号。变量最后一个字符不能是句号。变量名总长度不能超过8个字符(即4个汉字)。不能使用空白字符或其他特殊字符(如“!”、“?”等)。变量命名必须惟一,不能有两个相同的变量名。在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名称。图2-3定义变量类型对话框SPSS的保留字(ReservedKeywords)不能作为变量的名称,如ALL、AND、WITH、OR等。2.定义变量类型(Type)单击Type相应单元中的按钮,弹出如图2-3所示的对话框,在对话框中选择合适的变量类型并单击“OK”按钮,即可定义变量类型。图2-3定义变量类型对话框SPSS的主要变量类型如下。NumericCommaDotScientificnotationDateDollarCustomcurrencyString3.变量长度(Width)设置变量的长度,当变量为日期型时无效。4.变量小数点位数(Decimal)设置变量的小数点位数,当变量为日期型时无效。5.变量标签(Label)变量标签是对变量名的进一步描述,变量只能由不超过8个字符组成,而8个字符经常不足以表示变量的含义。而变量标签可长达120个字符,变量标签可显示大小写,需要时可用变量标签对变量名的含义加以解释。6.变量值标签(Values)值标签是对变量的每一个可能取值的进一步描述。7.缺失值的定义方式(Missing)SPSS有两类缺失值:系统缺失值和用户缺失值。单击Missing相应单元中的按钮,在弹出的如图2-5所示的对话框中可改变缺失值的定义方式,在SPSS中有两种定义缺失值的方式。可以定义3个单独的缺失值。可以定义一个缺失值范围和一个单独的缺失值。8.变量的显示宽度(Columns)输入变量的显示宽度,默认为8。9.变量显示的对齐方式(Align)选择变量值显示时的对齐方式:Left(左对齐)、Right(右对齐)、Center(居中对齐)。默认是右对齐。10.变量的测量尺度(Measure)变量按测量精度可以分为定性变量、定序变量、定距变量和定比变量几种。(1)定性变量。(2)定序变量。(3)定距变量。(4)定比变量。2.1.2变量定义信息的复制如果有多个变量的类型相同,可以先定义一个变量,然后把该变量的定义信息复制给新变量。2.2数据的输入与保存2.2.1录入数据的一般方法定义了所有变量后,单击“DataView”标签,即可在出现的数据视图(编辑)窗中输入数据。数据录入时可以逐行录入,也可以逐列。2.2.2录入带有变量值标签的数据在录入带有变量值标签的数据时,用户手工输入的是实际的变量值,而屏幕上显示的是与该变量对应的变量值标签。图2-6选中“ValueLables”的效果2.2.3SPSS数据文件的保存在录入数据时,应及时保存数据,防止数据的丢失,以便再次使用该数据。图2-7保存为另外的数据格式文件用户确定盘符、路径、文件名以及文件格式后单击“Save”按钮,即可保存为指定类型的数据文件。SPSS支持的常见的数据文件存放格式如下。SPSS(*.sav)SPSS/PC+(*.sys)SPSSPortable(*.por)Tabdelimited(*.dat)Commadelimited(*.csv)FixedASCII(*.dat)Excel2.1(*.xls)1-2-3Rel3.0(*.wk3)SYLK(*.slk)dBASE4(*.dbf)dBASEⅢ(*.dbf)dBASEⅡ(*.dbf)SASv6forWindows(*.sd2)2.3数据的编辑2.3.1单元值的修改由于各种原因,已经输入的数据有时会需要修改,这就需要进行编辑,可用方向键或鼠标将黑框移动到要修改的单元,键入新值。图2-8选择行号图2-9查找数据对话框2.3.2增加和删除一个个案(Case)1.增加一个新的个案(即增加一个新的行)2.删除一个个案2.3.3数据的排序在数据文件中,可根据一个或多个排序变量的值重排个案的顺序。图2-10“SortCases”(排序)对话框2.3.4数据的行列互换图2-11“Transpose”对话框2.3.5选取个案子集在数据统计中可从所有资料中选择部分数据进行统计分析。图2-12“SelectCases”对话框系统提供的方式如下。AllcasesIfconditionissatisfiedRandomsampleofcasesBasedontimeorcaserangeUsefiltervariableOutput单选框有三个选项,分别提供如下的输出方式。FilteroutunselectedcasesCopyselectedcasestoanewdatasetDeleteunselectedcases图2-13“SelectCases:If”对话框2.3.6数据分类汇总用户还可对数据编辑器中的数据按指定变量的数值进行归类分组汇总。在SPSS中,实现数据文件的分类汇总需要3个步骤。首先,需要指定分类变量和汇总变量。然后,计算机根据分类变量的若干个不同取值将个案数据分成若干类,并对每类个案计算汇总变量的描述统计量。最后,将分类汇总计算结果保存到一个文件中。分组汇总提供的函数形式主要有以下几种。MeanMedianSumStandarddeviationFirstLast图2-14“AggregateData”对话框图2-15“AggregateData:AggregateFunction”对话框MinimumMaximumWeightedWeightedMissingUnweightedUnweightedMissingNumberofcasesPercentageabovePercentagebelowPercentageinsidePercentageoutsideFractionaboveFractionbelowFractioninsideFractionoutside图2-16结果文件中变量名和标签2.3.7缺失值的替代对于缺失值,可采取多种手段进行科学替代。这里的缺失值必须是系统或用户指定的缺失值。图2-17“ReplaceMissingValues”对话框共有以下几种替代方式。SeriesmeanMeanofnearbypointsMedianofnearbypointsLinearinterpolationLineartrendatpoint2.3.8数据次序确定选择“Transform”菜单中的“RankCases”命令,弹出“RankCases”对话框,如图2-18所示,在该对话框中可以改变数据排序的次序。图2-18“RankCases”对话框图2-19“RankCases:Types”对话框排序类型如下。RankFractionalrankaspercentSavagescoreSumofcaseweightsFractionalrankNtilesProportionestimatesNormalscores2.4.1增加和删除一个变量(Variable)2.4变量的操作1.增加一个变量增加一个变量,即增加一个新的列。可以有多种操作方法,(1)菜单操作法。(2)选中某列法。(3)VariableView标签页法。图2-20选中某列法图2-21VariableView标签页法2.删除一个变量删除一个变量,即删除一列数据。其方法和上面的增加一个变量相对应。例如,要删除第5个变量列,则可先单击第5列的列头,这时整个第5列被选中(呈黑底白字状),然后按“Delete”键或选择“Edit”菜单的“Clear”命令,或者单击鼠标右键,在其快捷菜单中选择“Clear”项,该列即被删除。也可以单击数据编辑窗口左下方的“VariableView”标签或双击列的题头,显示变量定义视图窗口,然后单击要输出变量的行头,这时整个行被选中,然后单击鼠标右键,在其快捷菜单中选择“Clear”项。2.4.2指定加权变量在实际的统计中,经常需要计算数据的加权平均数。例如,希望了解某超市中某天售出商品的平均价格。如果仅以各种商品的单价平均数作为平均价格是不合理的,还应考虑到各商品的销售量对平均价格的影响。因此,以商品的销售量作为权重计算各种商品单价的加权平均数,才是我们需要求的数据。在SPSS处理中就需要将商品销售量作为加权变量。图2-22“WeightCases”对话框2.4.3根据已存在的变量建立新变量在数据统计中,有时候经常需要通过数据转换来提示变量之间的真实关系。这时需要通过对已经存在的变量进行处理,从而生成新的变量。选择“Transform”菜单的“ComputeVariable”项,弹出如图2-23所示的“ComputeVariable”(计算变量)对话框。在该对话框中的“TargetVariable(目标变量)”框中输入符合变量命名规则的变量名,目标变量可以是现存变量或新变量。图2-23“ComputeVariable”(计算变量)对话框图2-24条件表达式对话框2.4.4产生计数变量在统计过程中,往往需要进行一些计数工作。产生计数变量就是实现计数功能,它对所有个案或满足一定条件的个案,计算若干个变量中有几个变量的值落在指定的区间内,并将计数结果放入一个新变量中。图2-25“CountOccurrencesofValueswithinCases”对话框图2-26“CountValueswithinCases:ValuestoCount”对话框图2-27指定条件来确定参与计数的个案图2-28增加了一个计数结果列lj2.4.5变量的重新赋值在数据编辑过程中,用户可对个案的某个变量的数值重新赋予新值。这种操作只适用于数值型变量。在“Transform”菜单中的有“IntoSameVariables”和“IntoDifferentVariables”两种赋值方法供选择。其中“IntoSameVariables”是对变量自身重新赋值;“IntoDifferentVariables”是赋值到其变量或新生成的变量。图2-29“RecodeintoSameVariables”对话框图2-30“RecodeintoSameVariables:OldandNewValues”对话框在上述两种赋值情况下,用户均可通过单击“If”按钮指定条件,来确定参与重新赋值的个案。与前面根据已存在的变