在数据分析中,经常要根据一些已知的数据变量计算新的变量。例如,根据历年的产量数据资料计算产量的发展速度,根据人口数据计算人口出生率、死亡率等。不仅如此,还需要进行不同类型变量之间的转换,如将数值型变量转化为字符型变量。这些工作都需要利用【Transform(转换)】菜单中的相关命令。变量计算是数据分析中的重要内容之一。有些时候,收集到的原始数据并不能直接提供给我们许多有用的信息,此时,我们需要将原始数据进行计算变换,生成有用的新的变量。例如,根据职工的基本工资、各类保险、公积金等,计算职工的实际月收入;根据购房客户的贷款总额和按揭方案评价客户的潜在风险等。Step01:打开变量计算对话框打开SPSS软件,选择菜单栏中的【File(文件)】→【Transform转换】→【Compute(计算)】命令,弹出【Compute(计算)】对话框。在【TargetVariable(目标变量)】文本框中用户需要定义目标函数名,它可以是一个新变量名,也可以是已经定义的变量名。单击下方的【Type&Label】按钮,弹出类型和标签对话框。可以使用计算器板或键盘将计算表达式输入到【NumericExpression(数值表达式)】文本中。如果用户需要调用函数,可以从右侧的【Function(函数)】列表中选择,系统提供了数学函数、逻辑函数、日期函数等。Step04:条件样本选择单击【If】按钮,弹出的对话框如下图所示。Step05:结束操作单击【OK】按钮,此时操作结束。数据文件2-10.sav为我国1978-2005年国内生产总值、第一产业国内生产总值、第二产业国内生产总值和第三产业国内生产总值,请分析不同产业所占国内生产总值的变动情况。Step02:定义第一产业比重变量在【TargetVariable(目标变量)】文本框中定义目标函数名为“a”,它表示第一产业生产总值所占总产值的比重。Step03:计算第一产业生产总值所占比重在【NumericExpression(数值表达式)】文本框中输入计算表达式“a=第一产业/国内生产总值”。单击【OK(确定)】按钮,操作完成。此时,原数据文件新增加了“a”变量。SPSS的【Transform(转换)】菜单中有【RecodeintoSameVariable(重新编码为相同变量)】和【RecodeintoDifferentVariable(重新编码为不同变量)】两个命令可以实现重新赋值功能,它们分别表示重新赋值到同一变量或不同变量。下面以【RecodeintoDifferentVariable(重新编码为不同变量)】命令为例说明重新赋值功能。Step01:打开重新赋值对话框选择菜单栏中的【File(文件)】→【Transform(转换)】→【RecodeintoDifferentVariable(重新编码为不同变量)】命令,弹出如下图所示的对话框。在候选变量列表框中选择要重新赋值的变量,将其移入【InputVariable-OutputVariable(输入变量-输出变量)】列表框中,同时在【OutputVariable(输出变量)】选项组中填写输出变量的名称【Name(名称)】及标签【Label(标签)】,单击【Change】按钮进行赋值转换。【OldandNewValue】按钮被激活,单击此按钮,弹出如下图所示的对话框。Step04:选择样本赋值如果用户不是对所有的候选变量进行赋值,而是选择其中符合某些条件的变量值进行赋值操作,此时需要单击【If】按钮进行操作。按照具体要求指定观察量的选择条件进行操作。Step05:最后单击【OK】按钮,此时操作结束。下图是我国部分城市2005年空气质量的指标数据(见数据文件2-11.sav),请利用这个规则对不同城市的空气质量等级进行划分。在左侧的候选变量列表框中选择“天数”变量进入【InputVariable-OutputVariable(输入变量-输出变量)】列表框,同时在【OutputVariable(输出变量)】文本框中,填写输出赋值变量名称“等级天数”,同时单击【Change】按钮进行赋值转换。进行上述操作后,单击【OldandNewValue】按钮。数据分析中,常常需要计算一些变量在同一个观测量中满足要求的特定变量值出现的次数。例如在进行产品市场调查时,要了解在所有的调查客户中有多少人使用过该产品,这就可以采用变量值计数功能来实现。Step01:打开重新赋值对话框打开SPSS软件,选择菜单栏中的【File(文件)】→【Transform(转换)】→【CountValueswithinCases(对个案内的值计数)】命令,弹出【CountOccurrencesofValueswithinCases(计算个案内值的出现次数)】对话框。Step02:输入目标计数变量在【TargetVariable(目标变量)】文本框中输入需要计数的变量名称,同时在【TargetLabel(目标标签)】文本框中填写计数变量的标签,便于注释说明。Step03:选择计数变量在左侧的候选变量列表框中选择计数变量,将其移入右侧的【Variables(变量)】列表框中。需要注意,凡移入该列表框的变量必须具有相同的类型,当移入变量为数值型变量时,该栏标题改为“NumberVariables”;当移入变量为字符型变量时,标题改为“StringVariables”。进行上述操作后,【DefineValues】按钮被激活,单击此按钮,弹出如下图所示的对话框。Step05:选择样本计数如果用户不是对所有的候选变量进行计数,而是选择其中符合某些条件的变量值才进行计数操作,此时需要单击【If】按钮,按照具体要求指定观察量的选择条件进行操作。Step06:最后单击【OK】按钮,此时操作结束。我国城市和农村居民消费价格分类指数数据见数据文件2-12.sav。由于不同产品的价格涨跌不同,请找出城市和农村居民消费价格指数都较去年上涨超过1%的项目。在【TargetVariable(目标变量)】文本框中输入需要计数的变量名称“x”,同时在【TargetLabel(目标标签)】文本框中填写标签“增加率”。“秩”(Rank)是数据整理中的重要概念,前面讲解的观测量排序是按照大小顺序重新排列观测量,而观测量求秩是指对观测量排序后指定的“名次”。例如,观测量的值依次为3、5、-2、0、7,它们按小到大排列后为-2、0、3、5、7,各观测量的秩等于3、4、1、2、5。Step01:打开观测量求秩对话框打开SPSS软件,选择菜单栏中的【File(文件)】→【Transform(转换)】→【RankCases(个案排秩)】命令,弹出【RankCases(个案排秩)】对话框。Step02:选择求秩变量在左侧的候选列表框中选择求秩变量,将其移入【Variable(s)(变量)】,此时系统会产生一个新的秩变量,它是在该变量的前面添加“r”而构成。Step03:选择求秩顺序【AssignRank1to(将秩1指定给)】选项组用于指定求秩顺序。Step04:选择分组变量在左侧的候选变量列表框中选择分组变量,将其移入【By(排序标准)】列表框,此时SPSS会按所选的分组变量来求秩,如果不设定本选项,将对所有的观测量排秩。Step05:选择汇总表输出勾选【Displaysummarytables(显示摘要表)】复选框,系统将在输出窗口中显示概况原变量和新变量的摘要信息表。Step06:秩类型选择单击【RankTypes】按钮,在弹出的对话框中可以选择秩的类型。Step07:Ties(结)类型选择单击【Ties】按钮,在弹出的对话框中用户可以选择结类型。Step08:最后单击主对话框中的【OK】按钮,此时操作结束。2005年我国对主要国家(地区)对外直接投资金额(非金融类)的原始数据见数据文件2-13.sav,请按照区域类型不同对投资净额排秩。在左侧的候选变量列表框中选择分组变量“区域”,将其移入【By(排序标准)】列表框,此时SPSS会按它进行分组求秩。