数据分析方法及软件应用--SPSS入门(自学部分)

n80
3 ℃
2019-12-25

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

SPSS入门——(自学部分)2.2.3SPSS数据的录入、编辑2.2.6SPSS数据文件合并2.3.7数据预处理的其它功能2.4.4多选项分析2.4.5比率分析2.4.6探索性分析2.2SPSS数据的管理2.2.3SPSS数据的录入、编辑•SPSS数据的录入(与Excel类似，自学)•SPSS数据的编辑(与Excel类似，自学)•SPSS数据的定位•插入和删除一条个案•插入和删除一个变量•数据的移动、复制和删除2.2SPSS数据的管理•录入•定义好SPSS数据结构后，可将具体的数据输入到SPSS中，最终形成SPSS数据文件。•SPSS数据的录入操作在数据编辑窗口中的数据视图(DataView)卡片中实现。其操作方法与EXCEL基本类似，也是以电子表格的方式进行录入。2.2SPSS数据的管理•录入带有变量值标签的数据时，可以在下拉按钮中的值标签列表中选择一个作为输入。2.2SPSS数据的管理2.2SPSS数据的管理•SPSS数据的编辑•数据必须输入正确才能保证正确的分析结果。但很难一次输入正确，所以就需要进行修改，一般包括数据的定位、插入、删除、修改、复制等。2.2SPSS数据的管理•SPSS数据的定位•数据的定位目的是将当前数据单元定位到某个特定的单元中。有三种定位方式：1.按个案号码定位：将当前单元格定位在任何单元格中，选择菜单编辑(Edit)转至个案(GotoCase)，出现如下对话框，输入欲定位的个案号码并确认。2.按变量号码定位:编辑(Edit)转至变量(GotoVariable)3.按变量值定位：编辑Edit查找Find•将当前单元定位在某变量列的任何一个个案上•选择菜单编辑Edit查找Find，出现如下对话框•输入定位变量值并确认于是，SPSS自动对指定的变量进行搜索，并将当前单元定位于定位变量值相等的第一个个案上。2.2SPSS数据的管理2.2SPSS数据的管理2.2SPSS数据的管理•插入和删除一个个案•插入一个个案，即在数据编辑窗口的某个个案前插入一个新个案：将当前数据单元确定在一个个案上，选择菜单编辑Edit——插入个案InsertCase(或工具栏插入个案图标按钮）•删除一个个案，在欲删除的个案号码上单击鼠标左键，于是待删除的个案数据全部反向显示；单击鼠标右键，从弹出菜单中选择清除cut选项。2.2SPSS数据的管理•插入和删除一个变量•插入一个变量，即在数据编辑窗口的某个变量前插入一个新变量：将当前数据单元确定在一个变量上，选择菜单菜单编辑Edit插入变量InsertVariable•删除一个变量，在欲删除的变量名上单击鼠标左键，于是待删除的数据全部反向显示；单击鼠标右键，从弹出菜单中选择清除cut选项。2.2SPSS数据的管理•数据的移动、复制和删除•数据的移动、复制和删除：与一般的应用程序相同•选择操作对象（变量、个案、若干连续单元等）•剪切：Edit+Cut(Ctrl+X)•复制：Edit+Copy(Ctrl+C)•粘贴：Edit+Paste(Ctrl+V)•恢复删除或修改前数据•Edit+Undo(或工具栏Undo图标按钮）2.2SPSS数据的管理2.2SPSS数据的管理2.2.6SPSS数据文件合并•纵向合并数据文件•横向合并数据文件2.2SPSS数据的管理•当数据量较多时经常会把一份大的数据分成几个小的部分，有几个录入员分别录入，以期加快数据录入速度，但一份完整的数据被分别存储在几个数据文件中，如果要分析这份数据就必须首先将若干个小的数据文件合并起来。要实现两个或多个SPSS数据文件的合并，应首先将其中的某个数据文件读入数据编辑窗口中，然后依次与其他数据文件合并。合并的方式有两种：纵向合并和横向合并。2.2SPSS数据的管理•纵向合并数据文件•从外部数据文件中增加个案到当前数据文件中，称为纵向合并，相互合并的数据文件应该有相同的变量。•步骤：•打开一个数据文件；•菜单：数据Data——合并文件MergeFiles——添加个案AddCases•在弹出窗口中打开一个存在于磁盘上的需要纵合并的文件2.2SPSS数据的管理2.2SPSS数据的管理不同名变量同名变量2.2SPSS数据的管理•注意：有变量的Pair(配对)问题，右边的新的活动数据集中的变量VariablesInnewworkingdatafile框中显示的变量名是两个数据文件中都有的变量名，左边的非成对变量UnpairedVariables框中的变量名是两个文件中的不同变量名，•其中变量名后面的*表示该变量是当前数据编辑窗口中的变量，+表示该变量是待合并文件中的变量。•如果希望在合并后的数据文件中看出个案的来源，可以选择将个案源表示为变量Indicatecasesourceasvariable项将自动生成一个变量名为source01取值0或1的变量。2.2SPSS数据的管理•可选择其中的两个变量名并单击对pair按钮指定配对，表示虽名称不同但数据含义是相同，可合并的数据；也可指定某变量，不经匹配，强行合并。2.2SPSS数据的管理匹配合并后的数据结果2.2SPSS数据的管理•横向合并数据文件•从外部数据文件增加变量到当前数据文件，称为横向合并，横向合并文件时要注意以下三个问题：1.相互合并的数据文件必须至少有一个名称相同的变量，该变量是两文件横向合作的依据，称为关键变量；2.两个数据文件都必须先按关键变量进行升序排列；3.不同数据文件中数据含义不相同的数据项变量名不应相同。2.2SPSS数据的管理•步骤：•打开一个数据文件；•菜单：数据Data——合并文件MergeFiles——添加变量AddVariables•在弹出窗口中打开一个存在于磁盘上的需要横向合并的文件2.2SPSS数据的管理2.2SPSS数据的管理2.2SPSS数据的管理横向合并后的数据结果2.2SPSS数据的管理2.3.7数据预处理的其它功能•计数•数据转置•加权处理•SPSS缺失值处理•数据排秩•SPSS变量集2.2SPSS数据的管理•计数•计数目的•计数区间•计数的基本操作•计数的应用举例2.2SPSS数据的管理•计数目的•SPSS实现的计数是对所有个案或满足某条件的部分个案，计算若干变量中有几个变量的值落在指定的区间内，并将计数结果存入一个新变量中的过程。•例如对大学毕业班学生的成绩进行综合测评时，可以依次计算每个学生的若干门课程中有几门课程得了优，有几门课程得了良，有几门课程不及格。•SPSS实现计数的关键步骤是：•指定哪些变量参与计数，计数的结果存入哪个新变量中•指定计数区间（尤为关键）2.2SPSS数据的管理•计数区间•SPSS中的计数区间可以有以下几种描述形式：•单个变量值（Value）•系统缺失值（System-missing）•系统缺失值或用户缺失值（Systemoruser-missing）•给定最大值和最小值的区间（nthroughm）•小于等于某指定值的区间（Lowestthroughn）•大于等于某指定值的区间（nthroughhighest）2.2SPSS数据的管理•计数的基本操作•居民储蓄调查数据.sav•选择菜单转换Transform——对个案内的值计数Count，出现如下窗口：2.2SPSS数据的管理•将参与计数的变量选到变量(V)NumericVariables框中•在目标变量TargetVariable框中输入存放计数结果的变量名，并在目标标签TargetLabel框中输入相应的变量名标签。•单击定义值DefineValues按钮定义计数区间，出现如下图窗口：2.2SPSS数据的管理2.2SPSS数据的管理•通过单击添加Add、更改Change、删除Remove按钮完成计数区间的增加、修改和删除。•如果仅希望对满足某条件的个案进行计数，则单击如果If按钮并输入相应的SPSS条件表达式。否则，本步可略去。2.2SPSS数据的管理•居民储蓄调查数据.sav2.2SPSS数据的管理•计数的应用举例•利用居民储蓄调查数据分析近些年储户收入的总体状况。我们认为如果储户收入今年比去年增加了，且认为今后收入仍会增加则认为收入状况较好。试分析有多少个储户的收入状况较好。•收入情况为顺序数据，其中1表示增加，2表示基本不变，3表示减少。2.2SPSS数据的管理•思路:从两个变量中分别选出其值为1,即收入增加的，计数为1。若两变量都为1，则计数为2•居民储蓄调查数据.sav2.2SPSS数据的管理结果2.2SPSS数据的管理•数据转置•SPSS的数据转置就是将数据编辑窗口中数据的行列互换。基本操作步骤如下：•选择菜单数据Data——转置Transpose。•指定数据转置后应保留哪些变量，将它们选入变量Variables框中，未被选中的变量将在新文件中缺失。•指定转置后数据文件中各变量如何取名。2.2SPSS数据的管理•注:字符串数据不能转置•应选择一个取值唯一的变量（如职工号）作为标记变量并放到名称变量NameVariable框中。转置后数据各变量取名为K_标记变量值（如K_001、K_002、K_003等）。如果略去本步，则转置后数据各变量名默认为VAR00001，VAR00002，VAR00003等。•同时，SPSS还会自动产生一个名为Case_lbl的新变量，用来存放原数据文件中的各变量名。2.2SPSS数据的管理•应用举例•数据加工(职工数据).sav2.2SPSS数据的管理结果2.2SPSS数据的管理•加权处理•统计分析中的加权处理是极为常见的，如计算加权平均数等。•例如，希望掌握菜市场某天蔬菜销售的平均价格。如果仅用各种蔬菜销售单价的平均数作为平均价格就很不合理，还应考虑到销售量对平均价格的影响。因此，以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数，就能够较准确地反应平均价格水平。xfxf2.2SPSS数据的管理•SPSS中指定加权变量的操作步骤是：•选择菜单数据Data——加权个案WeightCases。•选择加权个案WeightCasesby选项，并将某变量作为加权变量选到WeightCasesby框中。•注意的是一旦指定了加权变量，那么以后的分析处理中加权是一直有效的，直到取消加权为止。取消加权应选择请勿对个案加权Donotweightcases选项。2.2SPSS数据的管理•SPSS缺失值处理•大量的缺失值会给数据分析带来极大的影响，这就需要采用科学的方法对缺失值进行插补。操作步骤如下：•选择菜单转置Transform——替换缺失值replacemissingvalues。•将需要插补的变量单击按钮送到新变量NewVariables框中，该变量自动会生成一个新的变量，变量名为原变量名_1•在方法Method中选择插补方法。2.2SPSS数据的管理•Seriesmean:该变量所有非缺失值的均值•Meanofnearbypoints：该变量相邻非缺失值的均值•Medianofnearbypoints：该变量相邻非缺失值的中位数•Linearinterpolation：线性内插法（用缺失值前后两点的中点值做替代，如果前后值有一个是缺失值，则得不到替换值）•Lineartrendatpoint：用线性拟合方式确定替代值，自变量为1-n的数值。2.2SPSS数据的管理结果2.2SPSS数据的管理•数据排秩•数据排秩是根据某变量观测值的大小，按一定的顺序排秩，生成一个代表其秩次的新变量，但原始观测值本身顺序不发生改变。操作步骤如下：•选择菜单转置Transform——个案排秩rankcases•将需要排秩的变量单击按钮送到变量Variables框中，该变量自动会生成一个新的变量，变量名为R+原变量名；可选择分类变量到排序标准By框中，如果选择，系统将按照此变量的不同组别分别进行排秩。•选择将秩指定给AssignRank1to下面的复选框选择排秩的顺序。•在秩的类型RankTypes对话框中选择排秩方式；在结Ties对话框中选择相同观测值排秩方式。2.2SPSS数据的管理•应用举例•数据加工(职工数据).sav2.2