数据分析方法及软件应用--SPSS入门(自学部分)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

SPSS入门——(自学部分)2.2.3SPSS数据的录入、编辑2.2.6SPSS数据文件合并2.3.7数据预处理的其它功能2.4.4多选项分析2.4.5比率分析2.4.6探索性分析2.2SPSS数据的管理2.2.3SPSS数据的录入、编辑•SPSS数据的录入(与Excel类似,自学)•SPSS数据的编辑(与Excel类似,自学)•SPSS数据的定位•插入和删除一条个案•插入和删除一个变量•数据的移动、复制和删除2.2SPSS数据的管理•录入•定义好SPSS数据结构后,可将具体的数据输入到SPSS中,最终形成SPSS数据文件。•SPSS数据的录入操作在数据编辑窗口中的数据视图(DataView)卡片中实现。其操作方法与EXCEL基本类似,也是以电子表格的方式进行录入。2.2SPSS数据的管理•录入带有变量值标签的数据时,可以在下拉按钮中的值标签列表中选择一个作为输入。2.2SPSS数据的管理2.2SPSS数据的管理•SPSS数据的编辑•数据必须输入正确才能保证正确的分析结果。但很难一次输入正确,所以就需要进行修改,一般包括数据的定位、插入、删除、修改、复制等。2.2SPSS数据的管理•SPSS数据的定位•数据的定位目的是将当前数据单元定位到某个特定的单元中。有三种定位方式:1.按个案号码定位:将当前单元格定位在任何单元格中,选择菜单编辑(Edit)转至个案(GotoCase),出现如下对话框,输入欲定位的个案号码并确认。2.按变量号码定位:编辑(Edit)转至变量(GotoVariable)3.按变量值定位:编辑Edit查找Find•将当前单元定位在某变量列的任何一个个案上•选择菜单编辑Edit查找Find,出现如下对话框•输入定位变量值并确认于是,SPSS自动对指定的变量进行搜索,并将当前单元定位于定位变量值相等的第一个个案上。2.2SPSS数据的管理2.2SPSS数据的管理2.2SPSS数据的管理•插入和删除一个个案•插入一个个案,即在数据编辑窗口的某个个案前插入一个新个案:将当前数据单元确定在一个个案上,选择菜单编辑Edit——插入个案InsertCase(或工具栏插入个案图标按钮)•删除一个个案,在欲删除的个案号码上单击鼠标左键,于是待删除的个案数据全部反向显示;单击鼠标右键,从弹出菜单中选择清除cut选项。2.2SPSS数据的管理•插入和删除一个变量•插入一个变量,即在数据编辑窗口的某个变量前插入一个新变量:将当前数据单元确定在一个变量上,选择菜单菜单编辑Edit插入变量InsertVariable•删除一个变量,在欲删除的变量名上单击鼠标左键,于是待删除的数据全部反向显示;单击鼠标右键,从弹出菜单中选择清除cut选项。2.2SPSS数据的管理•数据的移动、复制和删除•数据的移动、复制和删除:与一般的应用程序相同•选择操作对象(变量、个案、若干连续单元等)•剪切:Edit+Cut(Ctrl+X)•复制:Edit+Copy(Ctrl+C)•粘贴:Edit+Paste(Ctrl+V)•恢复删除或修改前数据•Edit+Undo(或工具栏Undo图标按钮)2.2SPSS数据的管理2.2SPSS数据的管理2.2.6SPSS数据文件合并•纵向合并数据文件•横向合并数据文件2.2SPSS数据的管理•当数据量较多时经常会把一份大的数据分成几个小的部分,有几个录入员分别录入,以期加快数据录入速度,但一份完整的数据被分别存储在几个数据文件中,如果要分析这份数据就必须首先将若干个小的数据文件合并起来。要实现两个或多个SPSS数据文件的合并,应首先将其中的某个数据文件读入数据编辑窗口中,然后依次与其他数据文件合并。合并的方式有两种:纵向合并和横向合并。2.2SPSS数据的管理•纵向合并数据文件•从外部数据文件中增加个案到当前数据文件中,称为纵向合并,相互合并的数据文件应该有相同的变量。•步骤:•打开一个数据文件;•菜单:数据Data——合并文件MergeFiles——添加个案AddCases•在弹出窗口中打开一个存在于磁盘上的需要纵合并的文件2.2SPSS数据的管理2.2SPSS数据的管理不同名变量同名变量2.2SPSS数据的管理•注意:有变量的Pair(配对)问题,右边的新的活动数据集中的变量VariablesInnewworkingdatafile框中显示的变量名是两个数据文件中都有的变量名,左边的非成对变量UnpairedVariables框中的变量名是两个文件中的不同变量名,•其中变量名后面的*表示该变量是当前数据编辑窗口中的变量,+表示该变量是待合并文件中的变量。•如果希望在合并后的数据文件中看出个案的来源,可以选择将个案源表示为变量Indicatecasesourceasvariable项将自动生成一个变量名为source01取值0或1的变量。2.2SPSS数据的管理•可选择其中的两个变量名并单击对pair按钮指定配对,表示虽名称不同但数据含义是相同,可合并的数据;也可指定某变量,不经匹配,强行合并。2.2SPSS数据的管理匹配合并后的数据结果2.2SPSS数据的管理•横向合并数据文件•从外部数据文件增加变量到当前数据文件,称为横向合并,横向合并文件时要注意以下三个问题:1.相互合并的数据文件必须至少有一个名称相同的变量,该变量是两文件横向合作的依据,称为关键变量;2.两个数据文件都必须先按关键变量进行升序排列;3.不同数据文件中数据含义不相同的数据项变量名不应相同。2.2SPSS数据的管理•步骤:•打开一个数据文件;•菜单:数据Data——合并文件MergeFiles——添加变量AddVariables•在弹出窗口中打开一个存在于磁盘上的需要横向合并的文件2.2SPSS数据的管理2.2SPSS数据的管理2.2SPSS数据的管理横向合并后的数据结果2.2SPSS数据的管理2.3.7数据预处理的其它功能•计数•数据转置•加权处理•SPSS缺失值处理•数据排秩•SPSS变量集2.2SPSS数据的管理•计数•计数目的•计数区间•计数的基本操作•计数的应用举例2.2SPSS数据的管理•计数目的•SPSS实现的计数是对所有个案或满足某条件的部分个案,计算若干变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新变量中的过程。•例如对大学毕业班学生的成绩进行综合测评时,可以依次计算每个学生的若干门课程中有几门课程得了优,有几门课程得了良,有几门课程不及格。•SPSS实现计数的关键步骤是:•指定哪些变量参与计数,计数的结果存入哪个新变量中•指定计数区间(尤为关键)2.2SPSS数据的管理•计数区间•SPSS中的计数区间可以有以下几种描述形式:•单个变量值(Value)•系统缺失值(System-missing)•系统缺失值或用户缺失值(Systemoruser-missing)•给定最大值和最小值的区间(nthroughm)•小于等于某指定值的区间(Lowestthroughn)•大于等于某指定值的区间(nthroughhighest)2.2SPSS数据的管理•计数的基本操作•居民储蓄调查数据.sav•选择菜单转换Transform——对个案内的值计数Count,出现如下窗口:2.2SPSS数据的管理•将参与计数的变量选到变量(V)NumericVariables框中•在目标变量TargetVariable框中输入存放计数结果的变量名,并在目标标签TargetLabel框中输入相应的变量名标签。•单击定义值DefineValues按钮定义计数区间,出现如下图窗口:2.2SPSS数据的管理2.2SPSS数据的管理•通过单击添加Add、更改Change、删除Remove按钮完成计数区间的增加、修改和删除。•如果仅希望对满足某条件的个案进行计数,则单击如果If按钮并输入相应的SPSS条件表达式。否则,本步可略去。2.2SPSS数据的管理•居民储蓄调查数据.sav2.2SPSS数据的管理•计数的应用举例•利用居民储蓄调查数据分析近些年储户收入的总体状况。我们认为如果储户收入今年比去年增加了,且认为今后收入仍会增加则认为收入状况较好。试分析有多少个储户的收入状况较好。•收入情况为顺序数据,其中1表示增加,2表示基本不变,3表示减少。2.2SPSS数据的管理•思路:从两个变量中分别选出其值为1,即收入增加的,计数为1。若两变量都为1,则计数为2•居民储蓄调查数据.sav2.2SPSS数据的管理结果2.2SPSS数据的管理•数据转置•SPSS的数据转置就是将数据编辑窗口中数据的行列互换。基本操作步骤如下:•选择菜单数据Data——转置Transpose。•指定数据转置后应保留哪些变量,将它们选入变量Variables框中,未被选中的变量将在新文件中缺失。•指定转置后数据文件中各变量如何取名。2.2SPSS数据的管理•注:字符串数据不能转置•应选择一个取值唯一的变量(如职工号)作为标记变量并放到名称变量NameVariable框中。转置后数据各变量取名为K_标记变量值(如K_001、K_002、K_003等)。如果略去本步,则转置后数据各变量名默认为VAR00001,VAR00002,VAR00003等。•同时,SPSS还会自动产生一个名为Case_lbl的新变量,用来存放原数据文件中的各变量名。2.2SPSS数据的管理•应用举例•数据加工(职工数据).sav2.2SPSS数据的管理结果2.2SPSS数据的管理•加权处理•统计分析中的加权处理是极为常见的,如计算加权平均数等。•例如,希望掌握菜市场某天蔬菜销售的平均价格。如果仅用各种蔬菜销售单价的平均数作为平均价格就很不合理,还应考虑到销售量对平均价格的影响。因此,以蔬菜的销售量为权数计算各种蔬菜销售单价的加权平均数,就能够较准确地反应平均价格水平。xfxf2.2SPSS数据的管理•SPSS中指定加权变量的操作步骤是:•选择菜单数据Data——加权个案WeightCases。•选择加权个案WeightCasesby选项,并将某变量作为加权变量选到WeightCasesby框中。•注意的是一旦指定了加权变量,那么以后的分析处理中加权是一直有效的,直到取消加权为止。取消加权应选择请勿对个案加权Donotweightcases选项。2.2SPSS数据的管理•SPSS缺失值处理•大量的缺失值会给数据分析带来极大的影响,这就需要采用科学的方法对缺失值进行插补。操作步骤如下:•选择菜单转置Transform——替换缺失值replacemissingvalues。•将需要插补的变量单击按钮送到新变量NewVariables框中,该变量自动会生成一个新的变量,变量名为原变量名_1•在方法Method中选择插补方法。2.2SPSS数据的管理•Seriesmean:该变量所有非缺失值的均值•Meanofnearbypoints:该变量相邻非缺失值的均值•Medianofnearbypoints:该变量相邻非缺失值的中位数•Linearinterpolation:线性内插法(用缺失值前后两点的中点值做替代,如果前后值有一个是缺失值,则得不到替换值)•Lineartrendatpoint:用线性拟合方式确定替代值,自变量为1-n的数值。2.2SPSS数据的管理结果2.2SPSS数据的管理•数据排秩•数据排秩是根据某变量观测值的大小,按一定的顺序排秩,生成一个代表其秩次的新变量,但原始观测值本身顺序不发生改变。操作步骤如下:•选择菜单转置Transform——个案排秩rankcases•将需要排秩的变量单击按钮送到变量Variables框中,该变量自动会生成一个新的变量,变量名为R+原变量名;可选择分类变量到排序标准By框中,如果选择,系统将按照此变量的不同组别分别进行排秩。•选择将秩指定给AssignRank1to下面的复选框选择排秩的顺序。•在秩的类型RankTypes对话框中选择排秩方式;在结Ties对话框中选择相同观测值排秩方式。2.2SPSS数据的管理•应用举例•数据加工(职工数据).sav2.2

1 / 118
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功