第4章 文件级别的数据管理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第4章文件级别的数据管理2013.10“数据”菜单中的项目:简单命令:插入变量、插入个案、到达某条个案、复制数据集等。常用的简单过程:排序个案、分割文件、选择个案、个案加权和分类汇总。数据重组向导:长型和宽型格式数据互换文件合并向导:添加个案与添加变量与数据字典有关的功能:定义变量属性与复制数据属性与数据准备有关的功能:重复个案与异常个案查找向导与统计模型密切相关的过程其他过程:定义多重响应集4.1几个常用过程4.1.1排序个案“排序个案”(SortCases)排序个案是将数据按照指定的某一个或多个变量值的升序或降序重新排列;排序变量:用户指定的变量;对所有记录进行排序;对记录进行分组排序,如分性别排序;单变量排序和多变量排序;多变量优先排序;同时设置升序、降序;原数据排列次序变化问题。4.1.2分割文件“拆分文件”(SplitFile);分割文件是将数据文件分组进行处理,可通过拆分数据集实现;数据集拆分后,状态栏显示“拆分文件time”(SplitOn);取消拆分。4.1.3选择个案“选择个案”(SelectCases)选择个案是对部分数据进行分析;选择后状态栏显示“筛选范围”(FilterOn)取消选择。4.1.4加权个案“加权个案”(WeightCases)枚举格式和频数格式;权重变量选择后状态栏显示“加权范围”(WeightOn)取消加权。4.1.5分类汇总“分类汇总”(Aggregate)分类汇总是按照指定的分类变量对观测值进行分组,求出指定的描述统计量,结果可存入新数据文件,也可替换当前数据文件;分类汇总三步骤:指定分类变量和汇总变量;分类并计算;结果保存;分类汇总产生的记录数和多重分类汇总。例4.1按time月份和s0城市对index1进行分类汇总,并将结果保存到新数据文件Sum_index1中。又例根据数据transform.sav中学生的性别和城市变量对英语的平均成绩进行汇总。4.2数据文件的重组与转置4.2.1数据的长型与宽型格式长型格式与宽型格式是重复测量数据的两种不同的排列方式,重复测量数据可以使用不同的统计模型(重复测量模型)分析,数据的转换就是必要的。“重组”(Restructure);以SPSS的自带文件Anxiety.sav和Anxiety2.sav为例。4.2.2长型格式转换为宽型格式使用“数据重构向导”;个案重组为变量;例4.2将Anxiety.sav转换为Anxiety2.sav的格式。4.2.3宽型格式转换为长型格式使用“数据重构向导”;变量重组为个案;例将Anxiety2.sav转换为Anxiety.sav的格式。4.2.4数据转置数据转置功能实现的两个途径:“转置”(Transpose);“数据重构向导”的第三个功能;对数据进行行列互换,即将记录转为变量,将变量转为记录,数据重新显示。以数据xuelin.sav为例。4.3多个数据文件的合并“合并文件”(MergeFile)添加个案和添加变量4.3.1基本概念:纵向拼接和横向合并;案例文件解释4.3.2数据文件的纵向拼接数据文件的纵向拼接是“添加个案”;例4.3将数据b.sav中的记录添加到a.sav中,注意变量h-height又例将数据transform2.sav中的记录添加到transform.sav中。4.3.3数据文件的横向合并数据文件的横向合并是“添加变量”;例4.4将数据c.sav中的变量添加到a.sav中,并尽量保留数据。例3.9将数据transform3.sav中的记录添加到transform.sav中。数据文件横向合并的三个条件:在两个数据文件中选择公共变量作为关键变量,关键变量可以多个;两个数据文件按关键变量升序排序;在不同数据文件中,数据含义不同的列,变量名应不同。4.4与数据字典有关的功能4.4.1数据字典的基本概念数据字典是预先定义好的数据格式,包括变量格式、变量名标签、变量值标签、缺失值的定义;两个数据管理向导:专门用于定义数据字典,或将预定义的数据字典直接引入当前数据文件。4.4.2定义变量属性“定义变量属性”(DefineVariableProperties);用于对数据集中已存在的变量进一步定义其属性:列出所选变量的所有取值;分辨没有值标签的值;自动给出值标签;所选变量与其他变量的属性相互拷贝;与变量视图的区别。例:将CCSS数据中的变量S4进行属性设定。又例:将数据transform.sav中的变量gender进行属性设定。4.4.3复制数据属性“复制数据文件属性”(CopeDataProperties);用于将定义好的数据字典直接应用于当前文件中,可将一个外部的数据文件相关属性拷贝到当前数据文件中,还可以进行自定义,只选择某些变量,或者某些属性进行拷贝;例:将CCSS数据中的变量A3的属性定义复制到A4-A16变量。又例:将数据transform.sav中相关的变量属性作为数据字典应用到另一数据集transform2.sav中。4.5与数据准备有关的功能4.5.1标识重复个案“标识重复个案”(IdentifyingDuplicateCases);查找个别变量值重复,或者所有数值完全重复的记录;例4.5将CCSS案例数据第2、4条个案的ID变量值更改为1,然后按照time、id均相同的保准查找重复记录。又例:以数据company_rongyu.sav为例。4.5.4标识异常个案“标识异常个案”可能是录入错误所致,或确实存在异常值;1.算法原理计算过程:建模、评分、列出原因例4.6根据indexl、indexla、indexlb三个变量的取值在CCSS数据中标识异常个案。

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功