第2章数据录入与数据获取2013.922.1CCSS案例项目背景2.2数据格式概述2.2.1统计软件中数据的录入格式1、数据基本格式:行—记录;列—变量2、数据特殊格式:配对数据和重复测量数据3数据基本格式42.2.2变量属性11个变量属性:变量名称(Name);变量类型(Type);变量宽度(Width);变量小数(Decimals);变量名标签(Label);变量值标签(Values);变量缺失值(Missing);变量列宽(Columns);变量对齐(Align);变量测量(Measure);变量角色(Role)。51、变量的存储类型三种基本类型:(1)数值型(Numeric)(2)日期型(Date)(3)字符型(String)6数值型变量根据内容和显示方式的不同,又6种不同的表示方法:(1)标准数值型(Numeric)(2)逗号数值型(Comma)(3)小数点数值型(Dot)(4)科学计数法型(ScientificNotation)(5)美元数值型(Dollar)(6)设定货币72、变量的测量尺度(1)定类尺度(NominalMeasurement)性别、民族、职业等,仅表明类型;(2)定序尺度(OrdinalMeasurement)教育程度、生活满意度等,表明类型和高低大小;8(3)定距尺度(IntervalMeasurement)温度等,不仅表明类型和高低大小,还可准确指出类别之间的距离,进行加减计算;(4)定比尺度(ScaleMeasurement)收入、孩子数、受教育年数、体重,不仅表明类型、高低大小、指出类别之间的距离,还可计算两个测度之间的比值,进行加减乘除运算。9三种尺度通俗的称呼:(1)无序分类变量(定类变量)分类变量(2)有序分类变量(定序变量)(3)连续性变量(连续变量)4种测量尺度按照信息量的高低,可将高层次测量尺度的测量结果转换为低层次测量尺度的测量结果,反之不行。变量的测度等级直接关系到统计方法的选择。10变量类型与测量尺度的关系113、变量名与变量值标签变量名标签(Label)是对变量名的含义进行进一步解释说明,增强变量名的可视性和统计分析结果的可读性。变量值标签(Values)是对变量的取值含义的解释说明信息,使定类和定序变量的数据录入更方便,明确数据的含义,增强分析结果的可读性。124、缺失值(1)用户自定义缺失值定义“不回答”、“不适用”、“不清楚”或填答和编码错误时的缺失值代码。(2)系统缺失值对于数值型变量的数据,用“.”表示;字符型变量默认是空字符串。5、角色13142.3.1操作界面说明1、导航对话框2、SPSS主界面3、空数据文件,没有数据及文件名,行、列的标号都是灰色的。152.3数据的直接录入两种数据类型及其采集1、调查问卷等原始资料:直接录入数据2、已经被录入为其它数据格式的资料(二手资料):读取外部数据16数据编辑窗口——DataEditor数据编辑窗口菜单栏工具栏数据显示栏窗口主界面数据视图变量视图状态栏行、列、单元格记录、变量172.3.2开放题和简单单选题的录入1、定义变量(1)单选题的定义(2)多选题的定义(3)开放题的定义18192、开放题的录入3、单选题的录入单选题录入的三种方式:(1)字符直接录入(2)字符代码+值标签(3)数值代码+值标签为方便以后的分析工作,推荐使用第三种录入方式。202.2.3多选题的录入多选题,又被称为多重应答(MultipleResponse)。1、被访者可以选择两个以上的选项;2、多选题不能被直接编码,要用几个变量来进行记录;3、多选题对变量的定义方式不同;4、在分析之前,要定义多选题集;215、常见的方法有多重二分法(MultipleDichotomyMethod)和多重分类法(MultipleCategoryMethod);6、多重二分法的变量由问题的选项数决定,采用“1”和“0”的编码方式;7、多重分类法的变量由被访者给出的最多答案数决定,这些变量须为数值型变量,所有答案采用同一套编码。224、设定多选题变量集(1)Tables模块可以保存定义的信息;(2)MultipleResponse菜单中的DefineSets信息不能在数据文件中保存。232.4外部数据的获取2.4.1读取电子表格数据文件直接打开。从哪张表中读取数据;读取数据的范围;第一行是否是变量名。2.4.2读取文本数据文件文本向导2.3.3用ODBC接口读取各种数据库文件配置ODBC,在SPSS中通过ODBC和数据库连接读取数据242.5数据的保存2.5.1保存为SAV格式1、保存(Save)2、另存为(SaveDataAs)变量(Variables)按钮的使用。2.5.2保存为其他数据格式另存为(SaveDataAs)对话框中的“保存”列表框。252.6数据编辑窗口常用操作技巧集锦1.连续输入多个相同值2.快速定义成批变量3.将Excel或Word中的数据直接导入SPSS4.快速改变变量排列次序5.快速定位数据6.利用排序功能快速查找异常值、极端值7.利用变量值标签检查录入错误8.冻结行或列9.快速重复调用对话框10.从其他窗口中快速切换回数据窗口