1数据分析方法及软件应用授课教师:杨小宝北京交通大学2015.0922020/1/13第2章SPSS的数据文件2.1SPSS数据文件的特点2.2定义变量属性(重点)2.3SPSS数据的录入、编辑(自学)2.4SPSS数据的保存2.5读取其他格式的数据文件(重点)2.6SPSS数据文件的合并(自学)32.1SPSS数据文件的特点•SPSS的数据文件扩展名是.sav;•SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,数据的内容才是那些待分析的具体数据。4数据结构数据内容5基于上述特点,建立SPSS数据文件时应完成两项任务:•描述SPSS数据的结构(变量视图)•录入编辑SPSS数据的内容(数据视图)6(1)原始数据的组织方式•数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。SPSS数据文件的结构就是对每个变量及相关特征的描述。SPSS数据的组织方式直接的问卷数据7(2)频数数据的组织方式例:职称年龄段35岁以下(1)36-49岁(2)50岁以上(3)教授(1)0158副教授(2)10202讲师(3)20101助教(4)3520频数数据的组织方式中:一行为变量的一个分组(或多个变量交叉分组下的一个分组),所有行囊括了该变量的所有分组情况,一列仍为一个变量,代表某个问题(或某个方面)及频数。分组汇总后的数据8频数数据的组织方式—SPSS格式职称年龄段人数1101215138211022202323120321033141354224309•变量名(Name)•数据类型(Type)、宽度(Width)、列宽度(Columns)-重点•变量名标签(Label)•变量值标签(Values)-重点•缺失数据(Missing)•变量对齐格式(Align)•度量标准(Measure)-重点2.2定义变量属性1011变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:1.以前版本的首字符应以英文字母开头,20版本的可以直接是汉字开头。后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。1)变量名(Variablename)定义时直接录入即可122.变量名的字符个数最好不多于8个;变量名不区分大小写字母。3.SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。132)数据类型(Type)14每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。2)变量宽度(Width)、显示宽度(Columns)153)变量名标签(Variablelabel)•变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。•变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。定义时直接录入即可164)变量值标签(Valuelabel)变量值标签是对变量取值含义的解释说明信息,对于品质型数据(定性数据包括分类和顺序数据)尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。17鼠标单击再单击右边的省略号弹出值标签定义窗口逐个添加185)缺失数据(Missingvalues)•数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。•数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。19SPSS用户缺失值定义窗口鼠标单击再单击右边的省略号弹出缺失值定义窗口逐个添加206)变量对齐格式(Align)•定义显示对齐方式,对齐方式分为右对齐、左对齐和中间对齐;•系统中,数值型变量默认为右对齐,字符型变量默认为左对齐。217)度量标准(Measure)统计学依据数据的度量尺度将数据划分为三大类:•名义(Nominal)—分类数据,如民族、宗教信仰、性别、党派;•序号(Ordinal)—顺序数据,如职称、职务、对某事物的赞同程度;•度量(Scale)—数值型数据,如身高、体重。22•通常建立SPSS数据文件时应首先定义数据的结构部分,然后再输入数据,但实际应用中,边录入、边分析、边修改数据结构的情况也是常见的。数据的结构定义完成之后,可以在变量视图(VariableView)卡片中浏览,也可以通过菜单选项实用程序(Utilities)变量(Variable)来实现。2324•SPSS数据的录入(与Excel类似,自学)•SPSS数据的编辑(与Excel类似,自学)SPSS数据的定位插入和删除一条个案插入和删除一个变量数据的移动、复制和删除2.3SPSS数据的录入、编辑(自学)25查找26•1、SPSS文件格式,扩展名为.sav2、Excel格式文件,扩展名为.xls3、dbf格式文件,扩展名为.dbf4、文本格式文件,扩展名为.datSPSS支持的数据格式2.4SPSS数据的保存27文件File保存Save,对于新的:提示文件名和类型;对于旧的,覆盖原来的,不再提问;文件File另存为SaveAs,另存一个数据文件,也有格式(类型)问题;变量Variable按钮允许用户指定保存哪些变量,不保存哪些变量,变量名前画叉的变量将被保存到磁盘中。保存数据的基本操作28保存为SPSS格式时29将数据保存为Excel文件格式时,将变量名写入表格Writevariablesnamestospreadsheet选项呈可用状态,它的作用是指定是否将SPSS变量名写入Excel工作表的第一行上。30•直接读入其它格式的数据文件•使用文本向导读入文本文件(自学)•使用数据库向导读入数据(自学)2.5读取其它格式的数据文件311)直接读入其它格式的数据文件SPSS现在可以直接读入许多格式的数据文件,其中就包括EXCEL各个版本的数据文件。选择菜单文件File打开Open数据Data;或直接单击快捷工具栏上的OpenFile按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式。32SPSS(*.sav)SPSS数据文件(6.0~10.0版)SPSS/PC+(*.sys)SPSS4.0版数据文件Systat(*.syd)*.syd格式的Systat数据文件Systat(*.sys)*.sys格式的Systat数据文件SPSSportable(*.por)SPSS便携格式的数据文件EXCEL(*.xls)EXCEL数据文件(从5.0版~2000版)Lotus(*.w*)Lotus数据文件SYLK(*.slk)SYLK数据文件dBase(*.dbf)dBase系列数据文件,(从dBaseII~IV)Text(*.txt)纯文本格式的数据文件data(*.dat)纯文本格式的数据文件33注:读入Excel文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口,但也可以指定仅读取工作表中某个区域内的数据(如A5:B10)。工作表上的一行数据为SPSS中的一个个案。如果Excel工作表文件第一行或指定读取区域内的第一行存储了变量名信息,则应选择读取变量名Readvariablenames项,即以第一行的文字信息作为SPSS的变量名,否则不选。34读取EXCEL数据文件352)使用文本向导读入文本文件•选择菜单文件File打开文本数据ReadTextData,系统就会弹出OpenFile对话框,和前面的情况完全一样,只是文件类型自动跳到了Text(*.txt)。•也可直接单击快捷工具栏上的OpenFile按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的文本文件格式。类似于从文本格式转为EXCEL格式的操作36•例:现有一数据文件以纯文本的形式保存,且第一行为变量名,请将其读入SPSS。•在文件File打开文本数据ReadTextData对话框选中相应的文件名并单击“确定”,系统会自动启动文本导入向导对话框如下:类似于从文本格式转为EXCEL格式的操作3738394041424344•选择菜单文件File打开数据库OpenDatabase新建查询NewQuery,系统会弹出数据库向导的第一个窗口,其中会列出你使用的机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。3)使用数据库向导读入数据45•纵向合并数据文件•横向合并数据文件2.6SPSS数据文件合并(自学)46第2章总结1.SPSS数据文件与Excel数据文件有何不同2.如何定义数据的结构或变量的属性(重点)3.如何录入、编辑和保存SPSS数据4.如何读取Excel和文本格式的数据文件(重点)5.如何对SPSS数据文件进行纵向和横向合并47SPSS数据文件--练习•把Excel格式的居民储蓄调查问卷数据导入到SPSS软件中,再定义各变量的属性,最后对照SPSS格式的文件进行检查。