试验1,文件建立与编辑与处理1试验内容建立数据文件保存数据文件变量的定义数据的录入与编辑1一、建立数据文件直接打开使用数据库查询打开使用文本导入向导1直接打开1File==Open==Data或直接单击快捷工具栏上的“”按钮,2系统就会弹出OpenFile对话框,单击“文件类型”列表框3选中需要打开的文件SPSS能打开的常见的格式:1SPSS能打开的常见的格式:直接打开SPSS格式文件,扩展名.savExcel格式文件,扩展名.xlsdBase格式文件,扩展名.dbfSAS格式文件,扩展名.sas7bdat文本格式文件,扩展名.txt,.dat1文件类型及扩展名说明SPSS(*.sav)SPSS数据文件Spss/PC+(*.sys)SPSS早期版本数据文件Systat(*.syd),(*.sys)Systat数据文件SpssPortable(*.por)SpssPortable数据文件Excel(*.xls)Excel文件Lotus(*.W*)Lotusl—2—3x.0(wk3)格式数据文件Sylk(*.slk)SYLK(符号链接)格式文件Dbase(*.dbf)dBase数据库文件SASLongFileName(*.sas7bdat)SAS长文件名数据文件SASShortFileName(*.sd7)SAS短文件名数据文件SASv6forWindows(*.sd2)SASv6forWindows数据文件SASv6forUnix(*.ssd01)SASv6forUnix数据文件SASTransport(*.xpt)SASTransport数据文件Txt(*.txt)文本文件Dat(*.dat)Tab分隔符数据文件11File==ReadTextData2系统就会弹出OpenFile对话框,单击“文件类型”列表框3选中需要打开的文件使用文本导入向导1二、保存数据文件1SPSS支持的数据格式SPSS格式(.sav)Excel格式(.xls)dbf格式(.dbf)文本格式(.dat)1保存数据文件2步骤(1)File=Save或Saveas(2)选择存放文件的目录途径和数据文件的文件名,数据文件的格式Variable:保存为SPSS文件时可用指定保存那些变量Writevariablesnamestospreadsheet:保存为Excel文件时可用,指定是否将SPSS变量名写入Excel工作表第一行1File菜单中的其他条目【DispDataFileInfo】该菜单项用于显示数据的基本信息【MarkFileReadOnly】标记数据为只读1【CacheData】建立数据缓冲区【Print和PrintPreview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来【StopProcessor】用于停止执行当前的SPSS命令。File菜单中的其他条目【SwitchServer】切换服务1•定义变量名•定义变量类型与宽度•定义变量的变量标签•定义变量的数值标签•定义变量的缺失值•定义变量的显示格式•定义变量的测度类型三变量的定义(VariableView)1定义变量名Name•SPSS变量名由不多于64(32个汉字)个字符组成•首字母是字母或汉字•不能使用?,!和*•注意不能以下划线_和圆点“.”作为变量名的最后一个字符变量命名原则1定义变量名•变量名不能与SPSS保留字相同,SPSS的保留字有ALL,AND,BY,EQ,GE,GT,LE,LT,xdNE,NOT,OR,TO,WITH•不区分变量名的大小写,如ABC和abc被认为是同一个变量•SPSS有默认的变量名,如VAR000011变量类型Type1变量类型Type数值型(1)标准型(Numeric)默认类型默认最大宽度为8位若默认最大宽度大于8位,按自动科学记数法显示例:2638.4由阿拉伯数字(0~9)和其他特殊符号(如美元符号,逗号,圆点)组成1变量类型Type(2)科学记数法型ScientificNotation表示特大或特小的数字如1.23E18,2.56E-161变量类型Type(3)逗号型Comma从个位开始每3位以逗号分割如1,234.56默认最大宽度为8,小数位21变量类型Type(4)圆点型Comma从个位开始每3位以圆点分割如1.234.56默认最大宽度为8,小数位21变量类型Type(5)美元符号型Dollar表示货币数据,在数据符号前加$显示符号很多如$###1变量类型Type字符型String默认最大宽度为8位,不能进行算术运算,区分大小写字母字符不能超过指定的长度1变量类型Type日期型Date表示日期或时间如:25-AUG-199908/25/19991变量名标签Lable对变量取值含义进一步解释说明例如:变量名变量标签Wweight或体重HHeight或身高1变量值标签ValueLables对变量取值含义进一步解释说明例如变量值值标签SexfFemalemMale1缺失数据Missing说明缺失数据的基本方法指定用户缺失值用户缺失值可以是字符型或数值型变量----1至3个特定的离散值数值型变量---一个连续的闭区间加一个区间以外的离散值1度量尺度Measure定距型数据Scale,可为数值型变量如:身高体重定序型数据Ordinal:具有内在大小或高低顺序,可为数值型变量或字符型变量如:年龄段变量定类型数据Nominal:一般以数值或字符表示的分类数据,可为数值型字符型变量如:性别变量1其他Width:宽度Decimals:小数位Columns:变量列宽Align:变量的对齐方式1变量定义的浏览实用程序变量1四数据的录入DataView黑框框住的单元为当前数据单元数据录入可以逐行进行,录完后按Tab数据录入可以逐列进行,录完后按Enter录入带有变量值标签的数据可以通过下拉按钮完成,但应首先打开变量值标签的显示开关:视图自定义变量视图1数据编辑功能表(Edit菜单)命令功能Undo删除刚输入的数据或者恢复刚修改的数据Redo恢复刚撤消的操作Cut将选定数据剪切到剪贴板Copy将选定数据拷贝到剪贴板Paste将剪贴板的数据粘贴到指定位置Clear清除选定的变量和观测值Find查找数据五数据的编辑1练习1:体检资料编号姓名性别文化程度出生日期体检日期身高(cm)体重(kg)疾病1李珍女高中1966年12月8日2004年8月10日15855健康2赵小英女大学1977年4月18日2004年8月12日15545支气管炎3王清男初中1953年5月6日2004年8月14日17368心脏病建立一个数据文件1VariableInformation1编号Nominal8RightF2F22姓名Nominal8LeftA10A103性别Nominal8LeftA1A14文化程度Ordinal8RightF1F15出生日期Scale8RightEDATE8EDATE86体检日期Scale8RightADATE8ADATE87身高Scale8RightF8F88体重Scale8RightF8F89疾病Nominal8RightF2F2VariablebhxmxbwhcdcsrqtjrqsgtzjbPositionLabelMeasurementLevelColumnWidthAlignmentPrintFormatWriteFormatVariablesintheworkingfileVariableValues女男初中高中大学健康支气管炎心脏病Valuefmxb123whcd012jbLabel1六、数据文件的处理(一)Data菜单Data菜单的各项命令对数据的简单编辑对数据文件的整理1命令功能对变量操作的命令DefineVariablesProperties定义变量属性CopyDataProperties复制数据属性DefineDates定义日期变量InsertVariables插入变量对个案操作的命令InsertCase插入个案GotoCase个案定位Data菜单的各项命令1对个案操作的命令SortCases个案排序SelectCases选择个案IdentifyDuplicateCases识别重复个案WeightCases个案加权对文件操作的命令Transpose对数据文件的转置Restructure数据重组Data菜单的各项命令1对文件操作的命令MergeFiles合并数据文件Aggregate对数据进行汇总OrthogonalDesign正交设计Data菜单的各项命令11、变量管理•主要内容:–插入变量–删除变量–定义日期时间1插入变量(1)将当前单元确定在某变量上(2)右击鼠标插入变量1删除变量(1)在欲删除的变量名上单击鼠标(2)右键选择Cut1定义日期时间变量DefineDates步骤(1)数据定义日期(2)设置日期时间12、个案管理•主要内容:–个案定位–插入和删除一个个案–个案排序–个案选取–个案加权1个案定位将当前数据单元定位到特定单元两种定位方式:人工定位和自动定位人工定位方法:用鼠标拖动数据编辑窗口右边滚动钮或PageUpPageDown1个案定位自动定位方法1按个案号码自动定位(1)将当前单元定位在任何单元中(2)编辑转至个案(3)输入欲定位的个案号码1个案定位自动定位方法2按变量值自动定位(1)将当前单元定位在任何单元中(2)EditFind(3)输入定位变量值1插入和删除一个个案(1)将当前单元定位在任何单元中(2)编辑InsertCase(3)输入定位变量值1、插入一个个案1插入和删除一个个案(1)在欲删除的个案号码上单击鼠标左键(2)右键选择Cut2删除一个个案1数据块的移动复制和删除(1)定义源数据块(2)右键选择Clear(全部清除)或Copy或Cut(3)指定目标单元,右键选择Paste1个案排序1目的便于数据的浏览快速找到数据的最大值和最小值快速找到数据的异常值能对数据或字符进行排序1说明(1)数据排序是整行数据排序(2)多重排序中指定排序次序很关键(3)注意保留原始排列顺序个案排序1(1)Data=sortcase,打开SortCases对话框。(2)将主排序变量从左面的列框中选到Sortby框中,在SortOrder选择升序或降序.(3)如果多重排序,指定第二,三排序变量和规则(4)OK2基本操作个案排序13应用举例数据文件:职工基本情况数据先按职称升序排序再按基本工资升序排序个案排序1个案选取1目的根据分析的需要,从已收集的大批量数据中按一定规则抽取部分数据参与分析,也称为样本抽样.提高数据分析效率检验模型的需要1个案选取2数据选取的基本方式按指定条件选取(Ifconditionissatisfied)随机抽样(Randomsampleofcases)近似抽样(Approximately)精确抽样(Exactly)选取某一区域的样本(Basedontimeorcaserange)通过过滤变量选取样本(Usefiltervariable)13基本操作(1)Data=Selectcases(2)根据分析需要选择数据选取方法,Allcases表示全部选中(3)指定对未选择个案的处理方式Filter未选择个案打上/,Deleted未选择个案从数据编辑窗口中删除个案选取14实例1数据文件:居民储蓄调查数据(1)浏览城镇储户的情况(2)随机抽样中的近似抽样对其中70%的数据进行分析个案选取14实例2数据文件:hong1.dbf,选取(1)婴儿体重2.01=x6=3(2)随机抽样中的近似抽样对其中30%的数据进行分析(3)选取10~33例的婴儿个案选取1个案加权1步骤(1)Data=WeightCases(2)选择Weightcasesby,并将某变量作为加权变量选到Weightcasesby中12实例球迷打分数据,将分数按百分比加权1个案加权3、数