1SPSS基础目录第一章SPSS简介1.1SPSS概述1.2SPSS窗口1、数据编辑窗口(dataeditor)2、输出窗口(Viewer)3.程序编辑窗口1.3SPSS系统参数的设置1.3.1Options选择对话框1.3.2通用参数设置1.3.3结果输出窗口参数设置1.3.4Currency窗口参数设置第二章数据文件的编辑与管理2.1建立与保存数据文件2.1.1定义新变量1变量名(Name):2.变量类型(Type)3变量长度(Width):4变量小数点占位(Decimal):5变量标签(Lable):6变量值标签(Values):7缺失值的定义方式(Missing):8变量的显示宽度(Columns):9变量显示的对齐方式(Align)10变量的度量方式(Measure):2.1.2数据的输入22.1.3数据的保存2.2读如其他格式的数据文件例2.2.1读入EXCEL数据文件student.xls,并保存为同名的SPSS数据集student.sav2.3File菜单中的其他条目2.4数据文件的编辑2.4.1单元值的查找2.4.2增加或删除一个观测2.4.3分析数据的排序2.4.4分析数据集的转置2.4.5选取数据的观测子集2.4.6分析数据归类分组汇总2.4.7缺失值的替代2.5数据变量的操作2.5.1增加或删除一个变量2.5.2从原有变量构造新变量2.5.3数据排秩2.5.4产生计数变量2.5.5数据重新编码2.5.6产生自动分组变量2.5.7变量集的定义和使用2.6数据文件的合并与拆分2.6.1数据文件的纵向合并2.6.2数据文件的横向合并2.6.3数据文件的拆分3第一章SPSS简介1.1SPSS概述StatisticalpackageforSocialScience,社会科学统计软件包是一个组合式软件包,它集数据整理、分析过程、结果输出等功能于一身,是世界上著名的统计分析软件之一。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“StatisticalProductandServiceSolutions”,意为“统计产品与服务解决方案”,标志着SPSS软件的应用领域有了重大拓展。SPSS解决方案广泛应用于市场研究、电讯、卫生保健、银行、财务金融、保险、制造业、零售等领域。SPSS的5大特色智能操作,易学易用一般情况下无须编写程序数据转换接口有很好的兼容性具有丰富的统计分析功能和完善的分析报告功能ComplexSamples模块增加了统计建模的功能SPSS公司的历史1968年:美国斯坦福大学的三位专业背景截然不同的研究生NormanH.Nie、C.Hadlai(Tex)Hull和DaleH.Bent开发了最早的统计软件系统,他们称呼这个软件系统为“社会科学统计软件包”,简称“SPSS”。他们的出发点是使用统计方法来将原始数据转变为决策所必需的信息。Nie是一位社会科学家、斯坦福大学的博士生,承担了用户的角色,提出应用需求;Bent是斯坦福大学的运筹学博士生,拥有着数据分析方面的专业知识,设计出了SPSS系统文件结构;Hull刚从斯坦福大学获得MBA学位,由他来负责编程。1975年:在芝加哥成立SPSS总部1984年:推出用于个人电脑的SPSS/PC+1992年:推出Windows版本,同时在纳斯达克上市,股票代码为SPSS。目前在全球100多个国家和地区有分支机构或合作伙伴,直系员工超过2000人。SPSS软件家族广泛应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。SPSS是世界上应用最广泛的专业统计软件,全球约有25万家SPSS公司产品的用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,全球500强中有80%的公司使用SPSS,而在市场研究和市场调查领域有超过80%的市场占有率。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。41.2SPSS窗口1、数据编辑窗口(dataeditor)基本功能——建立SPSS数据文件主要构件标题栏和系统状态栏菜单栏工具栏文件以.sav为扩展名2.输出窗口(Viewer)以.spo为扩展名3.程序编辑窗口编辑SPSS程序,通过运行主菜单的RUN命令将编辑好的程序一次性地提交给计算机执行。也可以将编好的程序保存为一个后缀为.sps的文件供以后需要的时候调用。1.3SPSS系统参数的设置1.3.1Options选择对话框Edit==Options1.3.2通用参数设置1.3.3结果输出窗口参数设置1.3.4Currency窗口参数设置5第二章数据文件的编辑与管理2.1建立与保存数据文件2.1.1定义新变量大多数情况下我们需要从头定义变量,在SPSS10.0中,定义变量的操作界面和FoxPro等数据库非常相似,只需单击左下方的VariableView标签就可以切换到变量定义界面开始定义新变量。1变量名(Name):①变量名必须以字母、汉字或@开头,剩下的字符可以是字母,数字,句点,@,#,_,$等②变量名不能以句点结尾③名字长度不能超过8个字符④空格和特殊字符不能被用,如?,!,`,*⑤每一个变量名必须是唯一的,重复的变量名是不被允许的⑥变量名无大小写之分⑦下列关键词不能用作变量名allNEEQTOleltbyorgtandnotgewith举例:locationloc#5x.1over$5002.变量类型(Type):变量类型可由变量类型对话框确定6在SPSS数据集中,变量分为8种类型,主要有字符型变量(String)和数值型变量(numeric)。Numeric——数值型Comma——加有逗号的数值型Dot——加有圆点的数值型Scientificnotation——科学计数型Date——日期型Dollar——货币型Customcurrency——用户自定义型String——字符型3变量长度(Width):4变量小数点占位(Decimal):5变量标签(Lable):6变量值标签(Values):变量值标签则在它右侧的Value框定义。以性别为例,单击Value框右半部的省略号,会弹出变量值标签对话框如下:78上部的两个文本框分别为变量值输入框和变量值标签输入框,分别在其中输入“f”和“女生”,此时下方的Add钮变黑,单击它,该变量值标签就会被加入下方的标签框内。与此类似定义变量值“m”为“男生”,最后按OK,变量值标签就设置完成。切换回DataView界面,然后选择菜单View==ValueLabels.7缺失值的定义方式(Missing):定义缺失值的作用:凡是在定义的缺失值范围内的数据不参与统计分析。SPSS有两类缺失值:系统缺失值和用户缺失值。数据长方形中任何空的数字单元都被认为是系统缺失值,用点“.”表示。由特殊原因造成的信息缺失值被认为是用户缺失值,例如调查问卷中,被调查者不愿意回答的项目可定义为用户缺失值。单击missing框下相应变量右侧的省略号,会弹出缺失值对话框如下:9nomissingvalues:无缺失值,系统默认选项;discretemissingvalues:定义离散缺失值,选择该选项后,激活下面3个输入框,可以在其中指定3个数值作为缺失值,也可以少于3个。例如对于性别变量,值2,3,4都被认为是非法的,在输入数据过程中有可能输入了这几个数,则可以把这3个值分别输入到3个矩形框中;rangepulsoneoptionaldiscretemiss:定义一个缺失值的范围,选择该选项后,激活下面3个输入框。在low和hight输入框中分别输入缺失值的下限和上限。可以在最下方的discrete框中输入范围之外的一个离散值。8变量的显示宽度(Columns):9变量显示的对齐方式(Align)选择变量值显示时的对齐方式,系统默认是右对齐。备选方式:Left——左对齐Right——右对齐Center——居中对齐10变量的度量方式(Measure):为了区分变量在分析中的不同作用,又按变量的度量方式分为三类:选择变量的度量方式,系统默认是定距变量。备选方式:Scale——定距变量必须是数值型变量,可以对其观测值进行四则运算。Ordinal——顺序变量,可以是数值型的,也可以是字符型的,可以对其观测值进行排序。10Nominal——名义变量可以是数值型的,也可以是字符型的,常起分类作用。使用该窗口,我们可以一次定义许多新变量,不会象老版本那样一个一个的定义了。2.1.2数据的输入2.1.3数据的保存在对数据做了修改后,保存数据文件是必不可少的工作之一。选择菜单File==Save,如果数据文件曾经存储过,则系统会自动按原文件名保存数据;否则,就会弹出和选择Saveas菜单时相同的Saveas对话框。里面可以保存的数据类型和可以打开的几乎一样多,选择合适的类型,确定就是了。2.2读如其他格式的数据文件SPSS可以直接读入许多格式的数据文件,选择菜单File==Open==Data或直接单击快捷工具栏上的“”按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:SPSS(*.sav)SPSS数据文件(6.0~10.0版)SPSS/PC+(*.sys)SPSS4.0版数据文件Systat(*.syd)*.syd格式的Systat数据文件Systat(*.sys)*.sys格式的Systat数据文件SPSSportable(*.por)SPSS便携格式的数据文件EXCEL(*.xls)EXCEL数据文件(从5.0版~2000版)Lotus(*.w*)Lotus数据文件SYLK(*.slk)SYLK数据文件dBase(*.dbf)dBase系列数据文件,(从dBaseII~IV)Text(*.txt)纯文本格式的数据文件data(*.dat)纯文本格式的数据文件选择所需的文件类型,然后选中需要打开的文件,SPSS就会按你的要求打开你要使用的数据文件,并自动转换为数据SPSS格式。例2.2.1读入EXCEL数据文件student.xls,并保存为同名的SPSS数据集student.sav2.3File菜单中的其他条目【DispDataInfo】11该菜单项用于显示数据的基本信息,选择它后会弹出非常类似于打开文件的一个对话框用于选择数据文件,选择好后按OK,系统就会在结果窗口中列出所选数据的基本情况,如建立时间、标签设置、记录数、变量设置等。【ApplyDataDictionary】即使用数据字典,该功能使你可以直接在新数据集中套用以前定义好的变量设置(格式、标签等,但不包括数据类型),例:打开Li1_1.sav文件,将变量x的长度从8改为4,标签删掉,然后选择菜单File==ApplyDataDictionary,在文件对话框中选择Li1_1.sav并按OK(即将Li1_1.sav的变量设置按相同变量名一一套用在现在的数据集上)。【CacheData】建立数据缓冲区。以前SPSS每执行一条命令都会重新读取所需的数据,如果是从远程用SQL调用数据库,这会非常的费时。现在使用CacheData,可以将数据全部读入暂存盘,建立活动数据的缓冲区。大大加快处理速度。如果是处理本机数据的话,该命令对速度的提升不是非常明显。【Print和PrintPreview】这两个菜单项用于将数据管理窗口中的数据以表格的形式打印出来,其中PrintPreview是新增加的,使用上和WPS2000的打印预览非常相似(其实用的是同样的程序),不过和SPSS结果的打印程序一样,用SPSS直接打印数据非常的浪费纸张。【StopProcessor】用于停止执行当前的SPSS命令。由于SPSS处理速度非常的慢,如果