SPSS入门SPSS(StatisticalPackagefortheSocialSciences)是著名的统计分析软件。原意为“社会科学统计软件包”。该软件适用于在自然科学、社会科学等多个领域进行统计分析。随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。一、SPSS简介历史20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS1975年在芝加哥组建了SPSS公司。1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+1994至1998年间,SPSS公司陆续购并了SYSTAT公司、BMDP软件公司、Quantime公司、ISL公司等,并将各公司的主打产品收纳SPSS旗下,从而使SPSS公司由原来的单一统计产品开发与销售转向企业、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。迄今为止,SPSS软件已拥有全球众多的用户,分布于通信、医疗、银行、证卷、保险、制造、商业、市场研究、科研教育等多个领域,是世界上应用最广泛的专业统计软件。其分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据展示等。还有一系列附加模块和独立模块产品以加强它的分析功能。它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据管理、统计分析功能及各种报表方法。功能强大、实用与美观统一的视窗风格——SPSS最突出的特点就是操作界面极为友好,他使用Windows的窗口方式展示各种管理和分析数据方法,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。输出结果十分美观漂亮(从国外的角度看)。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。数据转换功能较强:可存取和转换多种数据类型,如Spss(*.sav),Excel(*.xls),Text(*.txt),dBase(*.dbf)文件等。可用SPSS命令编程,形成SPSS环境下的可执行文件。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。非专业统计人员的首选统计软件SPSS的基本特点数据自动处理强大的统计功能完全的Windows风格良好的帮助系统和自学功能简单的编程完美的图形处理功能丰富的数据对接功能支持DLE与Active技术内置VBA客户语言强大的函数功能Intenet功能SPSS的功能样本数据的描述和预处理;假设检验(包括参数检验、非参数检验及其他检验);方差分析列联表相关分析回归分析对数线性分析聚类分析判别分析因子分析对应分析时间序列分析生存分析可靠性分析二、SPSS的启动、主界面和退出启动SPSS开始--程序--SPSSforwindows--SPSS13.0forwindows启动后,出现SPSS主界面主界面有两个,一个是SPSS数据编辑窗口,一个是SPSS输出窗口。数据编辑窗口(DataEditor):结果输出窗口(OutputViewer)退出SPSS选择数据编辑窗口的File菜单中的Exit命令。或单击标题栏上的关闭按钮三、定义变量变量格式设置窗口(VariableView)变量的定义:输入数据前首先要定义变量。定义变量既要定义变量名、变量类型、变量长度(小数位数)、变量的格式等内容。变量的定义信息:包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等定义变量名NameSPSS默认的变量为Var00001、Var00002等。用户也可以根据自已的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下。1、变量名必须以字母、汉字或字符开头。2、变量最后一个字符不能是句号。3、变量名总长度不能超过8个字符(即4个汉字)。4、不能使用空白字符或其他特殊字符(如“!”、“?”等)5、变量命名必须惟一,不能有两个相同的变量名。6、在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名称。7、SPSS的保留字(ResewedKeywords)不能作为变量的名称,如ALL、AND、WITH、OR等。SPSS的主要变量类型如下:Numeric:数值型。定义数值的宽度(Width),即整数部分+小数点+小数部分的位数,默认为8位:定义小数位数(DecimalPlaces),默认为2位。Comma:加显逗号的数值型,即整数部分每3位数加一逗号,其余定义方式同数值型,也需要定义数值的宽度和小数位数。Dot:3位加点数值型,无论数值大小,均以整数形式显示,每3位加一小点(但不是小数点),可定义小数位置,但都显示0,且小数点用逗号表示。如1.2345显示为12.345,00(实际是12345E-4)。Scientificnotation:科学记数型。同时定义数值宽度(Width)和小数位数(DecimalPlaces),在数据编辑窗口中以指数形式显示。Date:日期型,用户可从系统提供的多种日期显示形式中选择自己需要的形式。如选择mm/dd/yy形式,则1998年8月25日显示为08/25/98。Dollar:货币型,用户可从系统提供的多种货币显示形式中选择自己需要的,并定义数值宽度和小数位数,显示形式为数值前加$符号Customcurrency:用户自定义型,如果没有定义,则默认显示为整数部分每3位加一逗号,用户可定义数值宽度和小数位数。String:字符型,用户可定义字符长度(Characters)以便输入字符。变量长度Width设置变量的长度,当变量为日期型时无效。变量小数点位数Decimal设置变量的小数点位数,当变量为日期型时无效。变量标签Label变量标签是对变量名的进一步描述,变量只能由不超过8个字符组成,而8个字符经常不足以表示变量的含义。而变量标签可长达120个字符,变量标签可显示大小写,需要时可用变量标签对变量名的含义加以解释。变量值标签Values值标签是对变量的每一个可能取值的进一步描述,当变量是名义型数据、有序型数据变量时,这是非常有用的。例如,在统计中经常用1代表“male”,2代表female等。四、数据的输入与保存输入数据的一般方法录入带有变量值标签的数据SPSS数据文件的保存五、数据的编辑单元值的修改插入和删除一个记录(行)数据的排序选取记录子集数据分类汇总缺失值的替代六、变量的操作插入和删除一个变量根据已存在的变量建立新变量产生计数变量变量的重新赋值七、数据文件的合并和分组数据文件的纵向合并数据文件的横向合并数据文件的分组(拆分)八、与Excel交换数据方法一:使用File菜单中的OpenData…文件类型Excel(*.xls)Saveas保存类型Excel97andlater(*.xls)方法二:复制、粘贴