一、基础介绍•1、SPSS的简介•2、SPSS的安装和界面介绍•3、变量的属性和定义方法•4、SPSS数据的录入•5、数据文件的操作(可以打开Excel文档,保存为多种格式)1、SPSS简介•SPSS的全称是:StatisticalProgramforSocialSciences,即社会科学统计程序。该软件是公认的最优秀的统计分析软件包之一。作为统计分析工具,理论严谨、内容丰富,数据管理、统计分析、趋势研究、制表绘图、文字处理等功能,几乎无所不包。2、SPSS的安装步骤:•1、启动Windows,并将SPSS系统安装盘插入CD-ROM光盘驱动器。•2、若系统设置为自动运行光盘状态,则光盘自动执行setup.exe文件,若光盘没有自动运行,可启动资源管理器,用鼠标双击光盘驱动器图标,运行setup.exe文件,进入安装前的选择画面。•3、双击installSPSS选项,进入SPSS15.0forwindow安装初始画面,(接受软件使用协议,输入用户名,机构名称,选择安装路径,单击“install”按扭,开始安装SPSS15.0forwindow软件。•4、根据安装过程的提示,依次顺序插换原盘直至安装完成。•5、安装完毕后,运行SPSS许可证向导,选择注册软件的类型和序列号。当软件注册后,方可正常使用。SPSS的启动•在Windows的程序管理器中双击SPSSFORWINDOWS图标以打开SPSS程序组,选择SPSS图标并双击之,即可启动SPSS。SPSS启动成功后出现SPSS的封面及主窗口,5秒钟后或点击鼠标左键,封面消失,呈现SPSS的预备工作状态SPSS的菜单界面•菜单栏选项:•1、File:文件管理菜单,有关文件的调入、存储、显示和打印等;•2、Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等;•3、Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等;•4、analyze:SPSS软件统计分析功能的最核心部分。几乎所有的统计分析功能都可以通过主菜单中的Analyze模块提供的各类过程来完成。•5、Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;•6、Statistics:统计菜单,有关一系列统计方法的应用;•7、Graphs:作图菜单,有关统计图的制作;•8、Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;•9、Windows:窗口管理菜单,有关窗口的排列、选择、显示等;•10、Help:求助菜单,有关帮助文件的调用、查寻、显示等。•点击菜单选项即可激活菜单,这时弹出下拉式子菜单,用户可根据自己的需求再点击子菜单的选项,完成特定的功能。•3、定义变量启动SPSS后,出现如图2-1所示数据编辑窗口。由于目前还没有输入数据,因此显示的是一个空文件。定义变量输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。单击数据编辑窗口左下方的“VariableView”标签或双击列的题头(Var),进入如图2-2所示的变量定义视图窗口,在此窗口中即可定义变量。图2-2变量定义视图窗口变量的定义信息在图2-2所示的窗口中每一行表示一个变量的定义信息,包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等。1.定义变量名(Name)SPSS默认的变量为Var00001、Var00002等,用户也可以根据自己的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下。变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号。变量最后一个字符不能是句号。变量名总长度不能超过8个字符(即4个汉字)。不能使用空白字符或其他特殊字符(如“!”、“?”等)。2.定义变量类型(Type)单击Type相应单元中的按钮,弹出如图2-3所示的对话框,在对话框中选择合适的变量类型并单击“OK”按钮,即可定义变量类型。SPSS的主要变量类型如下:3.变量长度(Width)设置变量的长度,当变量为日期型时无效。4.变量小数点位数(Decimal)设置变量的小数点位数,当变量为日期型时无效。5.变量标签(Label)变量标签是对变量名的进一步描述,变量只能由不超过8个字符组成,而8个字符经常不足以表示变量的含义。而变量标签可长达120个字符,变量标签可显示大小写,需要时可用变量标签对变量名的含义加以解释。6.变量值标签(Values)值标签是对变量的每一个可能取值的进一步描述。7.缺失值的定义方式(Missing)SPSS有两类缺失值:系统缺失值和用户缺失值。单击Missing相应单元中的按钮,在弹出的如图2-5所示的对话框中可改变缺失值的定义方式,在SPSS中有两种定义缺失值的方式。可以定义3个单独的缺失值。可以定义一个缺失值范围和一个单独的缺失值。8.变量的显示宽度(Columns)输入变量的显示宽度,默认为8。9.变量显示的对齐方式(Align)选择变量值显示时的对齐方式:Left(左对齐)、Right(右对齐)、Center(居中对齐)。默认是右对齐。10.变量的测量尺度(Measure)•变量按测量精度可以分为定性变量、定序变量、定距变量和定比变量几种。SPSS将其分为定距变量(Scale)、定序变量(Ordinal)、定类变量(Nominal)。•定距变量:年龄、温度、重量、次数等,包括连续变量和不连续变量。•定序变量:职称(高下)、程度(高低)等。•定类变量:职业、性别等。4、数据的录入录入数据的一般方法:定义了所有变量后,单击“DataView”标签,即可在出现的数据视图(编辑)窗中输入数据。数据录入时可以逐行录入,也可以逐列。数据的录入技巧:•1.减少无用击键次数•技巧1:问卷录入时一般从左到右输入,换行时多有不便。•开始输入时不要按”右”方向键,按tab键光标自然向右,需要换行时按回车,光标自然回到第一行开始录入的列,节省时间。•另:如果在其他情况下需要从上往下输入,先用鼠标选定特定区域,输入时按回车键光标自然向下。•到了最底行光标自然换行。•技巧2:按“F4“(=Ctrl+Y)可以重复上一步操作。数据的录入技巧:•2.数字小键盘的盲打•注意指法,食指放4,管7和1,中指放5,管6和2和小数点,无名指放6,管9和3,小拇指管回车键,大拇指管0.熟练加以练习。数据的录入技巧:•3.批量录入相同数据•连续以及不连续空间都可以。•不连续分布数据:按Ctrl不放然后用鼠标点击需要填入数据的单元格,再再最后的单元格里输入数据,最后按Ctrl+回车就行了。•连续区域输入:用鼠标圈出一块地,在光标所在单元格(白色那个)输入数据,再Ctrl+回车,一气呵成。录入带有变量值标签的数据在录入带有变量值标签的数据时,用户手工输入的是实际的变量值,而屏幕上显示的是与该变量对应的变量值标签。选中“ValueLables”的效果5、读取Excel软件文件(.xls)Excel软件可能是Windows系列操作系统中使用最多的数据表格软件。Excel文件以.xls为扩展名保存。该文件除了保存纯数据信息外,还保存了另外一些数据信息。SPSS提供了与Excel文件的接口,可以方便地将Excel文件读入数据编辑窗口。具体的操作过程如下。图2-58读取Excel文件图2-59“OpeningExcelDataSource”对话框SPSS默认将某个sheet中所有数据都读入到数据编辑窗口中。在“Range”框中输入要读取数据的范围,也允许指定读取一部分区域的数据,如要读入前50行数据,则在该框中输入A1:F50,表示读取的区域是以A1单元为左上角,F50为右下角的矩形区域。Excel表格中每一行为SPSS的一个个案。单击“Continue”按钮,即可完成数据导入。SPSS数据文件的保存在录入数据时,应及时保存数据,防止数据的丢失,以便再次使用该数据。用户确定盘符、路径、文件名以及文件格式后单击“Save”按钮,即可保存为指定类型的数据文件。SPSS支持的常见的数据文件存放格式如下。SPSS(*.sav)SPSS/PC+(*.sys)SPSSPortable(*.por)Tabdelimited(*.dat)SPSS的数据结构定义•1.用Execl录入数据之后,复制(或者用SPSS打开.xls文档)到SPSS中去。•2.定义变量的属性。打开“Data”选择“DefiningVariableProperties”命令,分别或者一起设置各变量的属性。整体定义变量属性二、SPSS的使用•2.1、基本统计分析•2.11基本统计量的定义和计算•2.12频数分析过程•2.2、spss统计图形的创建和编辑•2.21spss图形基本功能介绍•2.22具体介绍一下图表的用法(条形图、线图、面积图)SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。这里主要介绍如何在SPSS中进行平均数、中位数、众数、均值标准误差、频数、方差、标准差等的操作。大家可以据此自己探索其它的统计分析操作。常用基本统计量的英文名•均值(Mean)•中位数(Median)•众数(Mode)•百分位数(Percentile)•样本方差(Variance)•样本标准差(Std.deviation)•偏度(Skewness):取值分布对称性•峰度(Kurtosis):取值分布形态陡缓2.1均值(Mean)和均值标准误差(S.E.mean)2.11统计学上的定义和计算公式定义:均值(平均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。计算公式如下。总体平均数:若一组数据X1,X2,…,XN,代表一个大小为N的有限总体,则其总体平均数为样本平均数:若一组数据x1,x2,…,xn,代表一个大小为n的有限样本,则其样本平均数为样本数据来自总体。样本的统计描述量可以反映总体数据的特征,但由于抽样等原因,使得样本数据不一定能够完全准确地反映总体,它可能与总体的真实值之间存在一定的差异。进行不同次抽样,会得到若干个不同的样本均值,它们与总体均值存在着不同的差异。均值标准误差(StandardErrorofMean,S.E.mean)就是描述这些样本均值与总体均值之间平均差异程度的统计量。SPSS中实现过程研究问题求某班级学生在一次数学测验中的平均成绩,数据如表3-1所示。数学成绩998879595489795689992389705067788956表3-1某班级的数学成绩实现步骤图3-1在菜单中选择“Frequencies”命令图3-2“Frequencies”对话框(一)图3-3“Frequencies:Statistics”对话框(一)百分位数偏离度中心趋势分布标准差方差标准误差结果和讨论中位数(Median)统计学上的定义和计算公式定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。计算公式:一个大小为的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果为奇数,那么该数列的中位数就是位置上的数;如果N为偶数,中位数则是该数列中第与第+1位置上两个数值的平均数。12N2N2NSPSS中实现过程研究问题求某班级学生身高的中位数,数据如表3-2所示。表3-2某班级学生的身高身高(cm)174168164174176150183162171146189167实现步骤图3-4“Frequencies:Statistics”对话框(二)结果和讨论众数(Mode)统计学上的定义和计