spss基本操作1.SPSS的5个窗口(1)数据编辑窗口(SPSSDataEditor)Spss处理数据的工作全在此窗口进行。(2)结果管理窗口(SPSSOutputviewer)此窗口用于存放分析结果。左边是目录区,右边是内容区。(3)草稿结果窗口(SPSSDraftViewer)草稿结果是结果的一种简化文本格式。实际上就是WORD所兼容的rtf超文本格式,因此可以在没有安装SPSS的PC机上使用文字编辑软件打开。(4)语法编辑窗口(SPSSSyntaxEditor)(5)脚本窗口(SPSSScriptEditor)2.数据录入与数据获取•2.1.1统计软件中数据的录入格式•(1)不同观测对象的数据不能在同一记录中出现,即同一观测数据应当独占一行。•(2)每一个观测量指标或影响因素只能占据一列的位置,即同一指标的数量观测值都应当录入到同一个变量中去。2.1数据格式概述即:一个观测占一行,一个变量占一列在录入数据时,归纳为以下三步:第一步:定义变量名;第一步:指定每个变量的各种属性;第一步:录入数据。变量名不能与spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。2.1.2变量属性介绍一、变量的储存类型•SPSS中,变量有三种的基本类型:数值型、字符型和日期型。标准数值型逗号数值型圆点数值型科学技术法数值型美元数值型用户自定义型数值型:数值型的数据是0-9的阿拉伯数字和其他符号,如美元符号、逗号或圆点组成的。字符型:字符型数据的默认显示宽度为8个字符位,系统不区分变量名中的大小写字母,并且不能进行数学运算。注意:在输入数据时不应输入引号,否则双引号将会作为字符型数据的一部分。日期型:日期型数据是用来表示日期或时间的。日期型数据的显示格式有很多,SPSS以菜单方式列出日期型数据的显示格式以供用户选择。事实上,SPSS存储中的日期型变量是该实践与1582年10月14日零点相差的秒数。关于日期型格式的几点说明:“m”在年与日(字母y与d)之间表示月份;在时与秒(字母h与s)之间表示“分”钟。“mmm”表示要求书写英文月份单词的前三个字母组成的缩写。“ddd”三个字母d表示要求用从元月一日算起的日数表示日期。指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用“/”或“—”作分隔符的具体日期,回车后,系统将自动将输入的格式转化为指定的格式,显示在单元各种。二、变量的测量尺度在SPSS中使用Measure属性对变量的测量尺度进行定义。(1)定类尺度(NominalMeasurement):定类尺度是对事物的类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的变量只能计算频数和频率。在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥原则。(2)定序尺度(OrdinalMeasurement):定序尺度是对事物之间的等级或顺序差别的一种测度,可比较优劣或排序。特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能排序,不能进行运算。(3)定矩尺度(IntervalMeasurement):定矩尺度是对事物类别或次序之间间距的测度。特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指出类别之间的差距是多少;定居变量通常以自然或物理单位为计量尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减运算。(4)定比尺度(ScaleMeasurement):定比尺度是能够测算两个测度值之间比值的一种计量尺度,它的测量结果同定距变量一样表现为数值。特点:定必变量是测量尺度的最高水平,它除了具有其他三种测量尺度的全部特点外,还具有可计算两个侧度至之间笔直的特点,因此它可以进行加、减、乘、除运算,而定居变量值可进行加减运算。三、变量名与变量标签值Label:定义变量名标签Value:定义变量值标签四、缺失值Spss中缺失值有用户自定义缺失值和系统缺失值两大类。在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失值为零。2.2数据的直接录入•2.2.1操作界面说明标尺栏菜单栏工具栏数据输入区数据编辑区窗口标签标题栏状态栏当前数据栏显示区滚动条DataView表可以直接输入观测数据值或存放数据,表的左端列边框显示观测个体的序号,最上端行边框显示变量名。VariableView表用来定义和修改变量的名称、类型及其他属性,如图所示。如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的属性,直接输入数据,系统将默认变量Var00001,Var00002等。在VariableView表中,每一行描述一个变量,依次是:Name:变量名。变量名必须以字母、汉字及@开头,总长度不超过8个字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个字符不能是句号。Type:变量类型。变量类型有8种,最常用的是Numeric数值型变量。其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数加一个逗号)等。Width:变量所占的宽度。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在DateView中所显示的列宽(默认列宽为8)。Align:数据对齐格式(默认为右对齐)。Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺度三种(默认为等间距尺度)。为了在统计分析过程中能有效的利用其它软件产生的数据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接打开和保存下述类型的文件:SPSSDOS版本产生的数据文件*.sys;Excel报表程序产生的数据文件*.xls;DBASE数据库格式文件*.dbf;SAS统计软件产生的数据文件。2.3外部数据的获取SPSS读入非SPSS类型的文件数据,有三种主要方式:直接打开,利用文本导向读入文本数据以及利用数据库OBDC接口读入数据。2.3.1电子表格数据如何导入spss中SPSS中可以直接读入许多常用格式的数据文件,选择菜单FileOpenData或直接单击快捷键工具栏上的快捷按钮,系统就会弹出OpenFile对话框,单击“文件类型”列表框,在里面能够看到可以直接打开的数据文件格式。2.3.2文本数据如何导入spss中第一步:首先,在OpenFile文件框中选中文件,单击“打开”,系统会自动启动文本倒入向导对话框。第二步:选择“NO”并单击“下一步”按钮。用某种字符区分固定宽度第三步:分别选择“Delimited”和“yes”,然后单击“下一步”按钮。第四步第五步第六步第七步相关分析与回归模型的建立与分析•相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。•主要内容:•对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。•建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Linear)和曲线估计(CurveEstimation)。–数据条件:参与分析的变量数据是数值型变量或有序变量。一、相关分析–相关分析是研究变量之间关系的密切程度,以及根据样本资料推断总体是否相关。在统计分析中,常利用相关系数定量地描述两个变量之间线性关系的紧密程度。–相关分析的一个显著特点是变量不分主次,被置于同等的地位。–相关分析的步骤:(1)提出原假设,即两个总体无显著的线性关系(2)构造检验统计量(3)计算检验统计量的观测值及对应的概率p值(4)根据计算结果,得出结论相关分析•在SPSS中,可以通过Analyze菜单进行相关分析(Correlate),Correlate菜单如图所示。•Bivariate过程:此过程用于进行两个或多个变量间的参数或非参数相关分析,如果是多个变量,则给出两两相关的分析结果。这是Correlations子菜单中最为常用的一个过程,实际上对Bivariate过程的使用可能占到相关分析的95%以上。•Partial过程:如果需要进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。•Distances过程:调用此过程可对同一变量内部各观察单位间的数值或各个不同变量间进行相似性或不相似性(距离)分析,前者用于检测观测值的接近程度,后者则常用于考察各变量的内在联系和结构。该过程一般不单独使用,而是用于因子分析、聚类分析或多维尺度分析的预分析,以帮助了解复杂数据集的内在结构,为进一步分析做准备。•1、简单相关分析(Bivariate)•两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系。一是通过散点图直观地显示变量之间关系,二是通过相关系数准确地反映两变量的关系程度。•散点图•SPSS软件的绘图命令集中在Graphs菜单。下面通过例题来介绍具体操作方法。例1:数据库中的变量X表示山东省人均国内生产总值,Y表示山东省城镇居民的消费额(资料来源:山东省2003年统计年鉴),现画出散点图来观察两个变量的关联程度。单击GraphsScatter,打开Scatterplot散点图对话框,如图3.2所示。然后选择需要的散点图,图中的四个选项依次是:Simple简单散点图Matrix矩阵散点图Overlay重叠散点图3-D三维散点图•如果只考虑两个变量,可选择简单的散点图Simple,然后点击Define,打开SimpleScatterplot对话框,如图所示。人均国内生产总值(元)120001000080006000400020000城镇居民(元)800070006000500040003000200010000简单相关分析操作•简单相关分析是指两个变量之间的相关分析,主要是指对两变量之间的线性相关程度作出定量分析。仍然上题为例,说明居民收入与某商品的销售量两变量的相关分析过程,具体操作如下:•(1)打开数据库后,单击AnalyzeCorrelateBivariate打开Bivariate对话框,见图所示。•(2)从左边的变量框中选择需要考察的两个变量进入Variables框内,从CorrelationCoefficients栏内选择相关系数的种类,有Pearson相关系数,Kendall′s一致性系数和Spearman等级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种。Pearson相关系数也称积差相关系数,是人们定量地描述线性相关程度好坏的一个常用指标。(适用于线性相关的情形;样本存在极端值对其值的计算影响极大;要求相应的变量呈双变量正态分析。)Spearman等级相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围较Pearson相关系数要广得多。即使原始数据是等级资料也可以计算Spearman相关系数,但统计效能比Pearson相关系数要低一些(不容易检测出两者事实上存在的相关关系)Kendall′s一致性系数用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况•(3)单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述。•(4)单击OK,可以得到相关分析的结果。DescriptiveStatistics2780.6542502.3219264061.8464092.730726城镇居民消费额(元)人均国内生产总值(元