食品科学专业李清平实验设计及数据处理教师:王文贤老师9.2SPSS统计软件实验设计及数据处理李清平9.2.1SPSS概述SPSS是英文StatisticsPackageforSocialScience的缩写形式,意思是社会科学统计软件包。它是目前世界上通用的统计软件包之一,在医学、心理学和经济学等领域都得到了广泛运用。第一节SPSS的特点1.除数据需键盘操作外,大多数操作通过“菜单”、“对话框”、“图标按钮”完成,易学易用。2.无需花大量时间记忆大量命令、过程、选择项等。3.三种运行方式,灵活方便。4.可根据设备情况选择安装模块。5.与其他软件有数据转化接口。6.统计分析方法丰富。7.具有较强的图表生成、编辑功能。8.丰富的联机帮助功能是初学者学习SPSS的帮手。实验设计及数据处理李清平9.2.2数据文件的建立和编辑第一节概述一、变量的定义及参数的设定通过数据编辑器的VariableView界面来定义。1.变量名(Name)2.变量类型(Type)3.变量长度(Width)4.小数位数(Decimals)5.变量名标签(Label)6.变量值标签(Values)7.缺失值定义(Missing)8.变量列宽(Column)9.数值对齐方式(Align)10.变量特性的测量尺度(Measure)(1)比例尺度(Scale)(2)定序尺度(Ordinal)(3)定类尺度(Nominal)二、数据的输入1.数值型数据的输入2.字符型数据的输入3.日期型数据的输入4.数据的输入方法(按行或按列输入)实验设计及数据处理李清平第二节SPSS的系统环境一、基本概念1.窗口及其类型2.窗口的基本结构(1)标题栏(2)菜单栏(3)工具栏(4)滚动条(5)工作区(6)状态栏3.对话框就是提供人机对话环境和内容的窗口。(1)常见的对话框类型A、文件操作对话框B、统计分析主对话框(2)对话框中的控制与选择类型A、移动变量按钮B、打开下一级对话框按钮C、执行功能按钮D、择其一按钮E、选择框F、下拉清单二、数据编辑窗(DataEditor)1、数据编辑窗的打开与关闭实验设计及数据处理李清平2、数据编辑窗的两个界面(1)DataView界面(2)VariableView界面3、DataEditor的功能三、结果输出窗(SPSSViewer)1、SPSSViewer打开与关闭(1)自动打开当用户运行一个SPSS的分析过程后,系统自动打开结果输出窗。(2)命令打开用户选择命令File-→New-→Output打开结果输出窗。(3)关闭2、结果输出区(1)大纲输出区(2)文本输出区四、SPSS的其他窗口五、多窗口操作实验设计及数据处理李清平第二节SPSS数据文件的建立和编辑一、数据文件的建立基本步骤:1.打开新的数据编辑窗口2.在VariableView界面下定义变量3.在DataView界面下输入数据4.保存数据文件例.A公司某部门20名职工的性别、年龄、月收入、年终业务考核数据,请建一个名为“公司年终考核表”的数据文件。实验设计及数据处理李清平1女252000.00良11男323000.00良2男373000.00中12男292600.00中3女423200.00良13男423400.00良4男262000.00中14女272400.00及格5男282200.00良15男533600.00中6男302800.00中16女342600.00良7男383200.00良17男353000.00良8女554000.00中18男343600.00优9男463400.00优19男373000.00良10女272200.00良20男403200.00良实验设计及数据处理李清平实验设计及数据处理李清平二、数据文件的编辑(一)插入操作1、插入变量2、插入个案(二)删除操作1、删单元2、删个案3、删变量4、删连续区域第三节数据文件的整理一、排序在建立了数据文件后,为了某种需要可按关键变量对当前数据文件进行排序,重新调整个案在数据文件中的先后顺序。例如对“公司年终考核表”数据文件,按工资从高到底排序。1.打开数据文件,选菜单File-→Open-→data,在对话框中指定文件名“公司年终考核表”;2.选择Data-→SortCase,打开对话框,3.选择排序变量,将变量salary置于Sortby框中;4.选择排序方式Descending;5.点击OK。实验设计及数据处理李清平实验设计及数据处理李清平实验设计及数据处理李清平二、文件转置1.打开数据文件2.选择Data-→Transpose3.选择要转置的变量4.根据需要选择“名称变量”5.单击OK实验设计及数据处理李清平第四节数据转换一、计算(根据已有变量来建立新变量)1.读数据文件2.选Transform-→compute3.确定目标变量4.确定目标变量的数值表达式5.按OK例:数据文件“消费.sav”是某年16个地区农民消费支出数据,利用compute命令计算得到各地区的恩格尔系数。实验设计及数据处理李清平实验设计及数据处理李清平1.读数据文件;2.选Transform-→compute;3.在展开compute对话框中确定目标变量即新变量,故在TargetVariable处输入“系数”;4.确定目标变量的数值表达式,在NumericExpression框中输入表达式:系数=食品/(食品+衣着+燃料+住房+其它+文化);5.按OK。实验设计及数据处理李清平实验设计及数据处理李清平二、记数(Count)1.读数据文件2.选Transform-→Count3.输入目标变量,用于放记数结果4.确定参与记数的变量(即指定变量)5.指定值的定义6.按OK该命令的功能是建立新的数值变量,其取值是对指定变量等于指定值进行记数,经常用于问卷调查的数据处理。例如对数据文件“成绩”中的学生,分别统计每名学生的成绩有几门优秀。实验设计及数据处理李清平实验设计及数据处理李清平实验设计及数据处理李清平实验设计及数据处理李清平实验设计及数据处理李清平三、重编码(Record)1.建立新变量(1)读数据文件(2)选Transform-→Record-→IntoDifferenceVariable(3)对重编码变量另外再取一个名字(4)定义新旧变换值(5)按OK2.不建立新变量(1)读数据文件(2)选Transform-→Record-→IntoSomeVariable(3)确定要重编码的变量(4)确定新旧变换值(即编码方法)(5)按OK例:一家电脑销售公司三个月的日销售量数据,如果要研究日销售量的分布规律,可以进行分组分析,则将日销售量在140-149编码为1,150-159编码为2,以此类推。然后再对重编码以后的数据进行描述统计分析,得到组距分组的结果。实验设计及数据处理李清平(1)建立数据文件;(2)选Transform-Record-IntoDifferenceVariable展开对话框;(3)对重编码变量另外再取一个名字;在变量列表栏点击变量“销售量”,再单击向右箭头按钮,则出现“销售量-?”,在Name框中输入新的变量名fenzu,单击Change按钮;141159166172177182188196203214143160167173177183189196203215144160168173178184189196205218149161168174178185189196206223150161168174178186190196207225152162170174179186190197208226153163171175179187191197209228153163171175179187192198210233154164172175180187194198210233155165172175180187194200211234156165172176181188195201211234158165172176182188195202213237(4)定义新旧变换值,单击Old&NewValues按钮,展开下一级对话框;(5)在OldValues下方栏中选择Range输入140though149,在NewValue下方的Value栏中输入1;(6)单击Add按钮,则在Old-→New栏中显示“140though149-→1”;(7)重复(5)-(6)步,输入所有的变换值;(8)按OK。重新编码的结果是在数据文件中新产生新的变量Fenzu,变量值由系统根据编码规则自动填充。四、自动代码重置(AutomaticRecord)(1)读数据文件(2)选Transform-→AutomaticRecord(3)确定要重置代码的变量(4)输入新变量名字(5)按OK实验设计及数据处理李清平9.2.3单变量描述统计分析第一节概述描述统计学、推断统计学集中趋势(算术平均数、众数、中位数)离中趋势(全距、平均差、方差、离散系数等)偏态系数、峰度系数用以判断数据分布是否对称和集中趋势的程度如何。变量描述统计分析包括四个过程。第二节频数分析(Frequencies)(一)原始数据资料分析例1:随机抽取50位大学新生,调查他们的年龄数据如下(略),做描述统计分析。1.建立数据文件2.选Analyze-→DescriptiveStatistics-→Frequencies打开对话框3.确定要分析的变量实验设计及数据处理李清平4.击Statistics按钮,选择统计量5.击Chart按钮,选择统计图6.击Format按钮,选择频数表输出格式7.击OK(二)次级数据资料分析1.对资料进行分组,分组完成后再用Frequencies过程。(1)打开数据文件(2)选Transform-→Record-→IntoSomeVariable对年龄进行编码(3)再用Frequencies过程进行频数分析。2.对已分组的资料进行频数分析(1)输入组中值和次数(2)制定次数为加权变量(3)调用频数分析过程,其中要选择对应项Valuesaregroupmidpoints实验设计及数据处理李清平第三节描述统计(Descriptives)描述统计分析的结果指标与频数分析结果基本相同,区别在于描述统计操作更简单,输出的描述统计指标少些,不输出频数分布表。1.打开数据文件2.选择Analyze-→DescriptiveStatistics-→Descriptive3.确定分析变量4.根据需要选择OPTION按钮5.单击OK例如;已知生产同类产品的五家企业计划完成情况及一级品率资料如下(略)试求(1)平均计划完成情况。操作步骤:1.建立数据文件2.对f1进行加权3.选Analyze-→DescriptiveStatistics-→Descriptive4.把x1放置Variable框中5.点击OPTION按钮,选择输出的统计量6.点击OK按钮实验设计及数据处理李清平(2)平均一级品率操作步骤:1.打开数据文件2.选择Transform-→compute3.确定目标变量F24.确定目标变量的数值表达式X1*F15.按OK6.对F2进行加权7.选Analyze-→DescriptiveStatistics-→Descriptive8.把x2放置Variable框中9.点击OPTION按钮,选择输出的统计量10.点击OK按钮实验设计及数据处理李清平第四节探索性数据分析探索性数据分析是对数据进行初步考察,由描述统计指标和直观的图形组成。包括检查数据的错误、描述数据的数量特征和分布特征、奇异值的辨认等。1.打开数据文件2.选Analyze-→DescriptiveStatistics-→Explore3.确定分析变量4.确定分组变量5.根据需要点击“Statistics”按钮6.根据需要点击“Plots”按钮7.点击OK实验设计及数据处理李清平第五节平均数分析(Mean)Mean过程可用于分组计算各描述统计量。1.打开数据文件2.选择Analyze-→Compar