SPSS在数学建模中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

SPSS在数学建模中的应用第一讲SPSS的一般应用一、SPSSforWindows的界面介绍数据编辑窗口包括窗口名显示栏、主菜单、工具栏、数据编辑区、变量定义区和状态栏。结果编辑窗口显示和管理SPSS统计分析结果、报表及图形的窗口,可以将窗口中的内容以结果文件.spo的形式保存。数据编辑窗口结果编辑窗口二、建立数据文件定义变量数据录入数据编辑数据文件的保存调用其它数据文件定义变量单击数据编辑窗口左下方的“VariableView”标签或双击题头(Var),进入变量定义窗口。可定义:变量名(Name)变量类型(Type)变量长度(Width)小数点位数(Decimal)变量标签(Label)变量值标签(Values)缺失值的定义方式(Missing)变量的显示宽度(Columns)变量显示的对齐方式(Align)变量的测量尺度(Measure)定义变量定义变量名(Name)时,应注意:(1)变量名可为汉字或英文,英文的第一个字符必须为字母,后面可跟任意字母、数字、句点或@、#、_、$等;(2)变量名不能以句点结尾;(3)定义时应避免最后一个字符为下划线“_”(因为某些过程运行时自动创建的变量名的最后一个字符有可能为下划线);(4)变量的长度一般不能超过8个字符;(5)每个变量名必须保证是唯一的,不区分大小写。常用的变量类型(Type)包括:数值型、字符串型、日期格式变量等。数据录入定义变量后,单击“DataView”,即可在数据编辑窗口中输入数据。例1:马尾松腮扁叶蜂调查数据.doc数据文件的保存选择“File”菜单的“Save”命令,可直接保存为SPSS默认的数据文件格式(*.sav)。选择“File”菜单的“SaveAs”命令,弹出“SaveDataAs”对话框,可选择保存为Excel(*.xls)等文件格式。数据编辑(1)数据的排序:Data→SortCases…(2)数据的转置:Data→Transpose…(3)数据的聚合:Data→AggregateData(4)数据文件的拆分:Data→SplitFile(5)数据文件的合并:Data→MergeFiles→AddCases…/AddVariables(6)数据的转换:Transform→Compute…例2:数据编辑案例.docSPSS调用其他数据文件按照File→Open→Data…的顺序选择菜单项,打开“OpenFile”对话框。可以打开的文件格式除了SPSS(*.sav)外,还包括:Excel(*.xls)、数据文件(*.dat)和文本文件(*.txt)。三、SPSS制图主要通过“Graph”菜单中的选项来创建图形。SPSS在数学建模中的应用.ppt第二讲方差分析方差分析是检验多个总体均值之间是否存在显著差异的一种统计方法。例如,研究不同班级学生的学习成绩是否存在差异。学习成绩教学方法接受能力心理素质努力程度所用教材例题根据因素的个数,可以将方差分析分为:单因素方差分析多因素方差分析单因素方差分析的控制变量只有一个,而控制变量可以有多个观察水平。例如,在研究教学方法对学习成绩的影响,可以选择多种不同的教学方法进行实验。如果这些方法之间存在显著的差异性,就可以选择最有效的手段来提高教学水平。一、单因素方差分析例如:把18名学生分为三个等组,各组内学生的能力相当,在三种不同的教学方法下进行相同内容的学习。其中:第一组为受表扬组,每次练习后,不管成绩如何,始终受到表扬;第二组为受训斥组,始终受到训斥;第三组为对照组,不受任何信息作用。将三组学生相互隔离,若干天后对他们进行考试,得到每组的学习成绩:123456第一组928899859490第二组796689997089第三组757067667362各组的教学效果是否存在差异?哪种教学效果最好?单因子方差分析的数据结构因素A的水平观察值……………1A2AkA11x12x11nx21x22x22nx1kx2kxkknx单因素方差分析的步骤提出假设——构造检验的统计量——显著性检验——得到结论1、提出假设在单因素方差分析中,要检验因素A的k个水平(总体)的均值是否相等,因此提出假设的一般形式为:原假设:对立假设:kH210:不全相等kH,,,:2112、构造检验的统计量由于样本均值可以作为总体均值的估计,所以可以借助样本均值粗略估计一下总体均值的情况。符号说明:总样本容量第i水平的样本均值总样本均值ixiknnnn21injijiixnx11kiiikinjijxnnxnxi111112、构造检验的统计量当时,有,。对例子中的数据,由于各组样本容量相等,于是计算得到总样本均值rnnnk21rjijixrx11kiiixnkx118.68,0.82,3.91321xxx7.80)(31321xxxx2、构造检验的统计量Questions三组的样本均值各不相等,能否说明三组的总体均值有明显差异?为什么观察值之间存在差异?这些差异是由哪些原因造成的?如何来衡量各组之间的差异大小呢?2、构造检验的统计量所有观察值几乎各不相等,它们的分散程度可以用总平方和来度量。观察值之间的差异越大,SST越大。在单因素实验中,造成观察值差异的原因有两个:一个是由随机误差引起的,不可避免;另一个就是由因素的不同水平造成的。kinjijixxSST1122、构造检验的统计量我们定义组间平方和来度量各组之间的差异。定义组内平方和来度量组内随机误差引起的偏差。可以证明:kiiixxnSSA12kinjiijixxSSE112SSESSASST2、构造检验的统计量按照构造统计量的基本原则:统计量具有一定的实际意义统计量要服从某已知分布可以构造单因素方差分析的统计量:服从自由度为的F分布。)()1/(kNSSEkSSAF),1(kNk3、显著性检验对给定的显著性水平,当时,应拒绝原假设,即认为各水平之间有明显差异;否则应接受原假设,即认为各水平之间无明显差异。kNkFF,1例题的求解方差来源平方和自由度均方F值组间SSA=1533.44k-1=2SSA/(k-1)=766.72组内SSE=1030.17n-k=15SSE/(n-k)=68.68=11.16总计SST=2563.61n-1=17)()1/(kNSSTkSSAF当时,查F分布表得到,由于,因此应拒绝原假设。68.315,205.0F05.015,205.0FF4、SPSS的实现过程(1)选择菜单Analyze→Comparemeans→One-WayANOVA,弹出One-WayANOVA对话框。(2)从左侧列表框中选择观测变量(指标),通过中间的移动按钮移入到右侧的DependentList框内。(3)从左侧列表框中选择因素变量,通过中间的移动按钮移入到右侧的Factor框内。(4)依次单击“Contrasts”按钮和“PostHoc”按钮,弹出One-WayANOVA:Contrasts对话框和One-WayANOVA:PostHoc对话框,由于这两个对话框太专业,也较少用,此处略。4、SPSS的实现过程(5)单击“Options”按钮,弹出One-WayANOVA:Options对话框。①Statistics项:选择Descriptive复选项,输出基本描述统计量,其他选项略。②MissingValues项:定义缺失值的处理方式。其内容设置与One-SamplesTTest完全相同,此处不再重复。③单击“Continue”按钮,返回到One-WayANOVA对话框。(6)单击“OK”按钮,即可完成单因素方差分析的操作。4、SPSS的实现过程例3:单因素方差分析.doc二、双因素方差分析实际中,有时需要考虑两个因素对实验结果的影响。例如饮料销售,除了关心饮料颜色之外,我们还想了解销售地区是否影响销售量。若把饮料的颜色看作影响销售量的因素A,饮料的销售地区则是影响因素B。对因素A和因素B同时进行分析,就属于双因素方差分析的内容。双因素方差分析是对影响因素进行检验,究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不显著。二、双因素方差分析双因素方差分析有两种类型:一个是无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。1、理论分析1、理论分析以下根据平方和分解的思想来给出检验用的统计量的计算公式。先引入下述记号:i=1,2,…,rj=1,2,…,s1111rsmijkijkyyN111smiijkjkyysm111rmjijkikyyrm11mijijkkyym1、理论分析其中总样本容量n=r×s×m。总偏差平方和ST、因素A的效应平方和SA、因素B的效应平方和SB、交互效应平方和SA×B以及误差平方和SE的计算公式如下:1、理论分析双因素方差分析表1、理论分析2、SPSS实现过程在“Analyze”菜单的“GeneralLinearModel”子菜单中选择“Univariate”。将观察变量添加到“DependentVariable”框中,将两个控制变量添加到“FixedFactor”框中。若考虑因子间的交互作用,可单击“Model”按钮,选择“Fullfactorial”;若不考虑交互作用,则选择“Custom”,再在“BuildTerms”下方选择“MainEffects”。与单因素方差分析类似,单击“Options”,可以选择是否进行方差相等的检验等。例4:双因素方差分析.doc第三讲相关及回归分析相关分析与回归分析是处理变量之间关系的一种常用统计方法。用这种方法可以定量地建立一个变量关于另一个变量或另几个变量的数学表达式(即数学模型),然后利用这种表达式,可以对该变量进行预测或控制。一、相关分析相关分析(CorrelationAnalysis)是根据实际观察的数据资料,在具有相关关系的变量之间,对现象之间的依存关系的表现形式和密切程度的研究。可以用两种方法来表现变量间的相关关系。一种方法是通过比较直观的散点图来表现,另一种方法是通过相关系数来反映。通过图形和数值两种方式,能够有效地揭示变量之间的关系的强弱程度。1、散点图散点图就是将数据以点的形式画在直角坐标系上,通过点组成的图形来观察两变量之间的相关关系。具体做法是:用横坐标代表自变量X,纵坐标代表因变量Y,通过观察或实验我们可以得到若干组数据(xi,yi),将其在平面直角坐标系中用点来表示。2、相关系数相关系数是根据样本数据计算的对两个变量之间线性关系强弱的度量值,用r来表示。若相关系数是根据总体全部数据计算的,则称为总体相关系数,记为ρ。样本相关系数的计算公式为:2、相关系数相关系数的意义:①0<r<1表示两个变量间存在正线性相关关系。②-1<r<0表示两个变量间存在负线性相关关系。③r=0表示两个变量间不存在线性相关关系。④|r|=1表示两个变量间存在完全线性相关关系。⑤|r|越接近于0,表示两个变量间的线性相关程度越低。⑥|r|越接近于1,表示两个变量间的线性相关程度越高。2、相关系数2、相关系数r的取值|r|<0.30.3≤|r|0.50.5≤|r|0.8|r|≥0.8相关程度不线性相关低度线性相关中度线性相关高度线性相关3、SPSS实现过程(1)选择菜单Analyze-Correlate-Bivariate,弹出BivariateCorrelations对话框。(2)把参加计算相关系数的变量从左侧列表框中选到右侧的Variables列表框中。(3)CorrelationCoefficients项:选择相关系数类型。包含3个

1 / 89
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功