差异分析1、均值描述—Means过程2、t检验3、方差分析均值描述——Means过程定义:Means过程是SPSS计算各种基本描述统计量的过程。Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。Means过程的计算公式为:研究问题比较不同性别同学的数学成绩平均值和方差。数据如表所示。数学成绩表性别数学Male99795989798999Female88545623假设检验的一般步骤:•根据实际问题提出原假设H0与备择假设H1。•选择统计量t作为检验统计量,并在H0成立的条件下确定t的分布。•选择显著性水平,并根据统计量t的分布查表确定临界值及H0的拒绝域。•根据样本值计算统计量的值,并将其与临界值作比较。•下结论:若统计量的值落入拒绝域内,就拒绝H0;否则,不拒绝H0。t检验就是检验统计量为t的假设检验。用于检验两个变量之间的差异。显著性水平:0.05——显著0.001——非常显著0.0001——极其显著•单样本t检验——样本均值与总体均值的比较•独立两样本t检验——独立两样本均值比较•配对样本t检验——配对设计的差数均值与总体均值0的比较t检验的类型单样本t检验统计学上的定义和计算公式定义:SPSS单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提是样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。单样本T检验的零假设为H0总体均值和指定检验值之间不存在显著差异。采用T检验方法,按照下面公式计算T统计量:SPSS中实现过程分析——比较均值——单样本T检验SPSS中实现过程研究问题分析某班级学生的高考数学成绩和全国的平均成绩70之间是否存在显著性差异。数据如表所示。数学成绩表性别数学Male99795989798999Female88545623单尾检验与双尾检验(邱P169)在平均数的检验中,研究者的兴趣往往在于比较不同平均数的差距,而提出两个平均数大于、小于与不等于几种不同形式的研究假设,形成有特定方向的检验或无方向性的检验两种不同模式。当研究者只关心单一一个方向的比较关系时(例如男生的数学成绩X1优于女生X2),平均数的检验仅有一个拒绝区,需使用单尾检验(one-tailedtest),范例如下:单尾检验由于仅需考虑单方向的差异性,因此在同样的显著水平下,可以较双侧检验容易得到显著结果,统计检验力(power)大于双侧检验,因此采用单侧检验对于研究者较为有利。但是,采用单尾检验必须提出支持证据,除非理论文献支持单侧的概念,或是变量间的关系具有明确的线索显示必需使用单侧检验,否则需采用双侧检验来检验平均数的特性。当研究者并无特定方向的设定(例如男生的智商与女生的智商有所不同),假设检验在两个极端的情况皆有可能发生,而必须设定两个拒绝区,此时即需使用双尾检验(two-tailedtest)。如:分别是男生与女生数学成绩的平均数独立两样本t检验定义:所谓独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。这个检验的前提如下:注意:两样本必须是独立的,即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。样本来自的总体要服从正态分布且变量为连续测量数据。在进行独立两样本t检验之前,要通过F检验来看两样本的方差是否相等。从而选取恰当的统计方法。两独立样本T检验的零假设H0为两总体均值之间不存在显著差异。在具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。F值异质同质结果显著结果不显著是否显著?T值显著否?T值显著否?P.05(接受虚无假设)P=.05P=.05P.05(接受虚无假设)P.051.判断两个总体的方差是否相同SPSS采用LeveneF方法检验两总体方差是否相同。如果“F值”检验不显著(Sig.的值大于.05),表示两个组别群体变异数相等,此时看“方差齐性相等”所列之t值,看其是否显著。如果“F值”检验显著(Sig.的值小于.05),表示两个组别群体变异数不相等,此时看“方差齐性不相等”所列之t值,看其是否显著。2.根据第一步的结果,决定T统计量和自由度计算公式(1)两总体方差未知且相同情况下,T统计量计算公式为(2)两总体方差未知且不同情况下,T统计量计算公式为T统计仍然服从T分布,但自由度采用修正的自由度,公式为从两种情况下的T统计量计算公式可以看出,如果待检验的两样本均值差异较小,t值较小,则说明两个样本的均值不存在显著差异;相反,t值越大,说明两样本的均值存在显著差异。SPSS中实现过程分析——比较均值——独立样本T检验SPSS中实现过程研究问题分析A、B两所高校大一学生的高考数学成绩之间是否存在显著性差异。两所学校学生的高考数学成绩表学校数学清华998879595489795689北大992389705067788956图4-6“Independent-SamplesTTest”对话框图4-7“DefineGroups”对话框结果和讨论统计学上的定义和计算公式两配对样本T检验定义:两配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。两配对样本T检验的前提要求如下:两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。样本来自的两个总体应服从正态分布。两配对样本T检验的零假设H0为两总体均值之间不存在显著差异。•原理1、配对样本t检验是配对设计的样本差数的均值同总体均值0比较的t检验。2、配对样本t检验是针对配对数据的t检验。其检验方法是首先求出每对样本的差值,然后比较样本差值的均值和总体均值0之间的关系。如果两组数据没有差别,那么其样本差值的均值应该在0附近波动。否则为两组数据是有差别的。这种方法的本质就是在对配对样本的差值同总体均值0做单样本t检验。◆注意单样本t检验和独立两样本t检验样本内部数据的顺序是可以任意调换。而配对样本t检验的样本必须是一一对应的。样本内数据的顺序不能随意交换顺序。SPSS将自动计算T值,由于该统计量服从n−1个自由度的T分布,SPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平,则拒绝H0,认为两总体均值之间存在显著差异。相反,相伴概率大于显著性水平,则不拒绝H0,可以认为两总体均值之间不存在显著差异。SPSS中实现过程分析——比较均值——配对样本T检验方差分析多个独立样本的差异显著性检验,通常可以使用方差分析方法。•油菜品种差异性分析P164不同教学方式是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。方差分析基本概念方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。方差分析方法在不同领域的各个分析研究中都得到了广泛的应用。从方差入手的研究方法有助于找到事物的内在规律性。由于各种因素的影响,研究所得的数据呈现波动状而有所不同。造成波动的原因可分成两类:一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为随机变量;另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。方差分析可以用来判断样本数据之间的差异到底是由以上哪种因素造成的。随机变量控制变量随机误差系统误差不可控有固定的大小和方向(正或负),重复测定时重复出现,可以校正或消除。方差分析的目的主要有以下:1、通过数据分析找出对该事物有显著影响的因素;2、研究各因素之间的交互作用是否对该事物造成影响。◆注意:方差分析的适用条件•1、样本来自的总体服从正态分布。•2、样本方差必须是齐次的。•3、各样本之间相互独立。•方差分析的类型单因素方差分析单因素方差分析是指只单独考虑一个因素A对指标X的影响。此时其他因素都不变或者控制在一定的范围之内。考虑因素A有k个水平,在每次水平下做ni次试验。在方差分析中,代表变异大小,并用来进行变异分解的指标是离均差平方和。总的变异平方和记为SST,被分解为两项:第一项是各组的离均差平方和之和,代表组内变异(即随机变量引起的变异),称为组内平方和SSW(WithinGroups);第二项是按样本含量大小加权的各组均数与总均数的差值平方之和,代表组间变异(由控制变量引起的变异),称为组间平方和或者处理平方和SSB(BetweenGroups)。总变异=组内变异+组间变异总变异=随机变异+处理因素导致的变异这样,我们可采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的影响确实存在,如果两者相差无几,则说明影响不存在,这就是方差分析的基本思想。其中,k为水平数;ni为第i个水平下的样本容量。可见,组间样本离差平方和是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。SST=SSW+SSB计算公式F统计量是平均组间平方和与平均组内平方和的比(组间变异与误差变异的比值)。从F值计算公式可以看出,如果控制变量的不同水平对观察变量有显著影响,那么观察变量的组间离差平方和必然大,F值也就比较大;相反,如果控制变量的不同水平没有对观察变量造成显著影响,那么,组内离差平方和影响就会比较大,F值就比较小。SPSS中实现过程分析——比较均值——单因素ANOVASPSS中实现过程研究问题三组学生的数学成绩人名数学组别hxh99.000yaju88.000yu99.000shizg89.000hah94.000s90.000watet79.002jess56.002wish89.0022_new199.0022_new270.0022_new389.0022_new455.0012_new550.0012_new667.0012_new767.0012_new856.0012_new956.001实现步骤在菜单中选择“One-WayANOVA”命令“One-WayANOVA”对话框“One-WayANOVA:Options”对话框“One-WayANOVA:Contrasts”对话框“One-WayANOVA:PostHocMultipleComparisons”对话框结果和讨论(1)首先是单因素方差分析的前提检验结果,也就是Homogeneityofvariancetest——方差齐次性检验(2)输出的结果文件中第2个表格如下所示。(3)输出的结果文件中第3个表格如下所示。(4)输出的结果文件中第4个表格如下所示。(5)输出结果的最后部分是各组观察变量均值的折线图,如图5-6所示。事后比较方法的选择•LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然存在放大α水准(一类错误)问题,但换言之就是总的二类错误非常的小,要是LSD都没有检验出差别,那恐怕真的没有差别。•SNK法运用的最广泛的,它采用StudentRange分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制了一类错误。•张文彤P268多因素方差分析统计学上的定义和计算公式多因素方差分析用来研究两个或两个以上控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最