均值比较及差异性检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

在科学研究中经常采用通过样本来分析总体的方法,因为对总体的研究在很多情况下不现实或没有必要,因此常常是从总体中抽取一定数量的样本,从对样本观察或实验结果的特征来对总体的特征进行估计和推断。在统计分析过程中,很重要的一点是对抽样的样本必须有代表性,即每个个体都有同等概率被抽中。但由于抽样误差的存在,在抽样过程中不可避免会抽到一些数值较大或较小的个体导致样本统计量与总体参数之间有所不同,所造成的问题就是:某个样本能否认为是来自某个确定均值的总体。在正态或近似正态分布的计量资料中,经常在使用统计描述过程分析后,还要进行组与组之间平均水平的比较。本章介绍的T检验方法,主要应用在两个样本间比较且只能进行一个或两个样本间的比较。如果需要比较两组以上样本均数的差别,则需使用方差分析方法。T检验的基本原理是:首先假设零假设H0成立,即样本间不存在显著差异,然后利用现有样本根据t分布求得t值,并据此得到相应的概率值p,若p≤,则拒绝原假设,认为两样本间存在显著差异。均值比较的使用前提使用SPSS的均值比较过程进行统计分析时,对使用的数据有一定要求:1.因变量必须是数值型变量;2.自变量可以使数值型或短字符型变量(8字符以内);5.1Mean过程5.2单一样本T检验5.3独立样本T检验5.4两配对样本T检验5.5正态分布检验5.1Means过程Means过程是SPSS计算各种基本描述统计量的过程。与计算某一样本总体均值相比,Means过程其实就是按照用户指定条件,对样本进行分组计算均数和标准差,如按性别计算各组的均数和标准差。用户可以指定一个或多个变量作为分组变量。如果分组变量为多个,还应指定这些分组变量之间的层次关系。层次关系可以是同层次的或多层次的。同层次意味着将按照各分组变量的不同取值分别对个案进行分组;多层次表示将首先按第一分组变量分组,然后对各个分组下的个案按照第二组分组变量进行分组。Means过程的计算公式为:基本操作过程:1.选定Means过程对话框;(Analyze-CompareMeans-Means)2.选择自变量与分组变量(也可加入层变量);3.对Means过程的分析结果进行比较分析;5.2单样本T检验SPSS单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。统计的前提是样本总体服从正态分布。也就是说单样本本身无法比较,进行的是其均数与已知总体均数间的比较。单样本T检验的零假设为H0:总体均值和指定检验值之间不存在显著差异。采用T检验方法,按照下面公式计算T统计量:基本操作步骤:1.选择单样本T检验对话框;(Analyze-CompareMeans–OneSampleTTest)2.选择比较变量,指定均值数值、置信区间和缺失值处理;3.对输出结果进行比较分析;5.3独立样本T检验独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是了解两个样本之间是否有显著差异存在。检验前提条件:1.两个样本应是互相独立的,即从总体中抽取一批样本对从同一总体抽取的另一样本没有任何影响,两组样本个案数目可以不同,个案顺序可以随意调整。2.样本来自的总体应该服从正态分布。独立样本T检验的零假设H0为两总体均值之间不存在显著差异。在具体的计算中需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。理论步骤:1.判断两个总体的方差是否相同SPSS采用LeveneF方法检验两总体方差是否相同。2.根据第一步的结果,决定T统计量和自由度计算公式(1)两总体方差未知且相同情况下,T统计量计算公式为(2)两总体方差未知且不同情况下,T统计量计算公式为T统计量仍然服从T分布,但自由度采用修正的自由度,公式为从两种情况下的T统计量计算公式可以看出,如果待检验的两样本均值差异较小,t值较小,则说明两个样本的均值不存在显著差异;相反,t值越大,说明两样本的均值存在显著差异。在分析结果中,SPSS还自动给出了两样本均值差值的估计标准误差(Std.ErrorDifference)。在方差相同的情况下,估计标准误差的计算方法是在方差不相同的情况下,估计标准误差的计算方法是5.4配对样本T检验配对样本T检验是根据样本数据对样本来自的两配对总体的均值是否有显著性差异进行推断。一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。两配对样本T检验的前提要求:1.两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。2.样本来自的两个总体应服从正态分布。两配对样本T检验的零假设H0为两总体均值之间不存在显著差异。首先求出每对观察值的差值,得到差值序列;然后对差值求均值;最后检验差值序列的均值,即平均差是否与零有显著差异。如果平均差和零有显著差异,则认为两总体均值间存在显著差异;否则,认为两总体均值间不存在显著差异。SPSS将自动计算T值,由于该统计量服从n−1个自由度的T分布,SPSS将根据T分布表给出t值对应的相伴概率值。如果相伴概率值小于或等于用户设想的显著性水平,则拒绝H0,认为两总体均值之间存在显著差异。相反,相伴概率大于显著性水平,则不拒绝H0,可以认为两总体均值之间不存在显著差异。5.5正态分布检验正态分布是统计分析中最为重要的分布。在SPSS中,正态分布的考察方法有:计算偏度和峰度系数进行分析,绘制直方图或P-P图进行观察,进行假设检验(K-S样本检验)。K-S单样本检验是一种分布拟合优度的检验,其方法是讲一个变量的累计分布函数与特定分布进行比较。K-S单样本检验一共可以检验4种比较常见的统计分布,即正态分布,均匀分布,泊松分布和指数分布。检验的基本思路:原假设为样本取自服从正态分布的总体,用Ai表示正态分布下某一数值的累积相对频数,Oi表示样本频数的相应值,K-S检验是以Ai和Oi的绝对差异为基础的,其检验统计量为:若原假设成立,则每次抽样研究中所得到的K值应当不会偏离0太远。为了方便计算出各种情况下K值所对应的概率大小,统计软件还往往会将K值转化为Z值:并进一步根据一定公式计算出P值,其大小的意义与K值相同。示例:使用数据文件“sales.sav”,对销售收益(Revenue)进行正态分布检验。

1 / 33
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功