t检验使用条件及在SPSS中的应用t检验是对均值的检验,有三种用途,分别对应不同的应用场景:1)单样本t检验(OneSampleTTest):对一组样本,检验相应总体均值是否等于某个值;2)相互独立样本t检验(Independent-SampleTTest):利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著性差异;3)配对样本t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。下文将分别介绍三种t检验的使用条件以及在SPSS中的实现。一、单样本t检验1.1简介1)单样本t检验的目的利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著性差异,它是对总体均值的检验。2)单样本t检验的前提样本来自的总体应服从和近似服从正态分布,且只涉及一个总体。如果样本不符合正态分布或不清楚总体分布的形状,就不能用单样本t检验,而要改用单样本的非参数检验。3)单样本t检验的步骤a)提出假设单样本t检验需要检验总体的均值是否与指定的检验值之间存在显著性差异,为此,给定检验值μ0,提出假设:H0:μ=μ0(原假设,nullhypothesis)H1:μ≠μ0(备择假设,alternativehypothesis,)b)选择检验统计量属于总体均值和方差都未知的检验采用t统计量:t=X̅−μ0Ŝ√n⁄,其中,X̅和Ŝ分别为样本均值和方差,t的自由度为n-1SPSS中还将显示均值标准误差,计算公式为Ŝ√n⁄,即t统计量的分母部分。c)计算统计量的观测值和概率将样本均值、样本方差、μ0带入t统计量,得到t统计量的观测值,查t分布界值表计算出概率P值。d)给出显著性水平α,作出统计判断给出显著性水平α,与检验统计量的概率P值作比较。当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为总体均值与检验值μ0之间有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为总体均值与检验值μ0之间没有显著性差异。1.2在SPSS中的实现首先是检验样本的分布是否符合正态分析,检验方法见《正态性检验和正态转换的方法以及在SPSS中的实现》,如果符合正态分布或近似符合正态分布,则进行t检验,否则进行非参数检验。步骤1)在比较均值中选择单样本t检验,弹出单样本t检验对话框。步骤2)选择待检验的变量和检验值。点击“选项”可以选择置信区间(决定显著性水平)和缺失值的处理方式。按分析顺序排除个案(翻译不是很好,原文是Excludecasesanalysisbyanalysis):在检验过程中,仅提出参与分析的缺失值。按列表提出个案(Excludecaseslistwise):剔除含缺失值的个案。步骤3)点击确定,解读分析结果从分析结果看出,样本的总数n为2993,平均值Mean为22,大于步骤2中给定的均值20。在95%的置信区间里,给定的显著性水平为0.05。从结果中可以看出,Sig.(2-tailed)=0.0000.05,拒绝原假设,H0:u=u0。即人均住房面积的平均值与20平方米有显著差异。二、独立样本t检验2.1简介1)独立样本t检验的目的利用来自某两个总体的独立样本,推断两个总体的均值是否存在显著性差异;One-SampleStatistics299322.006012.70106.23216人均面积NMeanStd.DeviationStd.ErrorMeanOne-SampleTest8.6402992.0002.005961.55082.4612人均面积tdfSig.(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=202)独立样本t检验的前提样本来自的总体应服从或近似服从正态分布两组样本相互独两样本的总体方差相等,若两样本的总体方差不相等时,采用近似t检验。独立样本t检验涉及的是两个总体,并采用t检验的方法,同时要求两组样本相互独立,即从一个总体中抽取一组样本对另一个总体抽取的样本没有影响,两组样本的个案数目可以不相等。如果两个样本有一个不符合正态分布或不清楚总体分布的形状,就不能用t检验,而要改用两个独立样本的非参数检验。3)独立样本t检验的步骤a)提出假设独立样本t检验需要检验两个总体的均值是否存在显著性差异,为此,提出假设:H0:μ1=μ2(原假设,nullhypothesis)H1:μ1≠μ2(备择假设,alternativehypothesis,)b)选择检验统计量第一种情况:当两总体方差未知且相等,采用合并的方差作为两个总体方差的估计,数学定义为t=X1̅̅̅−X2̅̅̅−(μ1−μ2)Sω√1n1+1n2其中,n1和n2为两个样本的容量,Sω2=(n1−1)S12+(n2−1)S22n1+n2−2,S1和S2分别为样本方差。第二种情况,当两总体方差不相等时,采用数学定义t=X1̅̅̅−X2̅̅̅−(μ1−μ2)√S12n1+S22n2可见,两独立样本t检验的结论在很大程度上取决于两个总体的方差是否相等,这就就就要求在进行t检验之前要检验两个总体的方差是否相等,也称为方差齐性检验。其中要判断两总体方差是否相等,就可以用F检验。F检验的原假设是两个总体的方差相等,在执行检验过程中,若概率P值小于给定的显著水平,则拒绝原假设,即认为方差不相等,否则认为方差相等。c)计算统计量的观测值和概率在给定原假设的条件下,将检验值0代入(μ1−μ2),将样本均值、样本方差、样本容量代入公式,得到t统计量的观测值,查t分布界值表计算出概率P值。d)给出显著性水平α,作出统计判断给出显著性水平α,与检验统计量的概率P值作比较。当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为两个总体的均值有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为两个总体的均值之间没有显著性差异。2.2在SPSS中的实现步骤1)两独立样本t检验之前,对于数据的正确处理是一个非常关键的任务,spss要求两组数据在一个变量中,即在一个列中,同时要定义一个存放总体标志的标识变量。步骤2)选择“检验变量”和“分组变量”,在“定义组”时,此处使用指定值,因为原始数据已经定义相关组。置信区间通常是默认的95%。步骤3)结果解释:表中给出了t检验的两个结果,一个是方差相等时的t检验结果,一个是方差不相等时的t检验结果,到底应该采用哪种t检验结果取决于“方差方程的levene检验”结果,表中通过F检验的观察值为65.469,概率值为0,小于显著性水平,认为方差存在显著差异。在方差不相等的条件下,,则采用“方差不相等”这一行对应的t检验结果,再通过t检验的结果知,概率值都是小于显著性水平,认为两个总体的均值存在显著差异。最后的两列给出95%置信区间与总体均值差的上下限。三、两配对样本t检验3.1简介1)两配对样本t检验的目的检验两相关样本均数所代表的未知总体均数是否有差别。2)两配对样本t检验的前提配对设计的数据一一对应,前后顺序不能颠倒,样本容量相同配对样本的差值d变量服从正态分布3)两配对样本t检验步骤其检验思路就是做差值,转化为单样本t检验,最后转化为差值序列总体均值是否与0有显著差异做检验。具体来讲,配对样本t检验是通过求出每对观测值之差,所有样本的观测值之差形成一个新的单样本,显然,如果两个样本的均值没有差异,则两个样本值之差的均值应该接近0,这实际就转化为了单样本t检验,检验值为0。所以配对样本t检验就是检验差值来自总体的均值是否为零,这就要求差值来自的总体服从正态分布。a)构造新的统计量D=X1−X2,对用的样本di=x1i−x2i,i=1,2,…,n.这样就转化为单样本t检验问题,即检验D的均值是否与0有显著性差异。首先检验差值统计量是否符合正态分布,如果不符合,则b)提出假设H0:μd=0(原假设,nullhypothesis)H1:μd≠0(备择假设,alternativehypothesis,)c)选择检验统计量01dddddddtnSSnSn22()1dddnSnd)计算统计量的观测值和概率将样本均值代入t统计量,得到t统计量的观测值,查t分布界值表计算出概率P值。e)给出显著性水平α,作出统计判断给出显著性水平α,与检验统计量的概率P值作比较。当检验统计量的概率值小于显著性水平时,则拒绝原假设,认为两样本差值的均值与检验值0之间有显著性差异;反之,如果检验统计量的概率值大于显著性水平,则接受原假设,认为两样本差值的均值与检验值0之间没有显著性差异。3.2在SPSS中的实现步骤1)调出窗口步骤2)置信区间默认的是95%,缺失值的处理方法选择是第一种方法。步骤3)结果解释第一个表格是数据的基本描述。第二个是数据前后变化的相关系数,那个概率P值是相关系数的概率值,概率小于显著性水平0.05,所以拒绝原假设,即认为用中草药青木香治疗前后的舒张压有显著的相关性;。第三个表格是数据相减后与0的比较,通过概率值为0,小于显著性水平0.05,则拒绝原假设,相减的差值与0有较大差别,则表明数据变化前后有显著的变化。附t检验注意事项:1、选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)。理论上,即使样本量很小时,也可以进行t检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,只好使用非参数检验代替t检验进行两组间均值的比较。2、区分单侧检验和双侧检验。单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。t检验中的p值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率。3、假设检验的结论不能绝对化。当一个统计量的值落在临界域内,这个统计量是统计上显著的,这时拒绝虚拟假设。当一个统计量的值落在接受域中,这个检验是统计上不显著的,这是不拒绝虚拟假设H0。因为,其不显著结果的原因有可能是样本数量不够拒绝H0,有可能犯第Ⅰ类错误。4、正确理解P值与差别有无统计学意义。P越小,不是说明实际差别越大,而是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。5、假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。6、涉及多组间比较时,慎用t检验。科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为是T检验的推广。在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点。(进行多次的T检验进行比较设计中不同格子均值时)。