T检验基本概念l单样本T检验l两独立样本T检验l两配对样本T检验。T检验是检验样本的均值和给定的均值是否存在显著性差异一、单样本T检验1、检验目的-利用来自某总体的样本数据,推断总体均值与制定的检验值之间是否存在显著性差异。2.单样本T检验的基本步骤。⑴提出原假设:单样本T检验的原假设H。为:总体均值与检验值之间不存在显著差异,表述为H。:,为总体均值,为检验值。⑵选择检验统计量:当总体分布为正态分布时,样本均值的抽样分布仍为正态分布,该正态分布的均值为μ,方差即为σ²/n,即式中,当为总体均值,当原假设成立时,,为总体方差;n为样本数。总体分布近似服从正态分布时。通常总体方差是未知的,此时可以用样本方差S²替代,得到的检验统计量为t统计量,数学定义为:),(~2nNX),(2N0002nSXt2⑶计算检验统计量观测值和概率P-值:该步目的是计算检验统计量的观测值和相应的概率P-值。SPSS将自动将样本均值、、样本方差、样本数代入式①中,计算出t统计量的观测值和对应的概率P-值。式中,t统计量服从n-1自由度为分布。单样本检验的检验统计量即为统计量。当认为原假设成立时用代入。⑷给定显著性水平,并作出决策:如果概率P-值小于显著性水平,则应拒绝原假设,认为总体均值与检验值之间存在显著差异;反之,如果概率P-值大于显著性水平,则不应拒绝原假设,认为总体均值与检验值之间无显著差异。0⑶按选项(O)按钮定义其他选项,出现图2所示的窗口。选项(O)选项用来指定缺失值的处理方法。另外,还可以输出默认95%的置信区间。至此,SPSS将自动计算平均值和对应的概率P-值。分析结果如表3和表4所示。表3.人均住房面积的基本描述统计结果100个家庭的人均住房面积的平均值为21.2平方米,标准差为1.7平方米表4人均住房面积单样本T检验结果总体均值的95%的置信区间为(20.8,21.5)平方米。即:我们有95%的把握认为家庭人均住房面积均值在20.8~21.5平方米之间。P<0.05,认为家庭人均住房面积的平均值与20㎡有显著差异该问题应采用双尾检验,因此比较a和p。如果a给定为0.05,由于p小于a,因此应拒绝原假设,认为家庭人均住房面积的平均值与20平方米由显著差异。),(211N),(222N),(211N二、两独立样本T检验1、检验目的-利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。2.基本步骤⑴提出零假设两独立样本T检验的原假设为:两总体均值无显著差异。表述为:⑵选择检验统计量当两总体分布分别为和时,两样本均值差的抽样分布仍为正态分布,该正态分布的均值为,方差为。在不同的情况下,有不同的计算方式。第一种情况:当两总体方差未知且相等,即时,采用合并的方差作为两个总体方差的估计,数学定义为式中,,分别为第一组和第二组样本的方差;n1,n2分别为第一组和第二组样本的样本数。此时两样本均值差的抽样分布的方差为:),(222N21),(211N2122122)1()1(212222112nnSnSnSp21S22S2122212212nSpnSp212212212nSpnSp第二种情况:当两总体方差未知且不相等,即时,分别采用各自的方差,此时两样本均值差的抽样分布的方差为:2212212nSpnSp212212212nSnS②于是,两总体均值差检验的检验统计量为t统计量,数学定义为:在第一种情况下,t统计量服从个自由度的分布;在第二种情况下,服从修正自由度的t分布,修正的自由度定义为2122121)(XXt221nn2222121212222121)()()(nnSnnSnSnSf③2⑶计算检验统计量观测值和概率P-值。该步的目的是计算F统计量和统计量的观测值以及相应的概率P-值。SPSS将自动依据单因素方差分析的方法计算F统计量和概率P-值,并自动将两组样本的均值、样本数、抽样分布方差等代入式③中,计算出统计量的观测值和对应的概率P-值。⑷给定显著性水平,并作出决策。第一步,利用F检验判断两总体的方差是否相等,并据此决定抽样分布方差和自由度的计算方法和计算结果。如果F检验统计量的概率P-值小于显著性水平,则应拒绝原假设,即两总体方差有显著差异,应选择式②和式③计算出的结果:反之,若果概率P-值大于显著性水平则不应拒绝原假设,认为两总体方差无显著差异。第二步,利用检验判断两总体方差是否存在显著差异。如果检验统计量的概率P-值小于显著性水平,则应拒绝原假设,认为两总体均值有显著性差异;反之,如果概率P-值大于显著性水平,则不应拒绝原假设,认为两总体均值无显著差异。3.两独立样本T检验的应用举例分析A、B两所高校大一学生的高考数学成绩之间是否存在显著性差异.SPSS单样本T检验的基本操作步骤是:⑴选择菜单【分析】→【比较均值】→【独立样本T检验】⑵将数学成绩到【检验变量(T)】框中。于是出现如图所示的窗口。⑶选择总体标识变量到【分组变量】框中。样本均值有一定的差异p0.05,认为二者方差无显著差异P>0.05,因此认为两总体的均值无显著差异。两总体差的95%置信区间的上下限三.两配对样本T检验1.检验的目的-利用来自两个不同总体的配对样本,推断两个总体的均值是否存在显著差异。配对样本通常有两个特征:第一,两组样本的样本数相同;第二,两组样本观测值的先后顺序是一一对应的,不能随意更改。2.基本步骤⑴提出原假设两总体均值无显著差异,表述0H0H021⑵选择统计量。两配对样本T检验采用T统计量。首先,对两组样本分别计算出每对观测值的差值得到差值样本;然后,体用差值样本,通过对其均值是否显著为0的检验来推断两总体均值的差是否显著为0.⑶计算检验统计量观测值和概率P-值SPSS将计算两组样本的差值,并将相应数据代入式①,计算出T统计量的观测值和对应的概率P-值。nSXt2⑷给定显著水平,并作出决策。给定显著水平a,与检验统计量的概率P-值作比较。如果概率P-值小于显著水平a,则应拒绝原假设,认为差值样本的总体均值与0有显著不同,两总体的均值有显著差异;3.两配对样本T检验的应用举例。案例:为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行了减肥跟踪调研。⑴选择菜单:【分析】→【比较均值】→【配对样本T检验】出现如图所示的窗口。喝茶前后体重平均值有较大差异,说明喝茶后的平均体重低于喝茶前的平均体重。它表明在显著性水平为0.05时,肥胖志愿者服用减肥茶前后的体重有明显的线性变化,喝茶前和喝茶后体重的线性相关程度较强.双尾概率P-值,接近于0.,p0.05,说明拒绝原假设即认为总体上体重差的平均值与0有显著不同,意味着喝茶前与喝茶后的体重平均值存在显著差异,可以认为该减肥茶具有显著的减肥效果。