第4章 t检验和Z检验

sjvivi
2 ℃
2020-02-11

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第四章t检验和Z检验第一节t检验以t分布为基础的检验为t检验。在医学统计学中，t检验是非常活跃的一类假设检验方法。医疗卫生实践中最常见的是计量资料两组比较的问题X25例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖(mmol/L)问两种疗法治疗后患者血糖值是否相同？药物治疗药物治疗合并饮食疗法12n1=121X=15.212X=10.85n2=13甲组乙组总体样本？＝推断t检验——问题提出根据研究设计,t检验有三种形式：单个样本的t检验配对样本均数t检验(非独立两样本均数t检验)两个独立样本均数t检验第一节单个样本t检验又称单样本均数t检验(onesamplettest),适用于样本均数与已知总体均数μ0的比较,目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值。应用条件——总体标准未知的小样本资料(如n50),且服从正态分布。单个样本t检验原理已知总体0未知总体样本X在H0:=0的假定下，可以认为样本是从已知总体中抽取的，根据t分布的原理，单个样本t检验的公式为：自由度＝n-1例5.1：以往通过大规模调查已知某地新生儿出生体重为3.30kg。从该地难产儿中随机抽取35名新生儿,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同?003.423.301.770.40/35XXXtSSn3.确定P值，做出推断结论本例自由度n-135-134，查附表2，得t0.05/2,34=2.032。因为tt0.05/2,34，故P0.05，按0.05水准，不拒绝H0，差别无统计学意义，尚不能认为该地难产儿与一般新生儿平均出生体重不同。1.建立检验假设，确定检验水准H0：0;H1：0;0.05。2.计算检验统计量第二节配对样本均数t检验简称配对t检验(pairedttest),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较。配对设计(paireddesign)是将受试对象按某些特征相近的原则配成对子，每对中的两个个体随机地给予两种处理。配对设计概述应用配对设计可以减少实验的误差和控制非处理因素，提高统计处理的效率。配对设计主要有三种情况：（1）将受试对象按某些混杂因素（如性别、年龄、窝别等）配成对子，每对中的两个个体随机分配给两种处理（如处理组与对照组）；（2）同一受试对象或同一标本的两个部分，随机分别进行不同处理（或测量）。（3）同一受试对象自身前后对照。配对t检验原理配对设计的资料具有对子内数据一一对应的特征,研究者应关心是对子的效应差值而不是各自的效应值。进行配对t检验时，首选应计算各对数据间的差值d，将d作为变量计算均数。配对样本t检验的基本原理是假设两种处理的效应相同，理论上差值d的总体均数μd为0，现有的不等于0差值样本均数可以来自μd=0的总体,也可以来μd≠0的总体。配对t检验原理可将该检验理解为差值样本均数与已知总体均数μd（μd=0）比较的单样本t检验.其检验统计量为：nSdSdSdtdddd0实例分析例5.2有12名接种卡介苗的儿童，8周后用两批不同的结核菌素，一批是标准结核菌素，一批是新制结核菌素，分别注射在儿童的前臂，两种结核菌素的皮肤浸润反应平均直径(mm)如表5-1所示，问两种结核菌素的反应性有无差别。表5-112名儿童分别用两种结核菌素的皮肤浸润反应结果(mm)编号标准品新制品差值dd2112.010.02.04.00214.510.04.520.25315.512.53.09.00412.013.0-1.01.00513.010.03.09.00612.05.56.542.25710.58.52.04.0087.56.51.01.0099.05.53.512.251015.08.07.049.201113.06.56.542.251210.59.51.01.00合计39(d)195(d2)先计算差数的标准差计算差值的标准误4909.211212391951222nnddSd7191.0464.34909.2nSSdd1.建立检验假设，确定检验水准H0：d=0;H1：d0;0.05。2.计算检验统计量本例d=39，d2195。3.确定P值，作出推断结论自由度计算为ν=n-1=n-1=12-1=11，查附表2，得t0.05/2,11=2.201，本例tt0.05/2,11，P0.05，拒绝H0，接受H1，差别有统计学意义，可认为两种方法皮肤浸润反应结果有差别。5195.47191.025.3dSdt按公式计算，得：第三节两独立样本t检验两独立样本t检验(twoindependentsamplet-test)，又称成组t检验。适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。完全随机设计是将受试对象随机地分配到两组中，每组患者分别接受不同的处理，分析比较处理的效应。两独立样本t检验要求两样本所代表的总体服从正态分布N(μ1，σ12)和N(μ2，σ22)，且两总体方差σ12、σ22相等,即方差齐性。若两总体方差不等,即方差不齐，可采用t’检验,或进行变量变换,或用秩和检验方法处理。两独立样本t检验原理两独立样本t检验的检验假设是两总体均数相等,即H0：μ1=μ2，也可表述为μ1－μ2=0,这里可将两样本均数的差值看成一个变量样本,则在H0条件下两独立样本均数t检验可视为样本与已知总体均数μ1－μ2=0的单样本t检验,统计量计算公式为：121212121212|()(0)|||,2XXXXXXXXtnnSS2121121nnSSCXX22122222121212nnnXXnXXSC其中两独立样本t检验原理Sc2称为合并方差(combined/pooledvariance),当两样本标准差S1和S2已知时,合并方差Sc2为:2)1()1(212222112nnSnSnSc实例分析例5.325例糖尿病患者随机分成两组，甲组单纯用药物治疗，乙组采用药物治疗合并饮食疗法，二个月后测空腹血糖(mmol/L)如表5-2所示，问两种疗法治疗后患者血糖值是否相同？表5-225名糖尿病患者两种疗法治疗后二个月血糖值(mmol/L)编号甲组血糖值(X2)编号乙组血糖值(X2)18.415.4210.526.4312.036.4412.047.5513.957.6615.368.1716.7711.6818.0812.0918.7913.41020.71013.51121.11114.81215.21215.61318.7建立检验假设，确定检验水准H0：1=2H1：120.05。计算检验统计量03.1721312130.14116.1743125.18243.2953222CS由原始数据算得:n1=12，X1=182.5，X12=2953.43，n2=13，X2=141.0，X22=1743.16，1X=ΣX1/n1=182.5/12=15.21，2X=ΣX2/n2=14.16/13=10.85代入公式，得:652.113112103.1721XXS=n1+n2-2=12+13-2=23；查t界值表，t0.05/2,23=2.069.由于tt0.05/2,23，P0.05，按0.05的水准，拒绝H0，接受H1，差异有统计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。几何均数资料t检验，服从对数正态分布，先作对数变换，再作t检验。639.2652.185.1021.15tt检验应用条件两组计量资料小样本比较；样本对总体有较好代表性，对比组间有较好组间均衡性——随机抽样和随机分组；样本来自正态分布总体，配对t检验要求差值服从正态分布，大样本时，用u检验，且正态性要求可以放宽；两独立样本均数t检验要求方差齐性——两组总体方差相等或两样本方差间无显著性。第四节方差不齐时两样本均数检验当两总体方差不等(方差不齐)时，两独立样本均数的比较，可采用检验,亦称近似t检验方差齐性检验——F检验F检验要求资料服从正态分布检验统计量F值按下列公式计算)()(2221较小较大SSFν１＝n１-1，ν2=n２-1t方差齐性检验为较大的样本方差，为较小的样本方差；检验统计量F值为两个样本方差之比，若样本方差的不同仅为抽样误差的影响，F值一般不会偏离1太远。求得F值后，查附表3（方差齐性检验用的F界值表）得P值。取α=0.05水准，若F≥F0.05(ν１,ν2)，P≤0.05,拒绝H0，接受H1，可认为两总体方差不等；若F＜F0.05(ν１,ν2），P＞0.05，两总体方差相等。21S22S第五节Z检验根据数理统计的中心极限定理,不论变量X的分布是否服从正态分布,当随机抽样的样本例数足够大,样本均数服从正态分布其中为原来的总体均数,为总体标准差为标准误标准正态变量为2(,)XN/Xn/XXXZnXZ检验原理当总体标准差已知,或样本量较大(如n50)时样本均数与总体均数比较、配对设计样本均数比较和两独立样本均数比较的假设检验,可以计算检验统计量Z值标准正态变量Z的界值双侧时单侧时0.05/20.01/21.96,2.58ZZ0.050.011.64,2.33ZZZ检验原理成组设计的两样本均数比较的统计量Z值计算中,两均数差的标准误为统计量Z值的计算公式为12221122//XXSSnSn121212221122//XXXXXXZSSnSnZ检验——实例分析例5-4研究正常人与高血压患者胆固醇含量(mg%)的资料如下,试比较两组血清胆固醇含量有无差别。正常人组高血压组111506,180.6,34.2nXS222142,223.6,45.8nXSZ检验——实例分析步骤建立检验假设,确定检验水平=0.05计算统计量Z值将已知数据代入公式,得012:H112:H22|180.6223.6|10.4034.2/50645.8/142ZZ检验——实例分析步骤确定P值,作出推断结论本例Z=10.401.96，故P0.05，按=0.05水准拒绝H0，接受H1，可以认为正常人与高血压患者的血清胆固醇含量有差别，高血压患者高于正常人。第六节假设检验中两类错误（1－b）即把握度（powerofatest)，也称检验效能:两总体确有差别，被检出有差别的能力（1－）即可信度（confidencelevel):重复抽样时，样本区间包含总体参数（m）的百分数由样本推断的结果真实结果拒绝H0不拒绝H0H0成立Ⅰ型错误推断正确(1－)H0不成立推断正确（1－b）Ⅱ型错误b当H0为真时，检验结论拒绝H0接受H1，这类错误称为第一类错误或Ⅰ型错误（typeⅠerror），亦称假阳性错误检验水准，就是预先规定的允许犯Ⅰ型错误概率的最大值，用表示当真实情况为H0不成立而H1成立时，检验结论不拒绝H0反而拒绝H1，这类错误称为第二类错误或Ⅱ型错误（typeⅡerror），亦称假阴性错误。大小用β表示，只取单侧，一般未知。当样本容量一定时，越小越大，越大越小。在实际应用中，往往通过去控制。在样本量确定时，如果要减小，就把取大一些。同时减小和b，唯一的方法就是增加样本含量nbbbb第七节t检验中的注意事项1.假设检验结论正确的前提作假设检验用的样本资料，必须能代表