t检验(ttest)是以t分布为理论基础,对一个或两个样本的数值变量资料进行假设检验常用的方法,属于参数检验。第一节假设检验一、假设检验的概念与分类假设检验(hypothesistest)亦称显著性检验(significancetest),是利用样本信息,根据一定的概率水准,推断指标(统计量)与总体指标(参数)、不同样本指标间的差别有无意义的统计分析方法。(一)参数检验和非参数检验1.参数检验(parametrictest)是依赖总体分布的具体形式的统计方法,简称参数法。常用的参数法有χ2检验、t检验、F检验等。使用条件是抽样总体的分布已知。⑴优点:能充分利用样本信息;检验效率较高。⑵缺点:应用条件限制较多;手工计算较繁琐。2.非参数检验(nonparametrictest)非参数检验是一类不依赖总体分布的具体形式的统计方法。如Ridit分析、秩和检验、符号检验、中位数检验、序贯试验、等级相关分析等。⑴优点:①对总体的分布形式不要求;②可用于不能精确测量的资料;③易于理解和掌握;④计算简便。⑵缺点:不能充分利用资料所提供的信息,使检验效率降低。(二)单因素分析与多因素分析1.单因素分析亦称一元分析,是在主要的非处理因素相同的条件下,不管影响结果的处理因素(如病人年龄、病情、辩证分型、病理类型、药物剂型、用药途径、疗程等)有多少,每次仅分析一个处理因素与效应之间关系的统计方法。2.多因素分析亦称多变量分析或多元分析,是研究多因素和多指标之间的关系以及具有这些因素的个体之间关系的一种统计分析方法。二、假设检验的基本步骤例题:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某医院随机调查30名脾虚男子,求得脉搏均数为74.2次/分,标准差为7.5次/分。脾虚病人的脉搏是正态分布,问脾虚男子的脉搏均数与一般成年男子的脉搏均数是否相等?分析:把一般成年男子的脉搏均数看作一个总体均数,脾虚男子的脉搏均数为样本均数。0=72,n=30,X=74.2,s=7.5。0X的原因:①抽样误差所致。②脾虚致两个均数间有本质性差异。1.建立假设、确定检验水准⑴无效假设:记为H0,即样本均数所代表的总体均数与已知的总体均数0相等。样本均数与0的差异是由抽样误差引起,无统计学意义。⑵备择假设:记为H1,即样本均数所代表的总体均数与0不相等,样本均数与0的差异是本质性差异,有统计学意义。假设检验有双侧检验和单侧检验若目的是推断两总体均数是否不等,应选用双侧检验。H0:=0,H1:0若从专业知识已知不会出现0(或0)的情况,则选用单侧检验。H0:=0,H1:0(或0)确定检验水准检验水准亦称显著性水准,符号为α,指由假设检验做出推断结论时发生假阳性错误的概率。α常取0.05或0.01。2.选择检验方法、计算统计量根据:①研究目的,②资料的类型和分布,③设计方案,④统计方法的应用条件,⑤样本含量大小等,选择适宜的统计方法并计算出相应的统计量。3.确定P值、做出推论假设检验中的P值是指在由无效假设所规定的总体作随机抽样,获得等于及大于(和/或等于及小于)现有统计量的概率。即各样本统计量的差异来自抽样误差的概率,它是判断H0成立与否的依据。确定P值的方法主要有两种⑴查表法根据检验水准、样本自由度直接查相应的界值表求出P值。⑵计算法用特定的公式直接求出P值。推论若P>α,就没有理由怀疑H0的真实性,则结论为不拒绝H0,做出不否定此样本是来自于该总体的结论,也即差别无显著性意义。若P≤α,则拒绝H0,接受H1,也就是说这些统计量来自不同的总体,其差别不能仅由抽样误差来解释,下结论为差别有显著性意义。第二节单样本t检验单样本t检验(onesamplettest)亦称样本均数与总体均数的比较的t检验。用于从正态总体中获得含量为n的样本,算得均数和标准差,判断其总体均数μ是否与某个已知总体均数μ0相同。已知总体均数一般为标准值、理论值或经大量观察得到的较稳定的指标值。一、适用条件1.对正态分布的数值变量资料,需用t检验。2.对于非正态分布的资料,若经过变量变换使成正态分布,可按t检验处理;否则,用非参数检验的方法。二、正态性检验的方法检验假设H0为总体分布是正态分布,当P>α时,不拒绝H0,认为样本所来自的总体服从正态分布;而P≤α时,拒绝H0,认为样本所来自的总体不服从正态分布。1.W检验Shapiro-Wilk检验是基于次序统计量对它们期望值的回归而构成的。所用检验统计量为W,又称为W检验。在样本量3≤n≤50时使用。2.D检验Kolmogorov-Smirnov检验的统计量为D,所以也称D检验,在样本量50≤n≤1000时使用。三、计算公式,ν=n-1式中为样本均数,μ为总体均数,n为样本含量,s为样本标准差,ν为自由度。xnsxtxSxt四、检验步骤1.建立假设、确定检验水准H0:0H1:00.052.选择检验方法、计算统计量607.130/5.7722.74t3.确定P值、做出推论=30-1=29,查t值表,t0.05/2,29=2.045,今t=1.607t0.05/2,29,P0.05。按0.05水准,不拒绝H0,根据现有样本信息,尚不能认为脾虚男子脉搏数与健康人不同。第三节配对设计资料均数的t检验配对设计配对设计是将观察单位按照某些特征(如性别、年龄、病情等可疑混杂因素)配成条件相同或相似的对子,每对中的两个观察单位随机分配到两个组,给予不同的处理,观察指标的变化。①同一观察单位实验(或治疗)前后的比较;②同一样品用两种方法检验结果的比较;③配对的两个观察单位分别接受两种处理后的数据比较。配对t检验配对t检验又称成对t检验(pairedt-test)。是将对子差数d看做变量,先假设两种处理的效应相同,1-20,即对子差值的总体均数d0,再检验样本差数的均数与0之间差别有无显著性,推断两种处理因素的效果有无差别或某处理因素有无作用。由于此种设计使影响结果的非被试因素相似或相同,因而提高了研究效率。d一、适用条件1.设计类型是配对设计。2.数值变量的对子差值是正态分布。二、计算公式ν=n-1式中d为各个对子数值的差数,为差数的平均数,为差数的标准差,为差数的标准误,n为对子数。dddSdSdtnddnssdd1/22nnddsdddsds三、检验步骤例题对10名患者分别用湿式热消化-双硫腙法和硝酸-高锰酸钾冷消化法测定尿铅,问两法测得结果有无差别。用两种方法测定尿铅结果(mol/L)患者号冷消化法热消化法差值dd212.412.80-0.390.1521212.0711.240.830.688932.903.04-0.140.019641.641.83-0.190.036152.751.880.870.756961.061.45-0.390.152173.233.43-0.200.0480.770.92-0.150.022593.673.81-0.140.0196104.494.010.480.2304合计0.58(d)2.1182(d2)1.建立假设、确定检验水准H0:d=0H1:d00.052.计算统计量t值dddSdSdt2.计算统计量t值先计算差值d及d2(如表),得d=0.58,d22.1182058.01058.0ndd4813.01101058.01182.21nnddS222d配对t检验的步骤计算差值的标准误1522.0162.34813.0nSSdd381.01522.0058.0Sdtd3.确定P值、做出推论=n-1=10-1=9,查t界值表,得双侧t0.05/2,9=2.262,本例t<t0.05/2,9,P>0.05。按0.05水准,不拒绝H0,不能认为两法测定尿铅结果有差别。第四节独立样本的t检验与t′检验独立样本资料是在两个总体里分别随机抽样,或将同一总体里抽取的观察对象随机分为两组,采取不同的处理得到的资料。独立样本t检验与t′检验独立样本t检验(independentsamplettest)亦称两样本t检验或成组t检验。与t′检验均适用于完全随机化设计两独立样本的比较,目的是推断两独立样本均数所代表的未知总体均数μ1与μ2是否有差别。一、独立样本的方差齐性检验两个样本均数的假设检验,除了要求样本资料来自正态分布或近似正态分布,还要求两个样本的总体方差相等,称为方差齐性(HomogeneityofVariance)。(一)应用条件两个样本均来自正态分布的总体。(二)计算公式统计量F为较大的方差与较小的方差的比值。F=s12/s22ν1=n1-1ν2=n2-1(三)检验步骤例4-3某医师要观察自拟中药方“降脂胶囊”对高血脂症的疗效,将诊断为高血脂的20例病人随机分为两组,一组用上述中药治疗,另一组用西药治疗,3个月后测量血清胆固醇含量(mmol/L),结果见表4-2,已知两组血清胆固醇含量均服从正态分布,试比较两药降低胆固醇的效果有无差别。表4-2两法治疗高血脂症3个月后血清胆固醇含量(mmol/L)病人编号组别12345678910中药5.455.044.625.614.065.325.284.786.975.34西药5.346.125.874.675.216.895.485.434.575.791.建立检验假设、确定检验水准H0:两总体方差相等H1:两总体方差不相等0.10(较大以减少II类错误)2.选择检验方法、计算统计量中药组S2=0.580西药组S2=0.466F=s12/s22=0.580/0.466=1.2453.确定P值、做出推论ν1=n1-1=10-1=9,ν2=n2-1=10-1=9,查F界值表(方差齐性检验用),得F0.05(9,9)=4.03,F<F0.05(9,9),P>0.05。在=0.05水准下不拒绝H0,认为中药组与西药组的血清胆固醇总体方差齐。二、独立样本t检验(一)应用条件1.样本个体测量值相互独立,即独立性。2.两个样本所代表的总体均数服从正态分布,即正态性。3.总体方差相等,即方差齐性。(二)计算公式先求出合并方差,再求出两均数之差的标准误,最后算出统计量t值。2nnnXXnXXS2122222121212C2)1()1(212222211nnsnsnsc212CXXn1n1SS2121XX21SXXt(三)检验步骤1.建立假设、确定检验水准H0:μ1=μ2H1:μ1≠μ2α=0.052.选择检验方法、计算统计量本例n1=10,=5.247,s1=0.762;n2=10,=5.537,s2=0.683=0.524xx21010683.0)110(762.0)110(222cs2.选择检验方法、计算统计量324.0101101524.021XXS895.0324.0247.5537.5t3.确定P值、做出推论ν=10+10-2=18,查t界值表,得t0.05,18=2.101,t<t0.05,18,,P>0.05。按α=0.05水准,不拒绝H0。两药降低胆固醇效果的差别无统计学意义。三、t′检验成组样本均数的比较,若方差不齐,可以采取3种方式处理:①经过数据变换使方差齐,然后进行t检验;②采用近似t检验——t′检验;③基于秩次的非参数检验方法。例题由X光片上测得两组病人肺门横径右侧距R1值(cm),结果如下,请先检验两组的总体方差是否相等,然后进行假设检验。肺癌病人矽肺0期病人cmScmXn79.121.610111cmScmXn56.034.450222(一)方差齐性检验1.建立假设、确定