复习标准差与标准误的区别/关系参考值范围与可信区间的区别/关系例据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?已知总体72次/分样本02.74X未知总体?两均数不相等的原因有两种可能:①由于抽样误差所致。②样本来自另一总体(由于环境条件的影响,山区成年男子的脉搏确实高于一般)。假设检验假设检验(hypothesistest)亦称显著性检验(significancetest),是统计推断的另一个重要方面。假设检验的基本思想小概率反证法假设检验的基本步骤建立检验假设,确定检验水准选定检验方法,计算检验统计量确定P值,作出统计推断建立检验假设,确定检验水准假设有两种:一是无效假设(nullhypothesis)或称零假设,用H0示之;二是备择假设(alternativehypothesis),用H1示之。H0和H1都是根据统计推断的目的提出的对总体特征的假设,是相互联系且对立的一对假设。建立假设前,先要根据分析目的和专业知识明确单侧检验还是双侧检验。如何确定单侧检验还是双侧检验样本均数(其总体均数为)与已知总体均数0的比较目的H0H1双侧检验是否0=00单侧检验是否0=00或是否0=00检验水准检验水准(significancelevel),符号为,常取0.05。检验水准应在设计时根据专业知识和研究目的确定单侧检验或双侧检验以及检验水准,不能在假设检验结果得出后再加以选择。选定检验方法,计算检验统计量根据分析目的、设计类型和资料类型,选用适当的检验方法,计算相应的统计量。如配对设计的两样本均数的比较用配对t检验等。X确定P值,作出统计推断P值是指在H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。tXsXsnX/.../.74272065251692-4-202400.10.20.30.4t0.05,24=1.711结论若P≤,表示在H0成立的条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持H0,因而拒绝H0。因此,当P≤时,按所取检验水准,拒绝H0,接受H1。若P时,表示在H0成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。结论若P≤,拒绝H0,可以认为……有差异。若P时,不拒绝H0,尚不能认为……有差异。t检验t检验的应用条件:要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差相等。例据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?(1)建立检验假设,确定检验水准H0:=0山区成年男子平均脉搏数与一般人群相等H1:0山区成年男子平均脉搏数高于一般人群单侧=0.05(2)计算统计量(3)确定P值,作出统计推断查附表2,t界值表,t0.05,24=1.711,t0.10,24=1.318,得0.10P0.05,按=0.05水准不拒绝H0,尚不能认为该山区健康成年男子的脉搏均数高于一般健康成年男子的脉搏均数。tXsXsnX/.../.74272065251692其分析目的是推断样本所代表的未知总体均数与已知总体均数0有无差别。1.样本均数与总体均数比较(例8.1)例为探讨MRI无创性测量肺脉舒张压(PADP)的新途径,分别用MRI和右心导管两种方法测量12名患者的肺脉舒张压,资料如下表,问两种方法的检测结果有无差别?两种方法检测12名患者的肺脉舒张压(kPa)结果被检测者号(1)MRI(2)右心导管(3)d(4)=(2)–(3)d2(5)13.963.420.540.291624.514.53-0.020.000436.495.850.640.409647.106.790.310.096155.195.53-0.340.115666.305.760.540.291673.843.680.160.025682.672.420.250.062595.775.81-0.040.0016104.114.12-0.010.0001114.955.32-0.370.1369123.252.850.400.1600(d)2.06(2d)1.5916(1)建立假设检验,确定检验水准H0:两方法检验结果相同,即d=0H1:两方法检验结果不同,即d0双侧=0.05(2)计算统计量=n-1=12-1=11(3)确定P值,作出统计推断查附表3,t界值表,得0.20P0.10,按=0.05水准不拒绝H0,尚不能认为两种方法检查的结果不同。7728.112/3355.01717.0/0nSdSdtdd配对设计的均数比较(例8.2)在医学科学研究中的配对设计主要有以下情况:–配对的两个受试对象分别接受两种处理之后的数据;–同一样品用两种方法(或仪器等)检验的结果;–同一受试对象两个部位的数据。其目的是推断两种处理(或方法)的结果有无差别。例:某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。X1:3.145.837.354.624.055.084.984.224.352.352.892.165.555.944.405.353.804.12X2:4.127.893.246.363.486.744.677.384.954.085.344.276.544.625.925.18(1)建立假设检验,确定检验水准H0:1=2,即两总体均数相等H1:12,即两总体均数不相等双侧=0.05(2)计算统计量(见P93))11(2)1()1()11(212122212121212212121nnnnnsnsXXnnsXXsXXtcXX820.12156.0845.0)161181(21618)116(382.1)118(324.1299.5454.422t3221618221nn(3)确定P值,作出统计推断查附表3,t界值表,得0.10P0.05,按=0.05水准不拒绝H0,尚不能认为慢性支气管患者尿17酮类固醇的排出量与健康人不同。3.成组设计的两样本均数的比较适用于完全随机设计的两样本均数的比较。目的是推断两样本均数和分别代表的两总体均数1和2有无差别。例某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.6601012/L,标准差为0.5751012/L;女性255人,均数为4.1781012/L,标准差为0.2911012/L,试问该地男、女平均红细胞数有无差别?(1)建立假设检验,确定检验水准H0:1=2,即该地男、女平均红细胞数相等。H1:12,即该地男、女平均红细胞数不等。双侧=0.05(2)计算统计量(3)确定P值,作出统计推断查附表3,t界值表(=时),得P0.001,按=0.05水准拒绝H0,接受H1,可认为该地男女红细胞数的均数不同,男性高于女性。uXXsnsn121212222246604178057536002912551363.....Z检验两大样本均数比较,可用Z检验121212121222221212XXXXXXXXXXZsssssnn)11(2)1()1()11(212122212121212212121nnnnnsnsXXnnsXXsXXtcXXZ检验为t检验在样本含量较大时的近似计算法例8.4为比较两种狂犬疫苗的效果,将120名患者随机分为两组,分别注射精制苗和PVRV,测定45天两组的狂犬病毒抗体滴度,结果见表3.4,问两种狂犬疫苗的效果有无差别?表8.32种疫苗狂犬病毒抗体滴度的比较血清滴度疫苗类型人数5010020040080016003200640012800精制苗601337462673PVRV60131410531590(1)建立检验假设,确定检验水准H0:两种疫苗的总体几何均数对数值相等H1:两种疫苗的总体几何均数对数值不等双侧=0.05两样本几何均数的比较(2)计算统计量将两组数据分别取对数,记作X1、X2,用变换后的数据计算=60+60-2=118578.2)601601(26060596217.0595714.09482.22292.3)11(2)1()1(22212122212121nnnnnSnSXXt(3)确定P值,作出统计推断查附表3,t界值表,得0.01P0.02,按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为两种疫苗的平均抗体滴度不同,精制苗高于PVRV。关于t检验的条件正态方差齐方差齐性检验检验假设H0:2212(两总体的方差相等)H1:2212(两总体的方差不等)检验水准为=0.1或0.222122212max(,)min(,)ssFss根据,1=n1-1,2=n2-1,查附表4方差齐性检验用的F分布表,如果,即P,因此拒绝H0,接受H1。可认为两个总体的方差不等。否则不拒绝H0,尚不能认为两个总体的方差不等。正态性检验图示法方格坐标纸图正态概率纸图P-P图(Proportion-proportionplots)图示法方格坐标纸图正态概率纸图P-P图(Proportion-proportionplots)统计检验方法W检验(S.S.ShapiroandM.B.Wilk)D检验(D’Agostino)I型错误与II型错误拒绝了实际上成立的H0,这类“弃真”的错误为I型错误(typeIerror);不拒绝实际上不成立的H0,这类“存伪”的错误为II型错误(typeIIerror)。客观实际拒绝H0不拒绝H0H0成立I型错误()推断正确(1-)H0不成立推断正确(1-)II型错误()-50500.10.20.30.4t,,2040608010012014016000.010.020.030.040.050.060.07检验效能1-称为或把握度(powerofatest),其统计学意义是若两总体确有差别,按水准能检出其差别的能力。值的大小很难确切估计,只有在已知样本含量n、两总体参数差值以及所规定的检验水准的条件下,才能估算出大小。,的关系通常当n固定时,愈小,愈大;反之,愈大,愈小。增大n,可同时减小,。假设检验中的注意事项数据应该来自设计科学严密的试验或调查数据应该满足假设检验方法的前提条件正确理解假设检验中概率P值的含义结论不能绝对化统计学意义与实际意义有区别比较新药“1%盐酸布替奈芬”与对照药“达克宁”治疗手足癣、体股癣的疗效,两组病例数均为100,新药组、对照组手足癣病人比例分别是60%、10%,疗程为2周:新药的有效率65%对照药有效率75%经检验P0.05,得出结论,尚不能认为两组的疗效有差异。2比较下面三种说法若P≤,拒绝H0,可以认为……有差异。若P≤,拒绝H0,可以认为……差异有显著性。若P≤,拒绝H0,可以认为……差异有统计学意义。•“有显著性”不是指两组均数差异较大假设检验与区间估计的联系假设检验用于推断总体参数是否不相等。两者既有区别,又有联系。就同一份资料,如例7.3,若假设检验的结果是,拒绝H0,接受H1,则其(1-)的置信区间必定不包括所规定的总体参数,反之亦然。置信区间能够给出总体参数