医学统计学MedicalStatistics第五章参数估计基础第六章假设检验基础Parameterestimationandhypothesistesting统计学的分析思路populationSampling(抽样研究)统计推断(statisticalinference)总体参数的估计(第五章)(parameterestimation)假设检验(第六章)(hypothesistesting)Outline均数的抽样误差与标准误t分布总体均数的估计假设检验的概念和原理t检验假设检验的注意事项正态性检验和方差齐性检验总体155.4cm1156.7cmx2158.1cmx3155.6cmx99155.2cmx100156.6cmx30n第一节均数的抽样误差与标准误抽样误差(samplingerror)有两种表现形式:(1)样本统计量与总体参数间的差异,例如样本均数与总体均数间的差异。(2)样本统计量间的差异。均数的抽样误差:由个体变异产生、随机抽样造成的样本均数与总体均数之间的差异。抽样误差产生的原因(1)抽样研究。抽样是抽样误差产生的基本条件之一。样本例数越少,抽样误差可能会越大。(2)个体变异。变异是抽样误差产生的又一基本条件。变异是普遍存在的,也正是医学统计学所要研究的。变异大的事物其抽样误差也大,反之则小。抽样误差的特点与意义抽样误差的特点抽样研究中抽样误差不可避免可以估计和控制抽样误差抽样误差的意义用于参数估计和假设检验描述抽样误差的指标样本含量相等的样本均数的变异度可描述均数的抽样误差。样本均数的变异度如何度量?——样本均数的标准差中心极限定理(centrallimittheorem)1、当原始观察值的分布为正态分布时,样本均数的分布服从正态分布(特点:4个)。即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布。见表5-2,图5-1、5-22、样本均数的均数等于原总体的总体均数(),样本均数的标准差等于。x标准误通常将样本统计量的标准差称为标准误(standarderror,SE)样本均数的标准差称为均数的标准误(理论值)(估计值)nXnssX2(,)XXN标准差与标准误的区别与联系应用:标准差属统计描述—参考值范围标准误为统计推断—置信区间估计和假设检验意义:标准差越小,均数代表性越好;标准误越小,抽样误差越小,样本均数估计总体均数可靠性越大。与n的关系:n越大,标准差越稳定;n越大,标准误越小。都是描述变异度的指标。样本含量固定,标准差越大,标准误越大。区别联系第二节t分布W.S.Gosset(1876~1937)1908年,Gosset首次以Student为笔名,在《Biometrika》杂志上发表了“Theprobableerrorofamean”。由于这篇文章提供了“t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。WilliamSealyGossetGosset是英国一家酿酒厂的化学技师,在长期从事实验和数据分析工作中,发现了t分布。但当时Gosset的公司害怕商业机密外泄,禁止员工对外发表文章。所以Gosset在1908年以“Student”笔名发表此项结果,故后人又称它为“Studentt分布”。在当时正态分布一统天下的情况下,Gosset的分布没有被外界理解和接受,只能在他的酿酒厂中使用,直到1923年英国统计学家Fisher给出分布的严格推导并于1925年编制了t分布表后,t分布才得到学术界的承认,并获得迅速的传播、发展和应用。WilliamSealyGosset英国统计学家,小样本理论和方法的创立者,现代统计方法及其应用于实验设计与分析的先驱。Gosset的主要贡献是创立了t分布,开创了小样本理论的先河。由于Gosset开创的理论使统计学开始由大样本向小样本、由描述向推断发展,因此,有人把Gosset推崇为推断统计学(尤其是小样本理论研究)的先驱者。X随机变量XN(,2)标准正态分布N(0,12)z变换均数标准正态分布N(0,12)),(2nN,1XXXtvnSSnStudentt分布自由度:n-1SXz/Xznσt分布的图形(u分布是t分布的特例)t分布的特征①以0为中心,左右对称的单峰分布;②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于∞时,t分布即为u分布。举例:①,0.05,10101.812tt,单=0.05,,则有(1.812)0.05(1.812)0.05PtPt或②2,0.05/2,10102.228tt,双=0.05,,则有(2.228)(2.228)0.05PtPtt界值表应用1已知和,求t1.8122.228-2.228tf(t)ν=10的t分布图t界值表应用2已知和t,求面积P举例:①=10,t=2,P的范围(单、双侧)②=10,t=3,P的范围③=10,t=5,P的范围结论:①自由度一定,t绝对值越大,P值越小。②自由度一定,t值一定,双侧概率为单侧概率的2倍。参数估计Parameterestimation点估计(pointestimation):由样本统计量直接估计总体参数区间估计(intervalestimation):获得一个置信区间(confidenceinterval,CI)——按预先给定的概率(1)所确定的包含未知总体参数的一个范围。第三节总体均数的估计置信区间的计算总体均数置信区间估计的通式XXStXStX,2/,2/),(XXStXStX,2/,2/较小时)(nStXX,2/较大时)nSuXX(2/(1)或100(1)%称为置信度(confidencelevel),常取95%(90%、99%)。即95%置信区间,或95%CI。置信区间的有关概念置信区间的两个界值即两个置信限(confidencelimit,CL):较小的称为置信下限(lowerlimit,L),较大的称为置信上限(upperlimit,U),换句话说,做出所有18岁男生身高总体均数为164.4–169.6cm的结论,说对的概率是95%,说错的概率是5%。置信区间的含义:虽然不能知道某地所有18岁男生身高总体均数的确切数值,所有18岁男生身高均数在164.4–169.6cm之间的可能性是95%。置信区间的两个要素准确度:即置信度,越高越好。精度:即区间的宽度,越窄越好。置信区间与参考值范围的区别第六章假设检验基础补充例子通过以往大规模调查,已知某地正常成年男子的脉搏均数为72次/分,某医生在该地某山区随机调查了25名正常成年男子,脉搏均数为74.2次/分,标准差为6.0次/分,可否认为该山区成年男子的脉搏总体均数高于一般?假设检验的基本步骤步骤1:建立假设,确定检验水准。检验假设(nullhypothesis)、原假设,或零假设,记为H0,表示目前的差异是由于抽样误差引起的。H0:=72次/分,山区正常成年男子与一般正常成年男子的平均脉搏相等;备择假设(alternativehypothesis),记为H1,表示目前的差异是主要由于本质上的差别引起的。H1:72次/分,山区正常成年男子平均脉搏高于一般正常成年男子。假设检验的一般步骤H0假设比较单纯、明确,且在该假设的前提下有规律可寻。而H1假设包含的情况比较复杂。因此,检验是针对H0的。假设检验的基本原理“反证法”的原理提出一个假设如果假设成立,得到现有样本的可能性可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,即样本信息不支持H0,说明我们的假设有问题,拒绝之。有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设(没理由)。双侧检验与单侧检验双侧检验(two-sidedtest)H0:=0H1:≠0单侧检验(one-sidedtest)H0:=0H0:=0H1:0H1:0双侧检验与单侧检验选择要结合专业实际;在相同的检验水准下,正确地选择单侧检验将比双侧检验得到更多的检验效能。选择要在计算检验统计量之前;假设检验的一般步骤检验水准(sizeofatest,significancelevel)符号常取用于判断小概率事件的概率值,表示拒绝实际上成立的H0时,推断错误的最大允许概率。05.0假设检验的一般步骤步骤2:选定检验方法,计算检验统计量。根据设计类型和资料类型选择假设检验方法。假设检验的一般步骤样本均数与总体均数0间的差别可以用统计量t来表示:例子t=1.833nSXnSXt//01n假设检验的一般步骤步骤3:确定P值,作出推断结论。根据小概率原理作出推断根据t分布曲线下面积的分布规律(抽样分布规律),在H0成立的前提下出现现有差别或更大差别的可能性小于0.05,是小概率事件,这在一次试验中是不太可能发生的。然而不太可能发生的事件在一次试验中居然发生了,即现有样本信息不支持H0。因此,拒绝H0。注意这时拒绝H0有冒犯错误的风险假设检验的一般步骤若P>0.05,说明在H0成立的前提下出现现有差别或更大差别的可能性不是小概率事件,因此,没有理由拒绝H0。抉择的标准为:当P≤时,拒绝H0,接受H1;差别有统计学意义(statisticallysignificant)。当P>时,不拒绝H0。差别无统计学意义(statisticallynon-significant,NS)。第2节t检验ttest,Studentttest单样本t检验配对样本t检验两独立样本t检验t检验的应用条件独立性:两样本数据互相独立。正态性:两样本资料均服从正态分布(对小样本而言)方差齐性:两总体方差相等。1、单样本t检验One-samplettest检验的目的是手头的样本所来自的总体均数是否与已知的总体均数一致。这里已知的总体均数一般指理论值、标准值或大量观察得到的稳定值。三个实例例1:山区成年男子脉搏数与一般成年男子脉搏数(72次/分)比较例2:铅作业男性工人血红蛋白与正常成年男性血红蛋白(140g/L)比较例3:陈旧性心肌梗死患者血浆载脂蛋白E与正常人血浆载脂蛋白E(5.22mmol/L)比较2、配对样本t检验Pairedsamplesttest配对设计(paireddesign)Whypaired?控制可能存在的非处理因素,增加两组的可比性。配对设计的形式条件相近者配对(异体配对)自身配对条件相近者配对对子号降压药A降压药B11052127389……910610114自身配对受试者号病理检查CT194882102923110106………………910810210104100配对设计优点:组间同质性(可比性)好。缺点:条件相近者配对实施困难。自身前后配对为非同期对照,可比性可能有问题。配对样本t检验原理受试者号处理1处理2差值d1X11X21X11-X212X12X22X12-X223X13X23X13-X23……NX1NX2NX1N-X2N分析策略:差值总体均数与0比较(1)H0:1=2;或d=0;H1:1≠2;或d≠0。=0.05(2)(3)确定P值,做出推断结论。nSdnSdnSXtddd///1n3、两独立样本t检验Twoindependentsamplesttest完全随机设计/成组设计:优点:实施简便缺点:组间同质性(可比性)可能差问题:A药组B药组2=?均数:9.4标准差:4.271=?均数:10.2标准差:3.58两独立样本t检验(1)H0:1=2H1:1≠2=0.05(2)计算检验统计