假设检验概要回答的基本问题:一种情况与其它情况相比怎样?基本方法:比较两种或多种条件下某特征的差别,推断该情况与相应特征的关系。基本逻辑:反证,以事实检验假设基础:‘否定小概率事件’思想‘否定小概率事件’思想理解一:当多个事件发生概率不同时,若只做一次推测,则推测概率较大的事件将发生,概率较小者不发生。理解二:单次试验(抽样)观测到的事件不应该是小概率事件。假设检验的思路根据背景建立假设根据样本得到某些特征推断该样本特征在假设下的概率根据‘否定小概率事件’思想做出推断假设检验的步骤:(1)建立假设无效假设(nullhypothesis),用H0表示;备择假设(alternativehypothesis),用H1表示确定检验水准(sizeofteatα)通常取0.05或0.01。(2)计算统计量根据资料类型与分析目的选择适当的公式计算出统计量.(3)确定概率值(P)作出推断结论通过查统计学用表确定概率值.如果p,则不拒绝H0,差别无统计学意义;如果p=,则拒绝H0,接受H1,差别有统计意义。例1根据大量调查,已知健康成年男子脉搏的均数为72次/分钟。某医生在某山区随机调查了25名健康成年男子,求得其脉搏均数74.2次/分钟,标准差为6.5次/分钟,能否据此认为该山区成年男子的脉搏数高于一般地区。到例1计算一、单个样本的t检验(onesamplettest)XSXt0自由度ν=n-1到例1数据1.H0:μ=μ0,即该山区健康成年男子脉搏数与一般地区相同。H1:μ>μ0,即该山区健康成年男子脉搏数高于一般地区。α=0.05。2.计算t值。到计算公式692.1255.6722.740XSXt25,5.6,72,2.740nSX当H0成立时,统计量3.自由度ν=n-1=25-1=24,t=1.692,查t界值表得:0.05P0.10不能拒绝H0,差异无统计学意义。尚不能认为该山区健康成年男子脉搏数高于一般地区。例2应用克矽平治疗矽肺患者10名,治疗前后血红蛋白的含量如表1所示,问该药是否引起血红蛋白含量的变化?表1克矽平治疗矽肺患者治疗前后血红蛋白含量(g/L)编号治疗前治疗后111314021501383150140413513551281356100120711014781201149130138101231201、配对资料(三种情况)(1)一批实验对象某种处理前后(2)一批实验对象两种处理方法(3)实验对象经过配对后的实验结果二、配对资料比较的t检验(pairedsamplettest)tdSdSdd0ν=n-13、公式:2、目的:判断不同的处理间是否有差别?即:差值的总体均数为0到计算数据表1治疗矽肺患者血红蛋白量(克%)编号治疗前治疗后治疗前后差数d1113140272150138-123150140-1041351350512813576100120207110147378120114-69130138810123120-3到计算过程使用配对t检验解:1.建立检验假设,确定检验水准H0:μd=0,假设该药不影响血红蛋白的变化,即治疗前后总体差数为0。H1:μd≠0,假设该药影响血红蛋白的变化,即治疗前后总体差数不为0。α=0.05.2.计算t值到计算公式8.6d4574.16dS2043.5104574.16nSSd307.12043.58.6dSdt3.自由度df=10-1=9,t=1.307,查t临界值得:0.20P0.40按α=0.05水准不拒绝H0,差异无统计学意义。根据目前资料尚不能认为克矽平对血红蛋白含量有影响。x1x210.0011.0018.0019.0025.0026.0019.0021.0030.0031.0019.0020.00正态资料描述性统计量━━━━━━━━━━━━━━━━━━━━━列变量例数均数标准差─────────────────────x1620.1676.795x2621.3336.772━━━━━━━━━━━━━━━━━━━━━t检验━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━组别t值dfP值差数均值标准误95%置信区间───────────────────────────────x2,x17.00050.0009-1.1670.167-1.60~-0.74━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━注:配对检验表2克山病患者与健康者的血磷测定值(mg%)患者编号X1健康者编号X214.7312.3426.4022.5032.6031.9843.2441.6756.5351.9865.1863.6075.5872.3383.7383.7394.3294.57105.78104.82113.73115.78124.17134.14到计算过程三、两独立样本均数比较的t检验(twoindependentsamplettest)tXXSXX1212▲目的:由两个样本均数的差别推断两样本所取自的总体中的总体均数间有无差别?▲公式:ν=n1+n2-2到计算数据其中:2)1()1(212222112nnSnSnSc2121121nnSScXX到计算过程解:1.H0:μ1=μ2,即克山病患者与当地健康者的血磷值的均数相同。H1:μ1≠μ2,即克山病患者与当地健康者的血磷值的均数不相同。α=0.05.2.计算t到计算公式3042.1,35.33031.1,71.42211SXSX6997.121311701.112698.1102cS2)1()1(212222112nnSnSnSc到计算公式到下一计算过程534.01311116997.11121221nnSScXXtXXSXX1212547.2534.035.371.4到上一计算过程3.自由度ν=n1+n2-2=11+13-2=22t=2.547,查附表2可得:0.01<P<0.02按α=0.05水准拒绝H0,差异有统计学意义。可以认为克山病患者血磷的平均值高于当地健康人的血磷平均值。补充、U检验单样本U检验适用于当n较大时或总体标准差已知时。)(/)(/0000已知时较大时nXUnnSXU与U0.05=1.96U0.01=2.58进行比较补充、U检验22212121nSnSXXU与U0.05=1.96U0.01=2.58进行比较两大样本均数的比较t检验的应用条件1、正态性2、方差齐性方差齐性检验两独立样本均数比较的t检验,要求相应的两总体方差相等,即方差具有齐性。为此,我们要对两样本的方差作统计学检验方差齐性的检验用F检验,统计量F值的计算公式为:FSS1222较大较小求得F值后,其自由度分别为:df1=n1-1;df2=n2-1查附表3,作方差齐性检验,若P0.05则用t检验P0.05则用t'检验t检验计算公式22212121nSnSXXt两独立样本均数比较的t’检验(twoindependentsamplet-test)tα’界限值计算公式此处df1=n1-1,df2=n2-1.α可取0.05或0.01。当α确定后,可查t界值表求得tα,df1及tα,df2,将它代入上式即可求得tα’(双侧用tα/2’).若t’tα’,则Pα,反之Pα.22,2,2212211XXdfaXdfaXaSStStSt例5由X线片上测得两组病人的R1值(肺门横径右侧距,cm),算得结果如下,试检验肺癌病人与矽肺0期病人的R1值的均数间差异是否明显。肺癌病人:cmScmXn79.1,21.6,10111矽肺0期病人:cmScmXn56.0,34.4,50222(一)先作方差齐性检验(二)作t或t检验(根据P值)到计算(一)先作方差齐性检验1.H0:σ12=σ22,设两总体方差相等H1:σ12≠σ22,设两总体方差不等α=0.052.计算F值FSS1222较大较小22.1056.079.122回数据3.df1=N1-1=9,df2=N2-1=49查附表3(方差分析表,方差齐性检验用)F0.05(9,49)=2.39因为F=10.22F0.05(9,49)所以P<0.05,拒绝H0。认为因为两总体方差的差异有统计学意义,故不能用t检验而要用t检验。x1x210.0011.0018.0019.0025.0026.0019.0021.0030.0031.0019.0020.00正态资料描述性统计量━━━━━━━━━━━━━━━━━━━━━列变量例数均数标准差─────────────────────x1620.1676.795x2621.3336.772━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━组别t值dfP值差数均值标准误95%置信区间───────────────────────────────x2,x10.298100.7719-1.1673.916-9.89~7.56━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━注:成组检验练习:为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?表两种药物治疗贫血患者结果治疗药物血红蛋白增加量(g/L)新药组30.521.425.034.533.032.529.525.524.423.6常规药组19.519.013.024.721.522.019.015.524.523.4练习:留取10名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法测得尿汞平均含量有无差别?表两种方法测得的尿汞含量(单位:mg/L)编号12345678910离子交换法0.2000.0200.0100.3820.7230.8760.0350.0230.9401.201蒸馏法0.3200.0150.0300.4240.7890.7210.0140.0200.0511.115四、t检验的注意事项一、所观察的样本必须具备代表性,随机性和可靠性。如果是两个样本比较,一定要注意两个样本间的齐同均衡性,即可比性。二、必须根据实验设计的不同,选择不同假设检验方法。譬如,资料性质不同,设计类型不同,样本大小不同,选用配对t检验还是两独立样本t检验,选用大样本还是小样本检验,这些都涉及到最后进行统计处理时使用不同公式。三、“有统计学意义”,一般选P值为0.05作为界限,但这种选择不是绝对的,应当根据所研究事物的性质,在实验设计时加以选定,不能在得出计算结果后再决定。当然,在一般无特殊要求的条件下,可采用一般采用的界限。四、统计分析不能代替专业分析。假设检验结果“有”或“无”统计学意义,主要说明抽样误差的可能性大小。在分析资料时还必须结合临床医疗,预防医学特点,来加以分析。例如,某两种药物降低血压相差5毫米汞柱,经检验认为有统计学意义,但这种差异在临床却没有什么意义。总之,不能用统计分析来代替专业分析当然,也不能认为统计分析可有可无五、某药物的疗效观察经统计学检验认为无统计学意义(尤其当其t值小于t0.05但很接近t0.05时)也应考虑多方面的因素,一方面可能此药物的疗效确实无统计学意义,另一方面可能观察例数太少或选择病例不当等等。其它注意事项选择假设检验方法要注意符合其应用条件;当不能拒绝H0时,即差异无统计学意义时,应考虑的因素:可能是样本例数不够;单侧检验与双侧检验的问题复习1假设检验的原理和步骤是什么?2无效假设和备择假设的关系?3如何看待统计学结论的相对性?4P值的含义是什么?P值与α的关系是怎样的?5t检验