0006.0!177)17(177exP案例一P782000年某地艾滋病病毒的感染率为10/10万,该地10万人口,2001年感染艾滋病病毒的人口人数为17人,有人说,该地2001年总体上艾滋病病毒感染率与200年持平,是这样的话,该地2001年感染艾滋病病毒的人数为17人这种情况发生的概率为因为发生的概率太小了,所以说该地2001年总体上艾滋病病毒感染率与2000年持平的说法是不成立的。请考虑:该分析是否正确,如果有问题,出在那里?分析:1.作者是按照poisson分布来解决此题2.经过poisson分布统计学计算得知2001年发生17例的概率确实小。故作者认为两年间艾滋病病毒感染率持平回顾:1.poisson分布的特征:有其参数λ唯一确定。2.poisson分布和二项分布的一个前提条件是事件发生的概率不变,每个事件的发生与否是相互独立的。3.传染性疾病首列出现后便成为传染源,会增加该区后续病例出现的概率,且随着病例的增加,其他易感人群感染的概率也会增加,因此传染病的病例数的分布不能看做二项分布和poison分布。结论:艾滋病是传染性疾病不能用poison分布来解决。欲了解某年某市正常成人的平均血铅含量,有人随机调查了当年该市200名正常成人的血铅含量,将所获资料整理成频率分布表,据此认为该资料不服从正态分布,应先对原始数据进行对数变换,再用式来估计当年该市正常成人平均血铅含量的95%置信区间。请问这种做法是否合适?为什么?如果答案是否定的,请给出你认为合适的做法。案例二(5-1)P97XS96.1表5-4某年某市200名正常成血铅含量(ug/L)分布1.由表可知,资料呈成正偏态分布,尽管样本来自非正态总体,但因样本含量较大(n≥100),样本均数的分布近似于正态分布,可用正态近似法估计置信区间,不必进行对数转换。2.用式来估计95%置信区间是合适的;3.因血铅含量只以过高异常,所以只需制定单侧上限;XS96.183.6nSSX所以,该资料用计算,得到正常成年人血铅值的95%参考值范围单侧上界为(172.0~198.8)(μg/100g)。XSX96.1•某研究者体重接近的雌体中年大鼠20只,然后随机分为甲、乙两组,每组10只。乙组中的每只大鼠接受3mg/kg的内毒素,甲组作为对照组,分别测的两组大鼠的肌酐(mg/L),为检验两总体均值之间有无差别,该研究者先计算两组的差值进行正态性检验,服从条件后采用配对设计t检验:t=3.540,P=0.006.你是否同意这种统计分析方法?案例三(6-1)P123配对设计是将受试对象按配对条件配成对子,每对中的个体接受不同的处理。动物实验中,常将同性别、同窝别、体重相近的两个动物配成一对;人群试验中,常将性别和年龄、生活条件、工作条件相同或相近的两个人配成对子,再按随机化原则把每对中的受试对象分别分配到实验组和对照组,或不同处理组。配对设计的四种情况:1、同一受试对象身体的两个部位。2、同一受试对象处理前后的数据。3、同一样品用两种方法检验结果。4、两种同质受试对象分别接受两种处理。1、方差的齐性检验甲组=5.36S2甲==2.885乙组=8.16S2乙==2.447F==1.1789经查表得P0.05,方差齐性12XnX甲1n2XX乙乙乙乙X甲X乙甲22SS2、计算统计量•(1).假设检验•H0:u甲=u乙;H1:u甲≠u乙•α=0.05•(2).计算统计量••S2c==5.332•t==3.8352S1nSn221乙甲乙乙甲甲nn乙甲乙甲n112SXXnc3、确定P值,作统计推断经查表得P0.05,故两组总体均值之间有差别2020/4/25案例四(6-2)P123某研究者检测了8例肺结核及8例结核性胸膜炎的血沉(1小时)值,以表6-6给出资料,采用两独立样本比较的t检验,结果为t=4.260,自由度为14,P=0.001,拒接Ho,差异有统计学意义,你认为正确吗?表6-6肺结核及结核性胸膜炎血沉(1小时)值数据组别例数均数标准差肺结核819.758.35结核性胸膜炎851.8819.63解答过程(1)建立检验假设,确定检验水准Ho:μ1=μ2,即肺结核及结核性胸膜炎血沉数据没有统计学意义H1:μ1≠μ2,即即肺结核及结核性胸膜炎血沉数据有统计学意义α=0.05(2)计算统计检验量n1=8,X1=19.75S1=8.35n2=8,X2=51.88S1=19.63t=t=4.260ν=922112122nSnS(3)确定P值,作出推断查附录附表2(t界值表),得t0.05/2,8=2.306而t=4.260时,查表0.005P0.002,故P0.05,在α=0.05水平上拒接Ho,差异有统计学意义。•由题可知:•1、该资料为计量资料;•2、该资料应用了两独立样本的秩和检验方法;•3、研究目的是用两种方法检测同12位妇女肺活量的方法有无统计学意义;••秩和检验可以检验两个总体的分布函数是否相等,适用于等级资料及两端无确定值的资料案例五(6-3)P123配对设计资料的t检验•适用于:(1)异体配对设计,包括同源配对设计和条件相近者配对设计;(2)自身配对设计;•适用情况:同一样品用两种方法检测结果•配对设计资料的分析是:每一对中两个观察值之差,这些差值组成一组资料,用T检验推断差值的总体均数是否为“0”。两方法检测肺活量的结果1、建立假设检验,确定检验水准;H0:ud=0,即差值的总体均数为0H1:ud≠0,即差值的总体均数不为0α=0.052、计算检验统计量n=12=17.17l/minSd=40.33l/min得出t==1.475v=n-1=12-1=11nSdd0d3、确定p值,做出推断查t界值表得在t0.05/2,11=1.475p0.05,在α=0.05水平上不拒绝H0,即差值的总体均数为0,两种方法检测结果的差异没有统计学意义问:(1).该资料采用的是何种统计学分析方法?(2).所使用的统计学方法是否正确?为什么?(3).若不正确,可以采用何种统计学分析方法?试作分析。案例六(7-1)P142解:(1).两个独立样本的t检验(2).不正确,犯第一类错误•(3).完全随机设计:将同质的受试对象随机地分配到各处理组,再观察其实验效应,是最常见的单因素量水平或多水平的实验设计方法。•随机区组设计(配伍组设计):将受试对象按性质形同或相近组成b个区组,每区组中的受试对象分别随机分配到k个处理组中。完全随机设计资料方差分析步骤•1、方差齐性检验•(1).建立检验假设,确定检验水准•H0:σ21=σ22=σ23,即三个总体方差全相等•H1:三个总体方差不全相等•(2).计算统计量•χ2=1.023•(3).确定P值,作出推断•以自由度V=2查表得0.5P0.75,接受H0•2020/4/251.建立假设检验Ho:三个年级周日锻炼时间无差别H1:三个年级周日锻炼时间有差别α=0.052、计算统计量•SS总==9909•SS组间=2341,V组间=k-1=2•MS组间=SS组间/V组间=1215.36•SS组内=SS总-SS组间=7478.V组内=N-k=57•MS组内=SS组内/V组内=131.19•F=MS组间/MS组内=9.23ij22ij1NSXX总iiiXX2n3、确定P值,作统计推断•根据V组间=2,V组内=57•查表得F0.05(2,57)=3.15,由F=9.23•得P0.05,该学校三个年级周日锻炼时间有差别。对该资料进行分析,可以得出该资料属于计量资料,该统计学设计属于完全随机设计资料,并使用方差分析法进行了统计分析。案例七(7-2)P142•方差分析适用条件:•1.各样本是来自正态分布的总体•2.两个样本是相互独立的随机样本•3.样本均数所在总体方差具有齐性•故我们首先因对资料进行方差齐性的2检验1,建立假设检验,确定检验水准H0:12=22=32(即三个总体方差全相等)H1:三个总体方差不全相等α=0.102.计算检验统计量2=13.18v=23.确定P值,做出推断。以自由度V=2,查附表8的×2界值表,得P0.005,按α=0.10的水准,拒绝H0,接受H1,即三个总体方差不全相等。思路一:对该资料分析使用多个样本均数的两两比较法,即1.高脂饮食组与高脂+A组(25ug/100g)2.高脂饮食组与高脂+A组(50ug/100g)3.高脂+A组(25ug/100g)与高脂+A组(50ug/100g)分别进行比较。思路二:对该资料的进行数据转换,例如:对数变换、平万根变换以及平方根反正弦变换等方式使其变换成具有齐行的数据,之后可直接进行方差分析已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。故认为该厂成年男子血红蛋白均值低于一般成年男子。该结论是否正确?为什么?课外案例分析:此题为样本均数与总体均数的比较,即单样本资料1)建立检验假设,确定检验水准H0:μ0=μ1,(该厂成年男子血红蛋白均值于一般男子总体均值相等)H1:μ0≠μ1,(该厂成年男子血红蛋白均值低于一般男子总体均值)α=0.052)计算检验统计量75.760/15140125/U-t0nSV=n-1=60-1=593)查相应的界值表,确定p值,下结论查t界值表中的双侧界值t0.05/2,59t0.05/2,60得P0.05,按水准α=0.05,拒绝H0,接受H1,差别有统计学意义,可以认为该厂成年男子血红蛋白均值与一般男子总体均值不同,即,该厂成年男子血红蛋白均值低于一般成年男子血红蛋白的总体均值。