生物统计附试验设计第七章卡方检验(2017)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章次数资料分析—2检验在科学研究中,除了分析计量资料外,还常常需要对次数资料、等级资料与相对数资料进行分析。2检验可以分析试验结果为两种以上属性的次数资料的差异显著性。本章将介绍卡平方检验用于分析次数资料适合性和独立性检验的方法。第一节2统计量与2分布第二节适合性检验第三节独立性检验第一节2统计量与2分布一、2统计量的意义某年对某一农场羊羔性别进行调查,结果如下表表7-1羔羊性别实际观察次数与理论次数性别实际观察次数A理论次数TA-T(A-T)2/T公428(A1)438(T1)-100.2283母448(A2)438(T2)100.2283合计87687600.4566问题:公、母性别差异是属于抽样误差(把对该羊场一年所生羔羊的性别统计当作是一次抽样调查)、还是羔羊性别比例发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。——∑(A-T)——∑(A-T)22是度量实际观察次数与理论次数偏离程度的一个统计量。2越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。TTA22)(二、卡平方分布设有一平均数为μ、方差为2的正态总体。现从此总体中独立随机抽取n个随机变量x1、x2、...xn,并求出其标准正态离差:则这n个相互独立的标准正态离差的平方和即:nnxuxuxu,...,,2211它服从自由度为n的2分布,记为21221222212)()(...niiniinxxuuu2)(212~)(nniix若用样本平均数代表总体平均数μ,则随机变量服从自由度为n-1的2分布,记为x222122)1()(Snxnii2)1(22~)1(nSn显然,2≥0,即2的取值范围是[0,+∞)2分布密度曲线是随自由度不同而改变的一组曲线。随自由度的增大,曲线由偏斜渐趋于对称;df≥30时,接近正态分布。不同自由度的卡平方分布图三、2的连续性矫正2分布是连续性分布,而次数资料是间断性的。由次数资料计算得的2均有一定的偏差,特别是当自由度为1时偏差较大。Yates(1934)提出了一个矫正公式,矫正后的2值记为2c:TTAc22)5.0(当自由度大于1时,2分布与连续型随机变量2分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。第二节适合性检验一、定义判断实际观察的次数(属性)分配是否符合已知次数(属性)分配理论或学说的假设检验。二、步骤1、建立假设H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;HA:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。例如:在研究鲤鱼遗传规律试验中,F2观测结果如下,是否符合3:1比率?H0:鲤鱼体色F2分离符合3:1比率;HA:鲤鱼体色F2分离不符合3:1比率;2、在无效假设成立的条件下,按已知属性分配的理论或学说计算各属性的理论次数和自由度。适合性检验的自由度等于属性分类数(k)减1。df=k-1=2-1=1需要连续性校正3、计算出2或2c在无效假设H0正确的前提下青灰色的理论数为:Ei=1602×3/4=1201.5红色理论数为:Ei=1602×1/4=400.5χ2=∑(Oi-Ei-0.5)2Eii=12=+(1503-1201.5-0.5)21201.5(99-400.5-0.5)2400.5=75.41+226.22=301.634、将所计算得的2或值与根据自由度k-1查值表(附表4)所得的临界值:、比较,作出结论。若2(或)<,P>0.05,表明实际观察次数与理论次数差异不显著;若≤2(或)<,0.01<P≤0.05,表明实际观察次数与理论次数差异显著;若2(或)≥,P≤0.01,表明实际观察次数与理论次数差异极显著。2c205.0201.02c2c2c205.0205.0201.0201.0查χ2值表,当df=1时,χ20.05=3.84。现实得χ2c=301.63>χ20.05,故应否定H0,接受HA,即认为鲤鱼体色F2分离不符合3:1比率。F2代,共556粒31510110832例:豌豆圆粒和皱粒分离规律研究此结果是否符合自由组合规律根据自由组合规律,理论分离比为:161:163:163:169皱=黄圆:黄皱:绿圆:绿豌豆杂交实验F2分离结果黄圆黄皱绿圆绿皱实际观测数O理论频数P理论数EO-E(O-E)2/E3159/16312.752.250.0161013/16104.25-3.250.1011083/16104.253.750.135321/1634.75-2.750.218(1)H0:豌豆F2分离符合9:3:3:1的自由组合规律;HA:豌豆F2分离不符合9:3:3:1的自由组合规律;(2)取显著水平α=0.05(3)计算统计数χ2值:χ2=0.016+0.101+0.135+0.218=0.470(4)查值表,进行推断:df=4-1=3815.7205.0χ2<χ20.05P>0.05接受H0,即豌豆F2分离符合9:3:3:1的自由组合规律。第三节独立性检验一、独立性检验的意义对次数资料,除了进行适合性检验之外,有时需要分析两类因子是相互独立或彼此相关。这种根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。独立性检验与适合性检验是两种不同的检验方法,除了研究目的不同外,还有以下区别:(一)资料归组方式不同独立性检验的次数资料是按两因子属性类别进行归组,根据两因子属性类别的不同而构成2×2、2×c、r×c列联表(r为行因子的属性分类数,c为列因子的属性分类数)。适合性检验只按某一因子的属性类别将如性别、表现型等次数资料归组。(二)理论次数的计算依据不同适合性检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。(三)自由度的计算适合性检验中自由度为属性类别数(k)减1;r×c列联表的独立性检验中自由度为rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(横行属性类别数-1)×(直列属性类别数-1)。二、2×2表独立性检验在做2×2表的独立性检验时,df=(2-1)(2-1)=1,故计算2时需做连续性矫正。一般形式如下:2×2列联表一般形式行列总数121O11O12R12O21O22R2总数C1C2n给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表1.H0:给药方式与给药效果相互独立。HA:给药方式与给药效果有关联。2.给出显著水平α=0.053.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B)口服与有效同时出现的理论频率=口服频率×有效频率,即P(AB)=P(A)P(B)=98/193×122/193理论频数Ei=理论频率×总数=(98/193×122/193)×193=(98×122)/193=61.95即Eij=Ri×Cj/T=行总数×列总数/总数E11=R1×C1/T=61.95E12=R1×C2/T=36.05E21=R2×C1/T=60.05E22=R2×C2/T=34.95给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表057.195.345.095.34315.365.05.364005.605.005.606495.615.095.61585.0222222EEO计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正:给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)4.查χ2表,当df=1时,χ20.05=3.841,而χ2c=0.863<χ20.05,P>0.05,应接受H0,拒绝HA,说明给药方式与给药效果相互独立.在进行独立性检验时,也可以不经过计算理论次数而直接用实际观察次数计算2。2×2表21212211222112)2(RRCCnnOOOOc2×c表的一般形式如下行列总数123…C1O11O12O13…O1CR12O21O22O23…O2CR2总数C1C2C3…CCn2×c表的独立性检验也可以不经过计算理论次数而直接用实际观察次数计算2:或])([21212122nRCORRnjj])([22222122nRCORRnjjr×c表的一般形式如下行列总数123…C1O11O12O13…O1CR12O21O22O23…O2CR2…………………rOr1Or2Or3…OrCRr总数C1C2C3…CCnr×c表的独立性检验的2计算:]1)([22jiijCROn式中:i=1,2,…,r;j=1,2,…,ct检验、F检验和卡方检验在应用上有何主要区别?t检验、F检验主要应用于数量性状资料的显著性检验,其理论分布是正态分布;卡方检验主要应用于质量性状资料的显著性检验,其理论分布是二项分布或波松分布;t检验主要用于两样本平均数(或一个样本平均数与总体平均数)间的差异显著性检验;F检验主要应用于样本平均数的个数大于或等于3时的假设检验。小结1、掌握适合性检验、独立性检验、卡方的连续性矫正的概念;2、掌握两种卡方检验方法的步骤;3、了解t检验、F检验和卡方检验三种方法的区别与联系。

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功