数据统计分析32

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第六节计数资料的显著性检验—x2检验1.概念:比较观测值与理论值是否符合的假设检验叫适合性检验。2.检验(适合度检验)原理:应用理论推算值(E)与实际观测值(O)之间的偏离程度来决定其χ2值的大小。niiiiEEO122)(22越小,表明实际观察值与理论值越接近;=0,表示两者完全吻合;越大,表示两者相差越大。2χ2分布是连续型变量的分布,分布是一组曲线。3.χ2检验的步骤:(1)H0:理论值=观测值;HA:理论值≠观测值.(2)确定显著水平α;一般为0.05或0.01(3)统计量χ2;(4)推断.如果,接受H0,否定HA;如果,否定H0,接受HA,表明:在α显著标准下理论值与实际值差异是显著的.2222计算χ2时应注意的问题:(1)任何一组的理论次数Ei必须大于5.(2)在自由度df=1时需进行连续性矫正,公式为:niiiiEEO122)5.0|(|例:有一鲤鱼遗传试验,以红色和青灰色杂交,其F2代获得不同分离尾数,问观测值是否符合孟德尔3:1遗传定律.体色青灰色红色总数F2观测尾数1503991602(1)H0:鲤鱼体色分离符合3:1,HA:不符.(2)α=0.05(3)计算χ2:df=2-1=1,需要进行连续性矫正.假设H0正确时,青灰色E1和红色E2理论数:E1=1602×3/4=1201.5E2=1602×1/4=400.5将数据代入公式得:(4)推断:查χ2值表,当df=1时,故否定H0,接受HA.即认为鲤鱼体色F2分离不符合3:1比率.63.30122.22641.755.400)5.0|5.40099(|5.1201)5.0|5.12011503(|)5.0|(|22122niiiiEEO84.3205.0205.02>,χ2计算公式理论比率(显性:隐性)naA21naA25.122naA3232naA158152naA638972rnrraA221rmnmrramA22检验两组资料与某种理论比率符合度的χ2值公式1:12:13:115:19:7r:1r:m4.独立性检验研究两个或两个以上因子彼此之间独立的还是相互影响的一类统计方法.(χ2检验).独立性检验的功效就是通过与是否一致来判断因素之间是否独立。如吸烟与疾病的关系等.一、四格表x2检验如果样本的属性有两类,每类属性又可分为两部分,把这些属性放入表格中,就构成了四格表,即2×2列表。自由度为1,需校正。niiiiEEO122)5.0|(|检验步骤:(1)H0:事件A和B无关HA:事件A和B有关(2)确定α(3)计算χ2值(4)df=(行-1)(列-1)(5)推断:若表明实际观测与理论值不一致;若,表明实际观测与理论值一致。2222<例:某猪场采用一次配和两次配,其受胎结果如表,试检验差异性.(1)H0:两种方法与受胎率无关HA:与受胎率有关(2)α=0.01列行受胎未受胎总合Tr受胎率单次配两次配110(130.61)116(95.39)68(47.39)14(34.61)17813061%89%总合Tc22682308*括号为E值(3)计算χ2值理论数:E11=178×226/308=130.61E12=178×82/308=47.39E21=130×226/308=95.39E22=130×82/308=34.61df=(2-1)(2-1)=1,需要进行连续性矫正555.27685.11534.8240.4096.361.34)5.0|61.3414(|39.47)5.0|39.4768(|39.95)5.0|39.95116(|61.130)5.0|61.130110(|)5.0|(|222222EEO(4)推断,当df=1时,,,拒绝H0,接受HA;说明两种配种方法差异极显著.两次配大大提高了受胎率.2×2列联表也可用下列公式:2263.6201.0rsmnNNbcad...)2/|(|22χ2=N为总数,“nR”为行的合计数,“nC”为列的合计数。)1(2nnfCRiN二、多格表x2检验表的行数与列数都超过2,或行数为1,列数超过2。χ2=∑*自由度按(行数-1)×(列数-1)当行数为1时,自由度:(列数-1)注意尽量避免理论数小于5。EEOi2三、2x2列联表的精确检验法四格表中的任何一格的理论数都不得少于5,当少于5时用x2检验会有偏倚,需使用精确检验法。acbda+bc+da+cb+dN=a+b+c+d概率通式:!!!!!)!()!()!()!(dcbaNdbcadcbaPi第七节方差分析—变量分析方差分析用途:1.多个样本平均数的比较。2.分析多个因素间的交互作用。3.回归方程的假设检验。4.同质性检验。方差分析(变量分析):用方差作为统计量对试验结果进行的统计分析。方差分析基本思想:将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。依据变异来源:试验总变异处理间变异(组间变异):由处理效应引起处理内变异(组内变异):由随机误差引起处理间变异处理内变异试验指标(experimentalindex):为衡量试验结果的好坏和处理效应的高低,在实验中具体测定的性状或观测的项目称为试验指标。试验因素(experimentalfactor):试验中所研究的影响试验指标的因素。单因素试验两因素多因素试验因素水平(leveloffactor):试验因素所处的某种特定状态或数量等级。试验处理(treatment):事先设计好的实施在实验单位上的具体项目。试验单位(experimentalunit):在实验中能接受不同试验处理的独立的试验载体。重复(repetition):在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复。一、单因素多组群方差分析1.重复数相等的几个均数比较如将一群观察对象分成n组,每组重复k次,各组给以不同的处理。如下表:处理A1A2……Ai……An(组)x11x21……xi1……xn1x12x22……xi2……xn2x1jx2j……xij……xnjx1kx2k……xik……xnk.xi.总和TiT1T2TikTnkT=∑xij平均xix1x2xixnx每组具有k个观测值的n组样本符号表线性可加模型:xij是在第i次处理下的第j次观测值,μ为总体平均数,αi为处理效应,εij是试验误差。ijiijx样本线性模型为:ijiijetxx固定模型:各个处理的效应值αi是固定的。随机模型:各个处理的效应值αi不固定的。混合模型(1)平方和与自由度的分解总平方和=处理间平方和+处理内平方和kniniijknxxxxxx11212112ij)()(k)(SST=SSt+SSeT2/kn=C,则:knTxknxxxxSSijijijkinjT2222112ij)()(CxSST2ijnitxxkSS12)(CTki21tTeSSSSSSCSSniix12tk1(2)自由度分解总自由度dfT=kn-1。处理间自由度:dft=n-1处理内自由度:dfe=dfT-dftTTTTdfSSSMS/2ttttdfSSSMS/2eeeedfSSSMS/2F检验F=S12/S22将大方差做分子,使F值大于1,做单尾检验。不同处理差异显著性检验时:F=St2/Se2F分布与拒绝域如果均值相等,F=MSt/MSe1F分布F(n-1,kn-n)0拒绝H0接受H0F【例】某猪场对4个不同品种幼猪进行4个月增重测定,每个品种选择体重接近的幼猪4头,测定结果列如下表,试进行方差分析。重复品种大白沈白沈黑沈花123431.924.031.835.924.825.726.825.922.223.026.724.327.030.829.024.6总和T123.6103.296.2111.4T=434.4平均数30.925.824.127.9=27.2(1)假设:H0:σt2=σe2,HA:σt2≠σe2(2)显著水平:α=0.05,α=0.01(3)统计量:3.21396.1179326.120076.240.249.3196.11793164.434222222CCxSSnkTCT94.10396.1179390.11897)4.1112.1036.123(4112222CCTkSSit36.10994.10330.213tTeSSSSSS自由度:方差:151441nkdfT3141ndft12315tTedfdfdf113.912/36.109/647.343/94.103/eeetttdfSSMSdfSSMS不同品种猪4个月增重方差分析表变异来源dfSSs2FF0.05F0.01品种间品种内312103.94109.3634.6479.1133.802*3.495.95总变异15213.30表明品种猪的增重差异是显著的。多重比较适用范围:F值显著或极显著情况。多重比较:多个平均数两两间的相互比较。常用方法:最小显著差数法(leastsignificantdifference,LSD法)最小显著极差法(Leastsignificantranges,LSR法)(一)最小显著差数法(LSD法)1.计算:2.计算:3.若表明在给定α水平上差异显著,反之不显著。LSD..jixxLSDxxji....)(jiexxdfaaStLSD2122212~2..nnnsnsnsSeeexxji当α=0.05和0.01时....)(01.001.0)(05.005.0jiejiexxdfxxdfStLSDStLSDLSD法步骤:(1)列出平均数的多重比较表,各处理按其平均数从大到小自上而下排列(2)计算最小显著差数、(3)两两平均数的差数与、比较,作出统计推断。05.0LSD01.0LSD05.0LSD01.0LSD1346.24/113.92/22..nSSexxji)(5233.61346.2056.3)(6513.41346.2179.2....)(01.001.0)(05.005.0kgStLSDkgStLSDjiejiexxdfxxdf多重比较字母标记法:(1)先将平均数从大到小排列,在最大平均数后标a(2)将标a的平均数与下面的平均数比较,凡相差不显著(<LSD)标a,显著则标b。(3)以标b的平均数为标准,与各个比他大的平均数比较,凡相差不显著的在a右标b(4)以标b的最大平均数为标准,与下面未标记的平均数比较不显著标b,显著标c。如此反复。品种平均数差异显著性α=0.05α=0.01大白沈花沈白沈黑30.927.925.824.1aabbbAABABB多重比较*标记法表明:大白与沈黑差异极显著,大白与沈白差异显著。其他品种间差异不显著。品种平均数差异显著性-24.1-25.8-27.9大白沈花沈白沈黑30.927.925.824.16.8**3.81.75.1*2.13.0(二)最小显著极差法(LSR法)特点:把平均数的差数当作极差,根据极差范围内所包含的处理数(秩次距)M的不同而采用不同的检验尺度。有M-1秩次距,2为最小秩次距,常用LSR法:新复极差法q检验法。1.新复极差法(SSR法)SSR法(shortestsignificantranges),又称Duncan(邓肯法)。查SSR表。最小显著极差:H0:μA-μB=0xMdfaMaSSSRLSRe),(,2.q检验法(qtest)查q表,*ω为极差xxSLSRSq/)(/),(,MdfxMe

1 / 59
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功