问题引入:前面所学的检验是在总体分布类型已知的前提下,对有限个未知参数进行的检验,那么如何来判断一组样本观察值来自某种分布类型的总体呢?解决办法:拟合优度检验Y_R_(黄圆)Y_rr(黄皱)yyR_(绿圆)yyrr(绿皱)总计31510110832556例1例2第七章拟合优度检验GoodnessOfFitTest※7.1拟合优度检验的一般原理7.2拟合优度检验7.3独立性检验(难点)7.1拟合优度检验的一般原理1.什么是拟合优度检验?拟合优度检验是用来检验实际观测数与依照某种假设或模型计算出来的理论观测数之间的一致性。2.类型(1)检验观测值与理论值的一致性(2)判断事物之间的独立性——独立性检验3.原理:※判断样本观察频数(Observedfrequency)与理论(期望)频数(Expectedfrequency)之差是否由抽样误差所引起。补充:皮尔逊定理(pearson)设为总体的真实概率分布,统计量随n的增加渐近于自由度为r-1的分布。12(,,,)rppp221()riiiinnpnp2•Pearson定理满足三个条件:(1)理论值,如果有一个或者多个则应与相邻组合并,直到大于等于5.(2)当df=1时(3)理论分布带参数时,自由度为r-1-m,其中m为参数的个数。χ2分布(chi-squaredistribution)0.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=62/)12/(2222)2/(21)(efP=0.05的临界值3.847.8112.594.拟合优度检验的一般步骤:(1)建立假设检验,确定检验水准;(2)根据理论分布类型对数据进行分组,列出各组的;(3)根据理论分布的定义计算理论数;(4)计算值;(5)计算自由度;(6)将计算的值与临界值作比较,并做出统计推断。卡方分布下的检验水准及其临界值7.2拟合优度检验一、理论分布已知的情况(不带未知参数)1二项分布的检验例7.1纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,第二代分离数目如下,问是否符合自由组合规律?Y_R_(黄圆)Y_rr(黄皱)yyR_(绿圆)yyrr(绿皱)总计31510110832556【补例7.2】(二项概率检验)根据遗传学规律,某种杂交花卉子代黄绿花的比例为3:1,现在某时间种下该花卉种子,开花时节观察结果如下表实际频数行所列数据,试问开黄花和开绿花的比例是否为3:1?黄花绿花合计实际频数8416100【补例7.3】(Poisson分布的拟合优度检验)将酵母细胞的稀释液置于某种计量仪器上,数出每一小方格内的酵母细胞数,共观察了413个小方格,结果见表7.3第1、2列,试问该资料是否服从Poisson分布?卡方分量【补例7.4】调查了某地200名男孩身高,得分组数据见下表,男孩身高是否服从正态分布?其他类型变量分布的拟合优度检验1.几何分布2.正态分布可仿照上述二项分布、Poisson分布的方法进行分布的拟合优度检验。拟合优度卡方检验的问题1.分组不同,拟合的结果可能不同。2.需要有足够的样本含量。对于连续型变量的优度拟合,卡方检验并不是理想的方法。统计学家推荐的拟合检验方法是:Shapiro-Wilk检验Kolmogorov-Smirnov检验7.3独立性检验一、列联表的独立性检验原理:Pearson定理用途:检验事物之间的独立性1.2×2列联表检验2.r×c列联表检验难点四格表资料的基本形式四格表的前提条件:双边固定处理组阳性事件发生数阳性事件未发生数合计甲aba+b乙cdc+d合计a+cb+dn1.22列联表(四格表fourfoldtable)处理方式效果有效无效口服ab注射cd22列联表自由度df=1四格表资料检验的专用公式:22()()()()()adbcnabcdacbd和前面的结果一样22(||0.5)()()()()adbcnnabcdacbd2.rc列联表自由度:【例7.5】下表列出对某种药的试验结果,问给药方式对药效果是否有影响?※二、22列联表的精确检验法(Fisher检验法)前提条件:某一格的理论数小于5。思想:用古典概型的方法求出尾区的概率,然后与给定的显著性水平相比,大于则接受,反之拒绝。需要解决的问题:1.用古典概型求22列联表出现某一组数值的概率;2.离散分布尾区建立的方法。1.22列联表概率的计算方法abcda+bc+da+cb+dN2.离散分布尾区概率的计算方法:从实际观测值开始,把对成立不利的方向上的概率全加起来,作为尾区概率。3.22列联表的精确检验若a,b,c,d中任何一个为0,则可用p直接与或比较,若各格取值均不为0,一般可取其中最接近于0的那一个,求出它取值在0与当前值之间的所有概率p,并把它们全加起来,用其和与或比较,这样做的前提是该格的理论值比观测值大。【例7.6】用两种饲料A和B饲养小白鼠,一周后测其增重情况如下表,问用不同的饲料饲养小白鼠的增重差异是否显著?未增(只)增总数A饲料415B饲料066总数4711【例7.6】观测性别对药物的反应如下:问男女对该药反应是否相同?有反应无反应总数男415女369总数7714Fisher’s2×2ExactTest用来检验零假设[即某个给定的基因(基因1)在两个群体中没有差异调控]项目基因1所有其他基因总和群体A(如脑)归属基因1的序列数(g1A)该群体中非基因1的序列数(NA-g1A)NA群体B(如肝)归属基因1的序列数(g1B)该群体中非基因1的序列数(NB-g1B)NB总和c=g1A+g1BC=(NA-g1A)+(NB-g1B)Fisher’sexacttest的p值由下式给出:练习1:假定对股东的拟议合并意见按照股东的性别进行分类,其结果如下表所示:性别意见赞成反对未定男454510女553510要求:分析这些数据是否提供了充分的证据表明股东对拟议合并的反应取决于股东的性别。练习2:用两种不同药物治疗某种疾病,6人服用A药痊愈5人,6人服用B药痊愈3人,问两种药物的疗效有无显著差异?本章小结•1.拟合优度检验的一般原理(※)•2.拟合优度检验•3.独立性检验难点