异显著性检验EXCEL

linmingge
1 ℃
2020-01-17

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第四章均数差异显著性检验—t检验河南农业职业学院孙攀峰目的要求显著性检验的目的、方法以及步骤Excel进行t检验的步骤、方法第一节概率及分布概述一、事件定义：在一定条件下，某种事物出现与否就称为是事件。自然界和社会生活上发生的现象是各种各样的，常见的有两类。在一定条件下必然出现某种结果或必然不出现某种结果。确定性事件必然事件（U)(certainevent)不可能事件（V)(impossibleevent)一、概率基本概念在一定条件下可能发生也可能不发生。随机事件(randomevent)不确定事件(indefiniteevent)为了研究随机现象，需要进行大量重复的调查、实验、测试等，这些统称为试验。二、频率（frequency）若在相同的条件下，进行了n次试验，在这n次试验中，事件A出现的次数m称为事件A出现的频数，比值m/n称为事件A出现的频率(frequency)，记为W(A)=m/n。0≤W(A)≤1抛掷一枚硬币发生正面朝上的试验记录从表中可以看出，试验随着n值的不同，正面朝上出现的频率也不相同，当n越大时，频率越接近0.50。实验者投掷次数（n）发生正面朝上次数（m）频率（m/n）蒲峰404020480.5069皮尔逊1200060190.5016皮尔逊24000120120.5005一、概率基本概念频率表明了事件频繁出现的程度，因而其稳定性说明了随机事件发生的可能性大小，是其本身固有的客观属性，提示了隐藏在随机现象中的规律性。定义：设在相同的条件下，进行大量重复试验，若事件A的频率稳定地在某一确定值p的附近摆动，则称p为事件A出现的概率。P(A)=p统计概率抛掷一枚硬币发生正面朝上的试验记录实验者投掷次数发生正面朝上的次数频率(m/n)蒲丰404020480.5069K皮尔逊1200060190.5016K皮尔逊24000120120.5005随着实验次数的增多，正面朝上这个事件发生的频率稳定接近0.5，我们称0.5作为这个事件的概率。三、概率（probability,P)P(A)=p=lim在一般情况下，随机事件的概率P是不可能准确得到的。通常以试验次数n充分大，随机事件A的频率作为该随机事件概率的近似值。mnmn12345678910随机抽取一个球，求下列事件的概率;（1)事件A＝抽得一个编号4（2)事件B=抽得一个编号是2的倍数该试验样本空间由10个等可能的基本事件构成，即n=10，而事件A所包含的基本事件有3个，即抽得编号为1、2、3中的任何一个，事件A便发生。P(A)=3/10=0.3P(B)=5/10=0.5一、概率基本概念12345678910A＝“一次取一个球，取得红球的概率”10个球中取一个球，其可能结果有10个基本事件（即每个球被取到的可能性是相等的），即n=10事件A：取得红球，则A事件包含3个基本事件，即m=3P(A)=3/10=0.3四、小概率事件原理概念：如果某事件发生的概率很小，在大量重复试验中事件发生的频率也很小，在1次试验中该事件被看做是不会发生的。应用：是假设检验时进行统计推断的理论依据。通常将5%，1%认为是小概率的标准，又称显著水平。第二节均数差异显著性检验一、复习回顾生物统计的本质：研究如何从样本推断总体样本抽取的原则：随机抽样试验误差的概念：由样本推断总体时，由各种无法控制的随机因素引起的误差。现在，我们假设有这样一个情况：从一批同质（相同品种、相同日龄、相同饲料、相同饲养管理等）的20000只肉鸡中随机抽取各含100只肉鸡的两个样本，分别称量其42天出栏重，结果发现：样本1平均出栏重为：2.24kg/只样本2平均出栏重为：2.31kg/只两样本来自同一总体，但二者的样本平均数却存在一定差异这种差异来源于随机抽样造成的随机误差！现在，我们再来看另一种情况：在相同日龄、相同饲料、相同饲养管理等条件下，随机从两个品种（AA肉鸡、艾维因肉鸡）的各10000只肉鸡中分别抽取100只肉鸡做为样本，称量其42天出栏重，结果发现：AA肉鸡平均出栏重为：2.31kg/只艾维因肉鸡平均出栏重为：2.24kg/只差异品种本质差异随机误差在试验进行过程中，尽管尽量排除随机误差的影响，以突出试验的处理效应，但由于生物个体间无法避免的差异，以及诸多无法控制的随机因素，使得试验结果最后表现的观察值除了处理效应以外，还包括试验误差的效应。处理效应误差效应表面效应二、显著性检验的目的对两个样本进行比较时，必须判断样本间差异主要是随机误差造成的，还是本质不同或处理效应引起的？处理效应误差效应表面效应处理效应误差效应显著性检验显著性检验分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断三、显著性检验的任务四、显著性检验的原理小概率原理：统计假设：对总体的某些未知或不完全知道的性质提出待考查的命题，通常包括无效假设和备择假设。根据样本资料对假设的成立与否进行推断就是假设检验，也称显著性检验。五、显著性检验的分类t检验——主要用于检验两个处理平均数差异是否显著；方差分析——主要用于检验多个处理平均数间差异是否显著；检验——主要用于由质量性状得来的次数资料的显著性检验等。六、显著性检验的步骤1、提出假设2、确定显著水平3、选定检验方法，计算检验统计量，确定概率值作出推断4、结论：是否接受假设例1：随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数，得到如下数据资料：试比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。产仔数内江猪141512111317141413荣昌猪121413131214101010下面以两均数差异显著性检验为例具体说明操作步骤。1、提出假设对立无效假设/零假设/检验假设备择假设/对应假设1＝212误差效应处理效应H0HA提出假设：（1）无效假设H0：1＝2即假设两品种经产母猪产仔数的总体平均数相等，试验的处理效应（品种间差异）为0。（2）备择假设HA：1≠2即假设两品种经产母猪产仔数的总体平均数1和2不相等，亦即存在处理效应，其意义是指两品种经产母猪产仔数存在本质上的差异。例：比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。2、确定显著水平＝0.05显著水平*极显著水平**能否定H0的人为规定的概率标准称为显著水平，记作。统计学中，一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。P＝0.01＝0.053、选定检验方法，计算检验统计量，确定概率值根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例：这里是对两品种经产母猪产仔数的总体平均数进行比较，因此为均数差异显著性检验------t检验。在无效假设H0成立的前提下计算t值注：由于计算过程复杂，这里不再重复书上内容，在下面将具体讲解如何用Excel来进行统计分析。Excel进行t检验分类Excel可提供的t检验工具：t-检验：双样本等方差假设此t-检验先假设两个数据集取自具有相同方差的分布，可确定两个样本是否来自具有相同总体平均值的分布。t-检验：双样本异方差假设此t-检验先假设两个数据集取自具有不同方差的分布，可以确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时，可使用此检验。t-检验：平均值的成对二样本分析当样本中存在自然配对的观察值时（例如，对一个样本组在实验前后进行了两次检验），可以使用此成对检验，以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。Excel进行t检验步骤（一）输入数据Excel进行t检验步骤（二）“工具”“数据分析”“t检验”这里假设无效假设Ho成立，即两品种无差异，二者来自同一总体，则为“双样本等方差假设”。Excel进行t检验步骤（三）拉取两品种数据假设Ho成立，则平均差为0.“内江猪”“荣昌猪”做为标志拉取在上面的变量区域中显著水平结果输出区域，可选任一空白单元格Excel进行t检验步骤（四）双尾概率P计算所得t值4、作出推断结论：是否接受假设PP小概率原理接受H0否定HA否定H0接受HA假设H0成立可能正确假设H0成立可能错误例：上例中P＝0.0530.05所以接受H0，从而得出结论：内江猪与荣昌猪经产母猪产仔数未发现有显著差异，其表面差异应有大于5%的概率归于随机误差所致。分析题意提出假设确定显著水平计算检验统计量作出推断假设检验的步骤:显著性检验的两类错误H0正确H0错误否定H0错误()推断正确(1-)接受H0推断正确(1-)错误()第一类错误（typeIerror），又称弃真错误或错误;第二类错误（typeIIerror），又称纳伪错误或错误七、显著性检验两种类型错误１、两类错误既有联系又有区别错误只在否定H0时发生错误只在接受H0时发生错误增加错误减小错误增加错误减小2、还依赖于-0的距离3、n,2可使两类错误的概率都减小.八、样本均数与总体均数差异显著性检验无效假设为Ho：o备择假设为HA：o计算公式如下：根据以上公式可导出以下结论：由此可知，当总体平均数落在已知的样本均数置信概率为（1-）的置信区间以外时，就表明在显著水平时差异显著。样本均数与总体均数差异显著性检验t检验例5.2：母猪的怀孕期为114d，现抽测12头大白猪母猪的怀孕期分别为115，113，114，112，116，115，114，118，113、115、114、113，试检验所得样本的平均数与总体平均数114d有无显著差异？第一步，输入数据第二步，工具---数据分析---描述统计第三步，输入参数第四步，计算结果95%置信区间下限：114.3333-1.025696=113.3上限：114.3333+1.025696=115.4总体平均数：114d分析：总体平均数落在样本均数置信概率为95%的置信区间内（113.3～115.4），说明样本均数与总体均数差异不显著。九、两个样本平均数的差异显著性检验成组数据平均数的比较成对数据平均数的比较试验设计非配对试验设计配对试验设计非配对试验—成组数据平均数的比较试验单位完全随机地分两组，各实施一试验处理，两个样本之间的变量没有任何关联，不论两样本的容量是否相同，所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准，来检验其差异的显著性。如：随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数：内江猪：14，15，12，11，13，17，14，14，13荣昌猪：12，14，13，13，12，14，10，10，20分析：这里两品种猪的产仔数无任何关联，每种猪的产仔数分别组成一组数据，相互比较时以组平均数做为比较标准，在Excel里进行t检验时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进行分析。配对试验—成对数据平均数的比较试验单位两两配对，随机分配到两个处理，配对的试验单位要求存在相似性，而每个处理内的各试验单位不一定相似，可以变异较大，但配对内试验单位要求相似，因此，两样本容量相同，所得数据为成对数据，两组数据以相配对的试验单位之间的差异作为相互比较的标准，来检验其差异的显著性。在Excel里进行t检验时应采用“t检验-平均值的成对二样本分析”模块进行分析。配对试验—成对数据平均数的比较如：从8窝仔猪中每窝选出性别相同、体重相近的两头随机分配到两个饲料组中进行对比试验：12345678甲x110.011.214.012.17.59.816.510.8乙x29.810.613.311.56.69.015.89.8x1-x20.20.60.70.60.90.80.71.0分析：每窝中选出的性别相同，体重相近的两头仔猪做为一个配对被随机分到甲、乙两组饲喂两种饲料，但甲组中来自8窝的仔猪之间可以性别不同，体重不相近，因此最后的数据是原来属于同一窝的两仔猪的成对数据，比较的是配对仔猪之间的差异，而非两组平均数的差异。实例：某研究所对三黄肉鸡进行饲养对比试验，试验时间为60d，增重结果如下表，问