生物数据统计分析方法第三章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

主要内容绪论统计量、统计分布与统计比较回归与最小二乘分析比较试验设计与分析回归试验设计与分析动态试验指标的统计推断综合试验指标的统计推断试验设计基本知识•试验设计•试验设计的步骤:假说、设计、试验、分析•指标:计量指标、计数指标•因素:定量因素、定性因素•水平•处理观察与试验•观察(observationalstudy):客观性,无法控制(处理的实施和影响因子),不能随机将试验对象分配在各处理组调查–调查某集合的个体,研究该总体的各种参数的取值–总体调查:该集合的全部(census,人口普查)–抽样调查:用有代表性的样本推断总体–描述型和分析型,流行病学即分析型,需要通过与疾病发生和散布有关的风险因子(品种、年龄等)分析,调查某疾病的病原观察与试验•试验(experimentalstudy):通过对条件的控制(温度、处理),检验某试验因子是否能直接导致反应的不同,个体在不同“组”分配的随机性–实验室试验–临床试验IfX,thenYandIfnotX,thennotY试验设计的意义•试验性科学研究的基本步骤–试验设计–实施试验–分析处理试验结果•试验设计的目的–保证数据质量获得正确科学的结论–提高试验的效率•常见错误–希望通过统计“处理”得出符合自己设想的结论–希望通过统计分析来弥补设计上的缺陷收集资料试验设计的几个概念•试验指标–对每个试验单元要度量的试验结果的标志•日增重、产仔数、瘦肉率、产奶量、•试验因子–试验中要研究的影响试验指标的因素•品种、饲料、性别、药物、饲喂方式、–单因子试验、双因子试验、多因子试验–客观因子(干扰因子):除试验因子外的其他可能影响试验指标的因素试验设计的几个概念•因子水平–对试验因子按其质或量所划分的等级或状态•不同品种、饲料的不同营养水平、•处理–根据试验因子的不同水平对试验单元所采取的不同措施–单因子试验:每个水平是一个处理–多因子试验:每个水平组合是一个处理试验设计的几个概念•试验误差–由于除试验处理外的其他因素所引起的观测值的变异–试验设计的主要目的就是要尽量减小试验误差–系统误差:•由于干扰因子造成的不同处理内的试验单元之间存在整体性的差异–随机误差:•由于随机和偶然因素所造成的误差,造成试验单元之间的随机变异试验设计三原则(principle)•随机化(randomization):试验单元的完全随机分配–降低系统误差–随机误差的无偏估计•重复(replicate):处理或处理水平组合中有2或2个以上试验单元–估计随机误差–提高试验的精确度:n•局部控制(portionofcontrol):对付不可去除的干扰因子–配对试验另外:平衡性(balance):组内观察值个数相等,最高效力动物试验中的干扰因子•试验单元、时间或者操作人员间的差别–窝(litter):遗传、哺乳等–地域(area):圈舍、牧场、地区–时间:批次、温度×湿度、操作员、心情试验设计基本知识•试验因素按水平的特点主要分定性和定量因素两种,过去对两种因素的统计分析方法是不加区分的,为了比较因素水平间的差异都采用一样的统计比较方法。•事实上就定量因素而言,人们除了要分析参试水平的效果而且对未参试水平亦感兴趣,希望得到所谓“最佳”或“最适”效果的水平,对此常规的统计比较方法就显得很局限,为此人们引用回归分析的方法来解决这种问题,回归分析具有预测功能。•鉴于此我们把试验设计按定性和定量因素以及所对应的统计分析目的不同分比较设计和回归设计两类。统计比较的试验设计•单因素试验设计完全随机设计随机区组设计:(平衡不完全区组设计)拉丁方设计交错设计(反旋转设计)统计比较的试验设计•多因素试验设计完全随机设计——完全交叉设计——析因设计正交设计系统分组设计——嵌套设计裂区设计混杂设计单因素试验设计一、完全随机设计–将所有试验单元完全随机地分配到各个处理(组)中–适用于不存在已知的除处理外的其他对试验指标有重要影响的干扰因子的情形–分组方法•抽签•利用随机数单因素试验设计–分析方法•2个处理:T检验•2个以上处理:方差分析–优缺点•优点:简单误差自由度最大当有试验单元缺失时,信息损失较小•缺点:当存在干扰因子时,试验误差较大品种号观测值(头/窝)Tinimean123458131299978107131410111212149881012111514603272485264654108129.613总和26425单因素试验设计二、配对设计-局部控制的应用–用于只有两个处理的单因子试验–目的:消除或降低某个干扰因子对试验指标的影响–方法:•将参加试验的试验单元两两配对•每一对子的两个试验单元分别随机地接受两个处理中的一个–配对的原则•对子内干扰因子的影响不存在或很小,对子间允许存在干扰因子上的差别单因素试验设计–配对的方式•自身配对:将同一个体在不同时间或不同部位所接受的不同处理作为一个对子•亲缘配对:将亲缘关系相近的个体配对(同胞配对、亲子配对)•条件配对:将具有相近条件(性别、年龄、体重等)的个体配成对子单因素试验设计三、随机区组设计-配对设计的扩展–配对设计的扩展,用于有2个以上处理的单因子试验–目的:同配对设计–方法:•将试验单元按干扰因子的不同水平分组•每组内的单元数等于处理数•每个单元随机地接受一种处理–要求:区组内干扰因子的影响不存在或非常小区组与处理间无互作随机区组设计–常用的分组方式•按窝分组(随机窝组设计)•按圈舍分组•按时间分组–分析:同双向分类交叉分组无重复资料的方差分析•随机区组设计的优缺点•随机区组设计的主要优点1、设计与分析方法简单易行。2、由于随机单位组设计体现了试验设计三原则,在对试验结果进行分析时,能将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,因而试验的精确性较高。3、把条件一致的供试动物分在同一单位组,再将同一单位组的供试动物随机分配到不同处理组内,加大了处理组之间的可比性。随机区组设计的主要缺点当处理数目过多时,各单位组内的供试动物数数目也过多,要使各单位组内供试动物的初始条件一致将有一定难度,因而在随机单位组设计中,处理数以不超过20为宜。单因素试验设计四、拉丁方设计–用于有2个干扰因子存在的单因子试验–方法:•将试验个体按这两个干扰因子双向分组•每组内的每个单元随机接受一种处理•可采用拉丁方来帮助设计双向随机区组设计•拉丁方:Latinsquare–适用于存在两个干扰因子的情况–按两个方向划分区组–每个区组的组合安排一个试验单元–需要借助拉丁方来进行:以拉丁字母排列的方阵每个字母在每行每列只出现一次ABCBCACABABCDBCDACDABDABC标准拉丁方!拉丁方设计方法•两个区组一个试验因子:例如牛、阶段和饲料55拉丁方牛只12345一阶段料5料1料2料3料4二阶段料4料3料5料2料1三阶段料2料5料4料1料3四阶段料1料4料3料5料2五阶段料3料2料1料4料5区组1:牛区组2:阶段试验因子:饲料拉丁方设计方法•基本步骤:–选择拉丁方:根据因子水平数任选一标准拉丁方–经过三次随机后得到拉丁方设计!•拉丁方:行=列=字母数•每个区组的组数和因子的水平数相等拉丁方设计方法•设计用四头猪测定四种饲料对增重速度的影响,各增重阶段的生长速度不同。–猪和增重阶段作为区组,饲料作为试验因子–试验因子4个水平选44拉丁方,各区组数也为四个–任取一个标准拉丁方,行代表阶段,列代表猪,字母代表饲料–随机:按抽签或随机数字法得到3个随机的1-4的顺序ABCDBCDACDABDABCBDCACADBDBACACBDDBACBDCAACBDCADB41322413拉丁方设计方法•第三个随机:将试验因子的水平随机分配给拉丁方中的字母ABCD3241DBACBDCAACBDCADB猪1猪2猪3猪4段1料1料2料3料4段2料2料1料4料3段3料3料4料2料1段4料4料3料1料2拉丁方设计的分析•类似于三因子无重复的方差分析二因子无重复ijjiijeXBATEqjjBpiiApiqjijTSSSSSSSSCFXpSSCFXqSSCFXSS121211211..ijkkjikijeXCBATErkkCqjjBpiiApiqjrkijkTSSSSSSSSSSCFXrSSCFXpSSCFXqSSCFXSS12..12..12..1112111拉丁方设计的分析猪1猪2猪3猪4行和段1料1料2料3料4X1.段2料2料1料4料3X2.段3料3料4料2料1X3.段4料4料3料1料2X4.列和X.1X.2X.3X.4X..412.412.414124141jjiiijijTCFXSSCFXSSCFXSS段猪料1料2料3料441241kkCFXSS料料44拉丁方的ANOVA料猪段SSSSSSSSSSTESourceSSdfMSFvaluePhaseSS段3PigSS猪3FeedSS料3ErrorSSE6TotalSST15EMSMSF段段3段段SSMS78.9)6,3(;76.4)6,3(01.005.0FFEMSMSF猪猪3猪猪SSMSEMSMSF料料3料料SSMS6EESSMS教材例题的理解拉丁方设计的优缺点•采取了双重的局部控制,消除或减小两个干扰因子的影响从某个角度讲提高灵敏度•区组1=区组2=因子水平限制的情况较多•误差自由度较小,拉丁方本身固有•高阶拉丁方:66df=36-1-5-5-5=20•5~8阶拉丁方较好•重复拉丁方设计•2个44:df=162-1-3-3-3-1=21•缺失值需要估计&SS需要校正多因素完全随机设计——析因设计•析因试验:factorialexperiment–完整的析因试验要安排各因子所有水平的组合–组合数计算:水平数相乘五因素4水平多因素完全随机设计——析因设计A1A2B1A1B1A2B1B2A1B2A2B2无重复不能估计互作不设重复的试验需要假定因子间无互作效应!最简单的析因试验:2因子,每因子2水平,无重复多因素完全随机设计——析因设计•以三因素三水平为例:1、表示方式ABC为三因素,123为三个水平多因素完全随机设计——析因设计2、组合数3、统计量个数无重复:有重复62313CCnT27333N7332313CCCnT多因素完全随机设计——析因设计4、统计分析无重复:有重复:eCBCABACBATSSSSSSSSSSSSSSSSeCBCABACBATdfdfdfdfdfdfdfdfeCBACBCABACBATSSSSSSSSSSSSSSSSSSeCBACBCABACBATdfdfdfdfdfdfdfdfdf正交试验设计•Orthogonaldesign•多因子析因试验的助手:不损失主要信息的情况下减小试验规模,借助正交表选择水平组合正交设计正交表L8(27)2:1,2123456711111111211122223122112241222211521212126212212172211221822121127个因素不同水平的第8次试验正交设计正交表的特点•每一列所包含的各种水平数相同•任何2列同一行的2个数字组成的所有可能数对,出现次数相同。12345671111111121112222312211224122221152121212621221217221122182212112均匀分散,整齐可比正交设计L9(34)选择正交表LN(pr)原则:•各实验因素的水平数最好相等。当p=2,可选L4(23)、L8(211)、L16(215)等;当p=3,可选L9(34)、L18(37)、L27(313)等;当p=4,可选L16(45)、L32(49)等。•试验的操作简单或希望

1 / 59
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功