第十一章试验设计Chapter11experimentaldesign第一节第二节第三节试验设计的基本原理简单实验设计单因素实验设计本章的主要内容第四节两因素实验设计第五节正交设计及其统计分析第一节:试验设计的基本原理一、试验设计的基本原理二、实验计划书的编制课题的名称试验目的研究依据、内容试验方案试验单位的选取试验记录项目和要求试验结果的分析方法经济或社会效益分析已备条件尚缺少的条件参加研究人员试验时间、地点成果形式学术论文撰写试验单位的重复数进度安排、经费预算研究的预期效果试验单位的分组试验单位的选取试验单位的重复数试验单位的分组广义:整个试验计划的拟定。包括:狭义一、试验设计的基本原理1.试验设计避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。2.试验设计的目的在研究工作进行之前,根据研究项目的需要,应用统计学原理,作出周密安排,力求用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料,通过分析得出正确的结论,明确回答研究项目所提出的问题。如果设计不合理,不仅达不到试验的目的,甚至导致整个试验的失败,能否合理地进行试验设计,关系到科研工作的成败。3.实验设计的任务1)节省人力、物力、财力和时间;2)减少试验误差,提高试验的精确度,取得真实的试验资料,为统计分析得出正确的结论打下基础。4.实验设计的意义5.1重复估计和降低试验误差5.试验设计的基本原则不设置重复只能得到1个观测值,则无从看出差异,因而无法估计试验误差的大小。只有获得2个或2个以上的观测值时,才能估计出试验误差。yssnn增加,可以降低试验误差。但在实际应用时,重复数太多,试验材料的初始条件不易控制,也不一定能降低误差。重复数的多少可根据试验的要求和条件而定。5.2随机化随机化是指在对试验材料分组时必须使用随机的方法,使供试材料进入各试验组的机会是相等,以避免试验材料分组时试验人员主观倾向的影响。是排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量。5.3局部控制局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。在试验环境或试验单位差异较大的情况下,根据局部控制原则,可将整个试验环境或试验单位分成若干小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制原则能较好地降低试验误差。重复、随机、局部控制三个基本原则是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能最大程度地降低并无偏估计试验误差,无偏估计处理效应,从而对于各处理间的比较作出可靠的结论。二、实验计划书的编制(自学)封面国内外研究动态实验目的预期结果实验设计的选择试验方法的确定田间规划实验记录第二节:简单试验设计将实验材料随机分成两组,每组各接受一种处理,通过分析处理效应之差异是否由随机误差造成的,来判断是不是存在处理效应。对于不同类型的因素,在实验设计时原则上是相同的。1成组比较试验设计2成组比较试验设计注意的问题一定要用随机化方法划分两组实验材料对照组和处理组的的样本含量要相等设置重复对照的设置降低实验误差3配对试验设计把窝别、性别相同、年龄、体重相近的两个动物配成一对,然后用随机的方法将每对的两头动物分别安排到两组中。动物试验中称为配对试验设计。同一对动物之间差异要尽量小些,不同对之间的动物可以有差异。也可进行同一只动物前后两次进行不同的处理,对处理前后的结果进行比较。第三节:完全随机化设计(completelyrandomizeddesign)成组比较试验设计的扩展,是单因素多个水平之间的比较。其含义是作为实验用的个体(或田间小区)被分配到处理的哪一个水平完全是用随机化方法确定的。要求实验个体或试验小区必须具备同质性。如果不能做到完全同质,个体间的变差也应控制到最小。例如:研究服用四种不同化疗药物对动物白细胞含量的影响。化疗药物:一个因素,四种药物:四个水平随机数字表动物编号01020304050607080910随机数字49914354829637932378余数1332201132动物编号11121314151617181920随机数字87352017438426345464余数3301302220分4组第一组随机数字49379317动物编号01070814第二组随机数字548278263454动物编号040510171819第三组随机数字914323873543动物编号020309111215第四组随机数字96208464动物编号06131620哪一个调出:42÷6,余数0,第二组的第六个随机数字相应的19号动物调出。先调哪一组:42÷4,余数2,先从第二组调剂,放到哪一组:09÷4,余数1,放在第一组。第一组动物编号0107081419第二组动物编号0405101718第三组动物编号0309111215第四组动物编号0206131620药物分组药物号1234随机数字76086324组号4132分配最终结果第一组动物编号01070814192号药物第二组动物编号04051017184号药物第三组动物编号03091112153号药物第四组动物编号02061316201号药物设计最终结果第四节:随机化完全区组设计(randomizedcompleteblockdesign)完全:每一区组内都包含全部处理。区组:将性质相似的实验材料或大致相同的环境条件安排在同一组群中,该组群称为区组。badce例:品种比较试验,设试验有5个品种a,b,c,d,e,根据试验地条件,可以安排三个区组,每一区组除品种不同外,其他条件都一致。区组Ⅰedbac区组Ⅲceabd区组Ⅱ小区动物编号随机数字秩次区组内排列区组Ⅰ01198(2)0302304(3)01(2)03186(1)0204413(5)0505380(4)04区组Ⅱ06646(4)0907878(5)0808354(2)1009149(1)0610384(3)07动物编号随机数字秩次区组内排列区组Ⅲ11664(4)1312560(2)1213012(1)1414645(3)1115683(5)15区组Ⅳ16099(1)1617371(2)1718623(3)1819947(4)1920962(5)20区组ⅠⅡⅢⅣB391316D181217处理A2101418E561119C471520整个试验设计为:(数据处理参考P289)随机化完全区组设计的优缺点缺点:必须保证区组内的条件一致性。优点:从误差平方和中分解出区组平方和,比完全随机化设计的灵敏度要高。对处理数和区组数没有限制。分析简单等。第五节:拉丁方设计(latinsquaredesign)随机区组设计控制了区组内的同质性,即从一个方向实行了局部控制,而拉丁方设计则从两个方向实行了双重局部控制,因而试验的精确度比随机区组设计高。在田间试验开始之前,一般都需要对地力进行勘探。假设勘测的结果是试验地的东部和北部肥沃,西部和南部贫瘠。ADBECDACBECBEDABEACDECDAB北东南西肥沃贫瘠构成上述方阵的各个小区,最初是由拉丁字母表示的,所以称为拉丁方(Latinsquare)1什么是拉丁方ABCDEBCDEACDEABDEABCEABCD若一个拉丁方的第一行和第一列是按拉丁字母顺序排列的,则称为标准拉丁方(standardLatinSquare)第五节:拉丁方设计(latinsquaredesign)将p个不同符号排成p列,使第一个符号在每一行、每一列都仅出现一次的方阵,称为p×p拉丁方。应用拉丁方进行试验设计,就是在行、列两个方向上都进行局部控制,使行、列两向皆成完全区组或重复。处理数重复数行数列数相等例:为了研究5种不同温度对蛋鸡的产量影响,将5栋鸡舍的温度设为A,B,C,D,E,把各栋鸡舍鸡群的产蛋期分为5期。由于各鸡群和产蛋期的不同对产蛋量有较大的影响。采用拉丁方设计。ABCDEBCDEACDEABDEABCEABCD1)选择拉丁方2拉丁方实验设计2)随机排列非标准型,直接按拉丁方中的字母安排试验方案。若是标准拉丁方,要对横行、直列和处理的顺序进行随机排列。随机数字表抄3个5位数,舍去0,6以上的数。13542,41532,34521(1)直列随机按13542顺序重排ABCDEBCDEACDEABDEABCEABCD135421ACEDB2BDCEA3CBDAE4DEABC5EABCD(2)横行随机按41523顺序重排135421ACEDB2BDCEA3CBDAE4DEABC5EABCD4DEABC1ACEDB5EABCD2BDCEA3CBDAE(3)把5种不同温度按第3个5位数34521顺序排列A=3,B=4,C=5,D=2,E=1产蛋期鸡群一二三四五ⅠD(2)E(1)A(3)B(4)C(5)ⅡA(3)C(5)E(1)D(2)B(4)ⅢE(1)A(3)B(4)C(5)D(2)ⅣB(4)D(2)C(5)E(1)A(3)ⅤC(5)B(4)D(2)A(3)E(1)5种不同温度对鸡产蛋量影响的拉丁方设计注:括号内的数字表示温度的编号(数据处理参考P293)试验处理数不能太多,5-10。试验处理数10,试验庞大,难以实施。试验处理数5,误差项自由度太小。在采用4个以下处理的拉丁方设计时,为了使估计误差自由度12,可采用“复拉丁方设计”,即同一个拉丁方试验重复进行数次,并将试验数据合并分析,以增加误差项的自由度。3缺点第六节:裂区设计裂区设计是两因素试验的一种分析工具。裂区设计的每一区组内A因素先分为a个处理,在每一处理内B因素再分为b个处理,随机化过程在a,b间进行,由A因素所划分的a个部分称为主区(mainplot),每一主区再划分的b个部分称为次区(sub-plot)。例如:用3种不同方法从植物中提取有效成分,按4种不同浓度添加到培养基中,观察对培养植株生长的促进作用,记录培养一个月后植株的重量。方法(A)A2A1A3浓B1B3B2度B2B2B1(B)B3B1B3B4B4B4区组Ⅰ区组Ⅲ区组Ⅱ方法(A)A1A3A2浓B4B1B1度B2B3B2(B)B3B2B4B1B4B3方法(A)A3A2A1浓B3B1B3度B2B4B1(B)B1B3B2B4B2B4主区副区3个重复植物培养实验数据/g区组ⅠⅡⅢ提取方法1231231231434742414444444845浓度248543945494350534735051465355455452524495549545353535758第六节:裂区设计需要考虑的问题主处理分设在主区,副处理分设于主区内的副区,副区之间比主区之间的试验空间更为接近。在进行统计分析时,可分别估算主区与副区的试验误差,而副区的试验误差小于前者,即副区的比较比主区的比较更为精确。第六节:裂区设计在一个因素的各处理比另一个因素的各处理需要更大区域时。需要较大区域的因素作为主处理,设在主区需要较小区域的因素作为副处理,设在副区应用试验中某一因素的主效比另一因素的主效更为重要,而且要求的精度较高。将要求精度较高的因素作为副处理,另一因素作为主处理。第六节:裂区设计应用根据以往的研究,知道某些因素的效应比另一些因素的效应更大时也适于采用裂区设计。将可能表现较大差异的因素作为主处理。第六节:裂区设计应用试验设计需要临时改动再加入一个试验因素。可在原设计中的小区(主区)中再划分小区(副区),增加一个试验因素,就成了裂区设计。第六节:裂区设计应用对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。在实际工作中,常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模很大,往往因试验条件的限制而难以实施。3因素3水平33=274因素4水平44=256第七节正交设计正交设计就是安排多因素试验、寻求主要因素和最优水平组合的一种高效率试验设计方法。一、正交设计的概念及原理(一)正交设计的基本概念正交设计是利用正交表来安排与分析多因素试验的一种设计方法。它利用从试验的全部水平组合中