95生物统计学教案第十二章实验设计教学时间:2学时教学方法:课堂板书讲授教学目的:试验设计的原理、意义、原则;常用试验设计方法。讲授难点:正交实验设计、随机化完全区组设计12.1实验设计的基本原则实验设计的两个基本原则是重复(replication)和随机化(randomization)、局部控制。12.1.1重复所谓重复就是将一基本实验重做一次或几次。例如,测定不同年龄组正常人血红蛋白含量实验,在每—年龄组内测一人,即为一基本实验。若将这一基本实验验重做5次,即每一年龄组,抽取5人测血红蛋白含量.则称该实验有5次重复。我们这里所讲的重复,是指将“基本实验”重做一次或几次,而不是指一次基本实验的结果重复测量多次。例如,我们想分析大豆籽粒中VD的含量。这一基本实验包括以下过程:随机选取若干大豆,磨成豆粉,取一定数量的豆粉,乙醇回流抽提脂肪,提取液皂化,萃取,层析分离、纯化,在265nm下测吸光度,最后计算出VD的含量。重复实验必须是上述过程的完整重复。设置重复的意义:①只有设置重复才能得到实验误差的估计。标准差是通过重复得到的,有了标准差才能得到标准误差。②只有设置重复才能推断出处理效应。如两种药物实验,A药物一人10天痊愈,B药物12天痊愈,并不能说明A比B就好。12.1.2随机化随机化是指实验材料的配置和实验处理的顺序都是随机确定的。假设药效受年龄的影响,服用A药的年青,服用B药的年长,这时药效与年龄96的效应混杂,即使两种药物不同,也不能判断是否是药物的差异。12.1.3局部控制——试验条件的局部一致性(增加)局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素对试验结果的影响。在试验中,当试验环境或试验单位差异较大时,仅根据重复和随机化两原则进行设计不能将试验环境或试验单位差异所引起的变异从试验误差中分离出来,因而试验误差大,试验的精确性与检验的灵敏度低。为解决这一问题,在试验环境或试验单位差异大的情况下,根据局部控制的原则,可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非处理因素尽量一致。每个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差中分离出来,所以局部控制原则能较好地降低试验误差。以上所述重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher)三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。试验设计三原则的关系和作用见图12-1所示。图12-1试验设计三原则的关系12.2实验计划书的编制(自习)重复三原则随机化局部控制无偏估计误差降低误差估计误差作用统计推断提高精确性9712.2.1实验计划书的格式一般来说,一个实验计划书应包括以下几部分:(1)封面:写明实验名称,计划书编制者或编制小组名称以及设计时间等(2)国内外研究动态。(3)实验目的。(4)预期结果。(5)实验设计的选择。(6)实验方法的确定。(7)田间规划。(8)实验记录表。12.2.2国内外研究动态。12.2.3实验目的。12.2.4预期结果。12.2.5实验设计的选择。因素和水平的选择;响应变量(实验所观察的指标)的选择;实验设计的选择。12.2.6实验方法的确定。(1)实验材料的来源。列出实验材料的用量和备用量,对实验材料的要求。(2)实验仪器和设备。种类、数量、规格、型号(3)试剂。所需试剂的种类、数量、生产厂家、等级。试剂的配制方案。(4)实验流程。参考文献资料或本实验室的前期工作,写出每一实验的流程。(5)经费核算。核算开支,若经费不足,重新调整方案,以便实验顺利完成。12.2.7田间规划。对于田间试验,除前而讲过的一些要点以外,还有以下一些应注意的问题。(1)试验地的选择:应当选择地力均匀、地势平坦的地块作为试验地。应有方便的排灌条件,周围没有大树遮阴,远离人口聚集区,防止实验遭人为破坏。(2)土壤肥力勘测:如果没有地力情况的记录,试验开始前,还需对地力进行勘测。最好采用生物勘测法。方法是,把全部试验地分成若干小区,均匀地播种纯98度很高的某一作物,待作物长出后,按小区记录作物生长情况,结合收获后的考种记录,标记上土壤肥力分布情况。(3)隔离区的设置:如果在试验地的周围还种有和试验材料相同的作物,特别是当研究材料为异花授粉和常异花授粉作物时,一定要设置隔离带,以防止生物混杂。(4)保护行的设置:在试验地的周围至少应种植3—5行其他作物,把全部试验地围起来,保护试验材料不致受到外来因素的破坏。(5)水源:根据试验的要求,可采用地表漫灌、喷灌、滴灌等灌溉方式,不论采取哪种灌溉方式,都应配套相应的设施。(6)小区规划:根据种植作物的不同和试验的要求,确定小区面积并划分小区,在适当的地方应留出通道,以便于进行田问调查。小区多规划为矩形,走向应视试验地的条件而定,以东西或南北走向为佳。(7)小区编号:根据试验设计的方式,是随机区组设计还是裂区设计亦或对比设计等,来决定小区的编号。编号完成后,应在每个小区的一端钉上有标号的木牌或塑料牌作为标记。(8)田间规划图:在以上工作都完成后,应绘制一份详细的田间规划图,标明试验地坐落位置,小区的划分,小区编号,以防田间小区标记丢失后,造成试验混乱。(9)播种计划:在试验规模比较大.小区比较多时,播种前一定要周密计划。按小区编号分装种子,在种子袋上标上小区号,播种时对号入座。一旦发现错误,应及时纠正,实在无法纠正时,一定要做详细记录。12.2.8实验记录表。(1)实验室日志(2)仪器使用登记表(3)借物登记表物品名称、借用日期、归还日期、借用人等。(4)实验原始记录(5)田间记录9912.3简单实验设计12.3.1成组比较实验设计将实验材料随机分成两组,每组各接受一种处理,通过分析处理效应之差异是否由随机误差造成的,来判断是不是存在效应。例1:动物药物实验,动物分两组,一组A药物,一组B药物,实验只有药物一个因素,类似这样的因素为类别因素。例2:动物分两组,一组每天补加10mg复合维生素,一组每天补加20mg复合维生素,实验只有维生素一个因素,水平是用数量表示的,这类因素为数量因素。成组比较实验设计应注意的几个问题:(1)一定要用随机化方法划分两组实验材料。抽签、随机数字、计算机随机数字分组(2)在成组比较实验中,往往一组设计为实验组,一组为处理组。N1=n2时,21xxs最小,这时最容易检出显著性。(3)样本含量。样本含量即重复次数。有重复才能够得到标准差s,进而得到标准误差xs,样本含量越大,标准误差xs越小。(4)对照的设置。原则是除去所要比较的因素之外其他各方面的因素都应与处理一致。(5)实验误差。来源于各个观测值之间的变差。一是实验材料本身内在变差;二是实验重复之间所处的环境条件及实验操作的不均一性等原因造成的变差。12.3.2成组比较实验设计所需的样本含量最简单的一种情况:σi已知且相等(σ1=σ2=σ)及n1=n2=n。在这种情况下,以α和β的风险,分辨出零假设μl-μ2=μ和备择假设μl-μ2=Δμ,问需多大的样本?22KKnΣi未知,可用si代替,并假设s1=s2=s及n1=n2=n。单侧检验10022sKKn双侧检验:22/2sKKn12.3.3配对比较实验设计在成组比较实验设计中,动物个体间内在变差,或者说,由于遗传素质的差异所引起的变差很难消除,在这种情况下,可以采用配对比较法设计实验。动物,为了比较两种不同的处理效应,选出n窝动物,每窝抽出两只条件一致的个体(如相同体重、相同性别等),分别接受不同的处理,从而构成样本含量为n的配对比较实验。使用范围很广。医学中,检测受试者在接受处理前后某些生理指标的差异(自身对照设计);植物同一植株的不同部位做不同的处理,两片叶子、两个枝条、两个分蘖等。在设计配对实验时,配对的双方一定要有内在的联系,否则不能配成对子。如从社会角度,一对夫妻是配成的一对,但从生物学角度看,他们是姻亲,不是血亲,没有任何血缘关系,因此不能配对。12.3.4配对设计与成组设计检验效率的比较一般来说,配对设计比成组设计更容易检验出两组数据平均数之间的差异。由5.1.4可知,在平均数和样本含量均相同的情况下,t值越大,拒绝H0的可能性越大。影响t值的因素,除两个平均数之差以外,另一个重要因素是s,s越小则t越大。在做配对比较实验时,如果两组数据平均数之间存在显著差异,这两数据之间一般存在正相关,这时配对设计的方差要小于成组设计。用配对设计可排除数据之间可能存在的相关,提高检验效率。12.4单因素实验设计12.4.1完全随机化设计完全随机化设计实际上是成组比较实验设计的扩展。在成组比较实验中,实验因素只有两个水平,若水平增加到3个或3个以上,则成组比较实验设计即变为完101全随机化设计。完全随机化的含义是,作为实验用的个体(或田间试验用的小区)被分配到处理的哪一个水平完全是用随机化方法确定的。这就要求实验个体(或试验小区)必须具备同质性。实验个体(试验小区)间虽不能做到完全同质,但个体间的变差也应控制到最小。完全随机化设计是单因素的多个水平之间的比较。例如,研究服用4种不同化疗药物对动物白细胞含量的影响。该实验只有“化疗药物”1个因素,该因素的4种药物是实验的4个水平,4个水平也可以称为4个处理。实验可以如下设计:从具有同质性(如,同性别、同年龄、同体重、白细胞含量相同、身体健康等)的实验动物群体中,随机抽取20只(或其他数量)动物,用随机化的方法、将它们均等地分配到4个处理中。随机化分配的方法很多,在这里重点介绍如何用随机数字表进行随机分配。首先将抽到的20只动物编号,从0l编到20,如下表的第一行。从随机数字表的任何一点开始,两位两位数字读下去,将读到的结果填到表的第二行。因为实验要求分为4组,则用4除各随机数字、并将余数填到表的第三行。与余数为1的随机数字相应的动物分到第一组,与余数为2的随机数字相应的动物分到第二组,…,与余数为0的随机数字相应的动物分到第四组。分配的结果为:102第一组和第四组每组只有4只,而第二组和第四组每组都有6只,所以需要调整。调整的力法是,接着上面的最后一个随机数字继续读下去,最先出现的是42,42除以4,余数为2,先从第二组调剂。如果余数是1或0,则继续读下去,直到余数最先出现2或3时为止。42再除以6(因为第二组有6个数),余数为0,则把与第二组的第6个随机数字54所相应的19号动物调出。把调出的19号动物放在哪—组呢?继续读随机数字,出现的是09,被4除,余数为l,于是将第19号动物放在第一组,如果余数是2或3,则继续读随机数字,直到余数最先出现1或0时为止。用类似的方法调剂第三组,继续读下去的随机数字是43,被6陈,余数是1,于是将与第二组的第1个随机数字91所相应的02号动物调剂到第四组。到此,随机分组的过程全部完成,分配的最终结果如下表。下一步决定药物的分配。将4种药物编上号,并从随机数字表中连续读出4个两位数,根据随机数字从小到大的顺序,对应出相应的组别。完全随机化设计设计特点:完全随机设计应用了试验设计的重复和随机两个原则,其优点是设计容易,处理数与重复次数都不受限制,统计分析也比较简单。完全随机设计的主要缺点是没有应用局部控制的原则,试验环境条件差异较大时试验误差较大,试验的精确度较低。103完全随机设计常用于土壤肥力均匀一致的田间试验和在实验室、温室、网室中进行的试验。成组比较实验设计、配对比较实验设计和完全随机化设计的统计分析方法,已分别在5.2.3、5.2.5和第八章单因素方差分析中讲过,这里不再重复。12.4.2随机化完全区组设计这种设计的特点是根据“局部控制”的原则,将试验地按肥力程度或将动物按窝划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。这是随机排列设计中最常用而最基本的设计。(