9实验设计基础实验设计(DOE)DesignofExperiment为什么要进行试验设计?==让我们先看个例子例:这里有27个球,其中有且只有一个球质量为9克,其它26个都为10克。给你一架天平,请找出重为9克的那个球。请问,你至少要称几次?实验设计的意义:应用数理统计学的基本知识,讨论如何合理地安排试验、取得数据,然后进行综合科学分析,从而尽快获得最优组合方案。在工程学领域是改进制造过程性能的非常重要的手段。在开发新工序中亦有着广泛的应用。在工序开发的早期应用实验设计方法能得出以下成果:1.提高产量;2.减少变异性,与额定值或目标值更为一致;3.减少开发时间;4.减少总成本;9.1:实验设计的意义及其发展过程试验设计在科学研究中的地位与意义:1.试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。2.科学地安排实验,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果。简称为:多、快、好、省。可应用于:提高试验效率、优化产品设计、改进工艺技术、强化质量管理。实验设计在生产/制造过程中的位置:生产/制造过程可控制因素不可控制因素统计技术在生产/制造过程中的应用是对过程中输入的变量(人,机,料,法,环)进行有目的地优化,使输出的结果更加理想.实验设计是其中较为有效的一种工程工具.通过实验进行优化设計通过实验,控制其不良的影响程度实验设计的发展过程:试验设计始于20世纪20年代,其发展过程大致可分为三个阶段:1.早期的方差分析法:20世纪20年代由英国生物统计学家、数学家费歇(R.A.Fisher)提出的,开始主要应用于农业、生物学、遗传学方面,取得了丰硕成果。二战期间,英、美采用这种方法在工业生产中取得显著效果;2.传统的正交试验设计法:以日本的田口玄一为代表;3.信噪比试验设计与三阶段设计:1957年,田口玄一提出信噪比设计法和产品的三阶段设计法。他把信噪比设计和正交表设计、方差分析相结合,开辟了更为重要、更为广泛的应用领域。我国试验设计方法60末期代,华罗庚教授在我国倡导与普及的“优选法”,如黄金分割法、分数法和斐波那契数列法等。数理统计学者在工业部门中普及“正交设计”法。70年代中期,优选法在全国各行各业取得明显成效。1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,显然优选法和正交设计都不能用,随后,方开泰教授(中国科学院应用数学研究所)和王元院士提出“均匀设计”法,这一方法在导弹设计中取得了成效。9.1.1试验设计的基本概念试验设计,广义理解是指试验研究课题设计,也就是整个试验计划的拟定。主要包括课题的名称、试验目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要求,试验结果的分析方法等。试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。试验设计的任务是在研究工作进行之前,根据研究项目的需要,应用数理统计原理,作出周密安排,力求用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料,通过分析得出正确的结论,明确回答研究项目所提出的问题。试验因素一些常用术语:指试验中人为控制的,影响试验指标的原因。例如,在研究小麦高产栽培技术时,品种、密度、施N量等都对产量有影响,均可作试验因素当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响,则称为两因素试验或多因素试验。试验因素常用大写字母A、B、C…等表示因素水平试验处理就是指实施在试验单位上的具体的项目。在单因素试验中,实施在试验单位上的具体项目就是该因素的某一水平。例如在进行小麦品种的比较试验时,实施在试验单位上的具体项目就是种植某一品种小麦。所以,单因素试验时,试验因素的一个水平就是一个处理。试验处理试验因素的不同水平称为因素水平。例如比较5个小麦品种产量的高低,这5个小麦品种就是品种这个试验因素的5个水平,可记为A1,A2,A3,A4,A5。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。亦称试验单元,是指施加试验处理的材料单位。田间试验时,试验单位通常指一个试验小区。试验单位在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3个小麦品种和4种播种密度的两因素试验,整个试验有3×4=12个水平组合,实施在试验单位上的具体项目就是某小麦品种与某播种密度的结合。干扰因素干扰因素不是研究的主要因素,但对试验的精确性有很大的影响。例如:在进行不同品种小麦的产量比较试验时,如果各试验小区的肥力相差很大,则试验单位的一致性变得很差,造成试验误差的增大,从而会掩盖品种这个试验因素的效应。因此,土壤肥力是试验的一个干扰因素。影响试验单位均匀一致性的对试验结果造成系统误差的因素。一、试验计划的内容及要求(一)课题名称与试验目的科研课题的选择是整个研究工作的第一步。课题选择正确,此项研究工作就有了很好的开端。选题时应注意以下几点:1、实用性要着眼于科研和生产中急需解决的问题,同时从发展的观点出发,适当照顾到长远或不久将来可能出现的问题。2、先进性在了解国内外该研究领域的进展、水平等基础上,选择前人未解决或未完全解决的问题,以求在理论、观点及方法等方面有所突破。3、创新性研究课题要有自己的新颖之处。4、可行性就是完成科研课题的可能性,无论是从主观条件方面,还是客观条件方面,都要能保证研究课题的顺利进行。(二)研究依据、内容及预期达到的经济技术指标(三)试验方案和试验设计方法试验方案是全部试验工作的核心部分,主要包括研究的因素、水平的确定等,具体内容详述于后。方案确定后,结合试验条件选择合适的试验设计方法。(四)试验的数量及要求试验选择正确与否,直接关系到试验结果的正确性。(五)试验记录的项目与要求(六)试验结果分析与效益估算二、试验方案的拟定(一)试验方案的基本概念试验方案(experimentalscheme)是指根据试验目的与要求而拟定的进行比较的一组试验处理的总称。试验方案按供试因素的多少可区分为单因素试验方案、多因素试验方案。1、单因素试验方案单因素试验(single-factorexperiment)是指整个试验中只比较一个试验因素的不同水平的试验。单因素试验方案由该试验因素的所有水平构成。这是最基本、最简单的试验方案。2、多因素试验方案多因素试验(multiple-factororfactorialexperiment)是指在同一试验中同时研究两个或两个以上试验因素的试验。多因素试验方案由该试验的所有试验因素的水平组合(即处理)构成。多因素试验方案分为完全方案和不完全方案两类。(1)完全方案在列出因素水平组合(即处理)时,要求每一个因素的每个水平都要碰见一次,这时,水平组合(即处理)数等于各个因素水平数的乘积。例如以3种催化剂配方对3个原料进行试验。两个因素分别为催化剂配方(A)、原料(B)。催化剂配方(A)分为A1、A2、A3水平,原料(B)分为B1、B2、B3水平。共有A1B1、A1B2、A1B3、A2B1、A2B2、A2B3、A3B1、A3B2、A3B3共3×3=9个水平组合(处理)。这9个水平组合(处理)就构成了这两个因素的试验方案,根据完全试验方案进行的试验称为全面试验。(2)不完全方案它是将试验因素的某些水平组合在一起形成少数几个水平组合。这种试验方案的目的在于探讨试验因素中某些水平组合的综合作用,而不在于考察试验因素对试验指标的影响和交互作用。这种在全部水平组合中挑选部分水平组合获得的方案称为不完全方案。根据不完全方案进行的试验称为部分试验。综合性试验(comprehensiveexperiment)、正交试验(orthogonalexperiment)都属于部分试验。(二)拟定试验方案的要点1、根据试验的目的、任务和条件挑选试验因素2、根据各试验因素的性质分清水平间差异(1)水平的数目要适当水平数目过多,不仅难以反映出各水平间的差异,而且加大了处理数;水平数太少又容易漏掉一些好的信息,至使结果分析不全面。(2)水平间的差异要合理有些因素在数量等级上只需少量的差异就反映出不同处理的效应。如饲料中微量元素的添加等。而有些则需较大的差异才能反应出不同处理效应来,如饲料用量等。(3)试验方案中各因素水平的排列要灵活掌握一般可采用等差法(即等间距法)、等比法和随机法3种。3、试验方案中必须设立作为比较标准的对照4、试验处理(包括对照)之间应遵循唯一差异原则5、有的试验要设置预试期9.1.2试验设计的基本原则一、试验误差的来源在科学研究中,试验处理常常受到各种非处理因素的影响,使试验处理的效应不能真实地反映出来,也就是说,试验所得到的观测值,不但有处理的真实效应,而且还包含其它因素的影响,这就出现了实测值与真值的差异,这种差异在数值上的表现称为试验误差。试验中误差的来源系统误差影响试验的准确性,随机误差影响试验的精确性。为了提高试验的准确性与精确性,即提高试验的正确性,必须避免系统误差,降低随机误差。二、试验设计的基本原则在试验中,误差主要是由于个体之间的差异不一致所造成。针对误差的主要来源,应采取切实有效的措施,如尽量选择初始条件一致的试验,尽量做到条件一致,认真细致进行观测记载等,力求避免系统误差,降低随机误差。在试验设计时必须遵循以下基本原则。(一)重复重复是指试验中同一处理实施在两个或两个以上的试验单位上(二)随机化(三)局部控制——试验条件的局部一致性重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher)三原则,是试验设计中必须遵循的原则,再采用相应的统计分析方法,就能够最大程度地降低并无偏估计试验误差,无偏估计处理的效应,从而对于各处理间的比较作出可靠的结论。(1)重复重复是指试验中将同一试验处理设置在两个或两个以上的试验单位上。同一试验处理所设置的试验单位数称为重复数。重复的作用主要有:(a)估计试验误差。如果同一处理只设置在一个试验单位上,那么只能得到一个观测值,则无从看出变异,因而也无法估计试验误差的大小。(b)降低试验误差,提高试验的精确性。即样本平均数抽样误差的大小与重复次数的平方根成反比。适当增大重复次数可以降低试验误差。nSSnSSxx=之间的关系为:样本容量和与样本观测值的标准差均数的标准误差抽样分布显示,样本平(2)随机化排列随机化排列是指试验的每一个处理都有同等机会设置在一个重复中的任何一个试验小区上。随机化的目的是为了获得对总体参数的无偏估计。随机排列的实现可以通过抽签法、利用随机数字表法。(3)局部控制当试验单位之间差异较大时,即存在某种系统干扰因素时,可以将全部试验单位按干扰因素的不同水平分成若干个小组,在小组内部使非实验处理因素尽可能一致,实现试验条件的局部一致性,这就是局部控制。局部控制通常通过设置区组来实现,相应的试验设计方法以随机区组设计为代表。局部控制的作用使干扰因素造成的误差从试验误差中分离出来,从而降低试验误差。试验设计三原则的关系9.2试验设计方法•单因素试验设计•两因素试验设计•多因素试验设计完全随机设计;单因素随机区组设计;拉丁方设计正交设计交叉分组设计;两因素随机区组设计;裂区设计常用的试验设计方法简介1单因素试验设计方法(一)完全随机设计•设计方法完全随机设计是将各处理完全随机地分配给不同的试验单位(如试验小区),每一处理的重复次数可以相等也可以不等。这种设计使得每一个试验单位都有同等机会接受任何一种处理。例如:欲研究某种生长调节剂对水稻株高的影响,进行6个处理的盆栽试验,每个处理4盆(重复4次),共24盆。设计时先将每盆水稻随机编号:1,2,3,…,24,然后用抽签法从所有编号中随机抽取4个编号作为实施第一处理的4盆,再从余下的20个编号中随机抽取4个作为实施第二处理的4盆,如此进行下去。于是可得各处理实施的盆号如下:第一处理:13,2,7,22第二处理:5,18,24