正交试验设计与数据处理在食品科学技术研究中的应用正交试验是利用正交表安排多因素实验、分析实验结果的一种设计方法。他从多因素的全部水平组合中挑选部分有代表性的水平组合进行试验,通过对这部分对这部分实验结果的分析了解全面实验的情况,找出因素最佳水平组合。数据处理是对数据的采集、存储、检索、加工、变换和传输。数据的形式可以是数字、文字、图形或声音等。数据经过解释并赋予一定的意义之后,便成为信息。本文介绍了正交试验设计的方法并举例说明了该方法在食品科学技术研究中的应用。影响食品性质的因素有很多,很有必要利用正交设计方法对其各种因素影响的关键程度和每个因素的最优水平进行科学的分析和确定。实验设计指科学研究的一般程序的知识,它包括从问题的提出、假说的形成、变量的选择等等一直到结果的分析、论文的写作一系列内容。它给研究者展示如何进行科学研究的概貌,试图解决研究的全过程。研究者在实验前根据研究目的拟定的实验计划及方法策略。其主要内容是合理安排实验程序,并提出将如何对实验数据作统计分析、心理实验设计的主要步骤可归纳为:①根据研究目的提出假设;②拟定验证假设的方法、程序;③选择适当的处理、分析实验数据的统计方法。日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按L9(3)正交表安排实验,只需作9次,按L18(3)正交表进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。正交表是一整套规则的设计表格,L为正交表用的代号,n为试验的次数,t为水平数,c为列数,也就是可能安排最多的因素个数。例如L9(34),它表示需作9次实验,最多可观察4个因素,每个因素均为3水平。一个正交表中也可以各列的水平数不相等,我们称它为混合型正交表。正交试验设计的安排正交试验设计的关键在与试验因素的安排。通常,在不考虑交互作用的情况下,可以自由的将各个因素安排在正交表的各列,只要不在同一列安排两个因素即可(否则会出现混杂)。但是当要考虑交互作用时,就会受到一定的限制,如果任意安排,将会导致交互效应与其它效应混杂的情况。因素所在列是随意的,但是一旦安排完成,试验方案即确定,之后的试验以及后续分析将根据这以安排进行,不能再改变。正交试验设计的极差分析用极差法分析正交试验结果应引出以下几个结论:①在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队,就是各列极差D的数值从大到小的排队。②试验指标随各因素的变化趋势。③使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。④对所得结论和进一步研究方向的讨论。较优条件选择各因素的好水平加在一起,是否就是较优试验条件呢?理论上,如果各因素都不受其它因素的水平变动影响的,那么,把各因素的优水平简单地组合起来就是较好试验条件。但是,实际上选取较好生产条件时,还要考虑因素的主次,以便在同样满足指标要求的情况下,对于一些比较次要的因素按照优质、高产、低消耗的原则选取水平,得到更结合试验实际要求的较好生产条件。实践中发现,有时不仅因素的水平变化对指标有影响,而且,有些因素间各水平的联合指配对指标也产生影响,这种联合搭配作用称为交互作用。而交互作用应该在试验设计时考虑到。正交试验分析方法一、直接对比法就是对试验结果进行简单的直接对比。直接对比法虽然对试验结果给出了一定的说明,但是这个说明是定性的,而且不能肯定地告诉我们最佳的成分组合。显然这种分析方法虽然简单,但是不能令人满意。二、直观分析法是通过对每一因素的平均极差来分析问题。所谓极差就是平均效果中最大值和最小值的差。有了极差,就可以找到影响指标的主要因素,并可以帮助我们找到最佳因素水平组合。正交试验设计的过程:1、确定试验因素及水平数;2、选用合适的正交表;3、列出试验方案及试验结果;4、对正交试验设计结果进行分析,包括极差分析和方差分析;5、确定最优或较优因素水平组合。例:加减炙甘草片的提取工艺研究通过正交设计,以干浸膏量及甘草酸与五味子乙素含量为指标,对其提取工艺进行研究。1因素水平的确定以乙醇浓度、溶剂用量、提取时间、提取次数为考察因素,每个因素取个水平(见表1)表1因素水平数因素ABC水平乙醇浓度(%)溶剂用量(倍)提取次数(次)提取时间(h)701213601022,150831,1,12试验安排及结果取处方量药材100g按表2各因素以L9(34)正交试验表安排试验,浸提液浓缩至50g,分别取样,计算干浸膏量,并采用HPLC法测定各样品中甘草酸与五味子乙素的含量,折算为每100g处方生药中甘草酸与五味子乙素的含量。综合评分标准:按主次指标,规定甘草酸得率满分35分,试验所用药材甘草酸含量为0.45mg/g,故以0.45mg/g为满分,实验得分为(所测甘草酸含量/0.45)×35。五味子乙素得率满分35分,试验所用药材五味子乙素含量为0.095mg/g,故以0.095mg/g为满分,实验得分为(所测五味子乙素含量/0.095)×35。出膏率满分30分,根据预测试验出膏率的变动范围为20~30g,规定30g为0分,20g为30分,每增加1g减去3分,即得分为(-3×所测含量+90)。三项指标合计得分为Yi,总分100分。以综合评分的平均值为基准,各评分与平均值的差值作为调整后的得分Yi′。正交试验结果见表2。表2L9(34)正交实验安排及结果(n=3)直观分析法:(1)选正交表本例是一个3因素3水平的试验,并且不考虑因素间的交互作用,故选用正交表L9(34)来安排试验。实验号AB空列C干浸膏量(g)甘草酸含量(mg/g)五味子乙素含量(mg/g)综合评分YiYiˊ=Yi-781111120.60.310.07479.571.572122222.10.380.07881.993.993133328.20.430.09072.00-6.004212322.30.320.07374.88-3.125223125.60.350.08772.47-5.536231220.40.310.07580.542.547313220.60.340.08786.708.708321321.20.320.07478.550.559332122.20.310.07876.25-1.75(2)表头设计本例不考虑因素间的交互作用,只需将各因素分别安排在正交L9(34)上方与列号对应的位置上,一般一个因素占有一列,不同因素占有不同的列,可以得到表头设计如下。表头设计因素ABC空列列号1234(3)明确实验方案实验号AB空列C111112122231333421235223162312731328321393321(4)按规定方案做试验,得出试验结果①K值计算。这里引用一个条件求和函数SUMIF,它的作用是对满足条件的单元格求和,其语法为:SUMIF(range,criteria,sum-range)。K值表示的是同一水平下对应试验结果之和,以乙醇的浓度A因素列所对应的K2计算为例K2的计算公式为:=SUMIF(C3:C11,1,K3:K11)(如图)②极差R的计算。在C31单元格中输入:=MAX(C12:C14)-MIN(C12:C14),回车得到13.60。然后选中该单元格,向右拖动填充柄,就可计算出后三列的极差。其他的极差R同理可计算出。③绘制趋势图。趋势图的纵坐标表示试验指标,横坐标则是因素水平,一般将不同因素的趋势图画在一张图中,便于比较。建立工作表,如下图。第一列表示因素的不同水平,第二列表示对应的K值。70-0.4360-6.1507.5127.1510-0.988-5.213-5.7215.231-8.56④选择折线图和图表数据区域,并且设置坐标轴格式⑤得到趋势图。删除图中多余的线条和文字。-10-50510152070605012108321乙醇浓度(%)稀释倍数(倍)提取次数(次)得分(5)综合平衡得出最优方案。在进行综合平衡时,我们依据几条原则:第一,对于某个因素,可能对某个指标是主要因素,但对另外指标可能是次要因素,确定该因素的优水平时,首先选取作为主要因素时的优水平;第二,若某因素对各指标的影响程度相差不大,这时可以采用“少数服从多数”的原则;第三,当因素各水平相差不大时,可依据降低消耗,提高效率的原则选取合适水平;第四,若各试验指标的重要程度不同,则在确定因素优水平时应首先满足相对重要的指标。综合平衡:优化方案为A3B1C2,即乙醇浓度为50%,稀释倍数为12倍,提取次数为2次,提取时间为2h、1h,为最优方案(6)试验验证。优方案是通过统计分析得出的,还需要进行验证试验,以保证优方案与实际一致,否则还需要进行新的正交试验。方差分析法:(1)选正交表本例是一个3因素3水平的试验,并且不考虑因素间的交互作用,故选用正交表L9(34)来安排试验。(2)表头设计本例不考虑因素间的交互作用,只需将各因素分别安排在正交L9(34)上方与列号对应的位置上,一般一个因素占有一列,不同因素占有不同的列,可以得到表头设计如下。表头设计因素ABC空列列号1234(4)明确实验方案实验号AB空列C111112122231333421235223162312731328321393321(3)按规定方案做试验,得出试验结果K值计算。这里引用一个条件求和函数SUMIF,它的作用是对满足条件的单元格求和,其语法为:SUMIF(range,criteria,sum-range)。K值表示的是同一水平下对应试验结果之和,以Mn的含量A因素列所对应的K2计算为例K2的计算公式为:=SUMIF(C3:C11,1,K3:K11)(如图)(4)计算平方和本例中,在单元格C18中,用SUM函数求出试验结果的总和T=SUM(C12:C14);在单元格C19中输入公式“=C18*C18/9”,求出P值。然后在单元格C16中输入“=SUMSQ(C12:C14)/2-C19”,求出SSA。如图。(5)计算自由度总自由度:dfT=试验总次数-1=n-1各因素自由度:dfJ=因素水平数-1=r-1(J=A,B,C)误差自由度:dfe=空列df(6)计算均方各因素的均方为MSJ=SSJ/dfJ误差的均方为MSe=SSe/dfe计算过程中,若发现某一因素的MSJMSe,这说明了这一因素对试验结果的影响较小,可以将它归入误差。如图。新误差离差平方和:SSe△=SSe+SSD新误差自由度:dfe△=dfe+dfD新误差均方:MSe△=SSe△/dfe△(7)计算F值FJ=MSA/MSe△(8)显著性检验根据F分布表可以查得临界值F0.01(df,dfe)和F0.05(df,dfe),如下图:F0.05(2,2)19F0.01(2,2)99比较F值与临界值的大小,得到显著性程度表(9)优方案确定列出F值与试验指标的对应表,进行结果讨论,根据优方案选择原则,得到最优方案。差异源SSdfMSF显著性A46.68987223.344933.1B39.53025219.765132.6C168.8209284.4104711.1误差e15.1719427.585971结论说明:A、B、C三个因素对于三个指标的影响均无显著性,但通过直观分析,可看出对于总体提取效率而言,影响因素依次为CAB,提取方法最佳组合为A3B1C2,即12倍量的50%乙醇,回流提取2次,提取时间分别为2h、1h。按照优化条件进行工艺验证试验,说明正交设计筛选出的工艺是合理的。(10)试验验证。优方案是通过统计分析得出的,还需要进行验证试验,以保证优方案与实际一致,否则还需要进行新的正交试验。SPSS处理正交试验(1)选正交表本例是一个3因素3水平的试验,并且不考虑因素间的交互作用,故选用正交表L9(34)来安排试验。(2)表头设计以及明确试验方案本例不考虑因素间的交互作用,只需将各因素分别安排在