FactorialdesignANOVA析因设计的方差分析第六讲:方差分析(三)2两因素析因设计资料的方差分析前面内容回顾1.完全随机设计的ANOVA2.随机区组设计的ANOVA所关心的问题:一个处理因素不同处理水平间的均数有无差异?在第2个设计中,设立单位组(区组)的目的是控制混杂因素。使混杂因素在各处理水平间达到均衡,提高检验效率。3析因设计(factorialdesign)ANOVA所关心的问题1.两个或两个以上处理因素的各处理水平间的均数有无差异?即主效应有无统计学意义?2.两个或两个以上处理因素之间有无交互作用?一、析因设计析因设计的实例例1:甲乙两药治疗高胆固醇血症的疗效(胆固醇降低值mg%),问①甲乙两药是否有降低胆固醇的作用?②两种药间有无交互作用甲药用不用用645678448042不用281631252318乙药完全随机的两因素2×2析因设计例2:白血病患儿的淋巴细胞转化率(%),问①不同缓解程度、不同化疗期淋转率是否相同?②两者间有无交互作用缓解程度化疗期化疗间隙完全缓解46514156364632455247635641345439未缓解39282653586633313551576437504545时期完全随机的两因素2×2析因设计例3:小鼠种别A、体重B和性别C对皮内移植SRS瘤细胞生长特征影响的结果(肿瘤体积cm3)问①A,B,C各自的主效应如何?②三者间有无交互作用?种别A体重(g)雄性雌性昆明种24~250.70690.18850.78540.34030.35810.250313~151.08380.95500.94250.92150.33350.8514泸白种24~250.06280.47120.09420.08800.04710.175913~150.01260.25130.00940.36760.01250.1327性别完全随机三因素2×2×2析因设计例4:研究小鼠在不同注射剂量和不同注射次数下药剂ACTH对尿总酸度的影响。问①A、B各自的主效应如何?②二者间有无交互作用?配伍组编号日注射量AB1(少)B2(多)1A133.633.0237.130.5334.133.3434.634.41A233.028.5229.531.8329.229.9430.728.31A331.430.7228.328.2328.928.4428.630.6注射次数B随机配伍的两因素3×2析因设计促肾上腺皮质激素9例5:两因素:疾病种类(A)与护士年龄(B)a=4(心脏病、肿瘤、脑血管意外、结核病)b=3(20~、30~、40~);n=5;Yijk为访视时间问:(1)护士年龄的主效应?(2)疾病病种的主效应?(3)护士年龄与疾病病种间是否存在交互作用?析因设计的特点2个或以上(处理)因素(factor)(分类变量)2个或以上水平(level)2个或以上重复(repeat)(样本数)每次试验涉及全部因素,即因素同时施加观察指标(观测值)为计量资料(独立、正态、等方差)11析因实验可分析多种交互作用;二个因素间的交互作用称为一级交互作用,三个因素间的交互作用称为二级交互作用,四个因素间则称为三级交互作用,乃至更高级的交互作用。如,观察三个因素的效应,其一级交互作用为:A×B,A×C与B×C,二级交互作用为A×B×C。当析因实验设计因素与水平过多时,使交互作用分析内容繁多,计算复杂,带来专业解释困难,一般多用简单的析因实验。析因设计--有关术语单独效应(simpleeffects):其它因素(factor)的水平(level)固定为某一值时,某一因素的效应主效应(maineffects):某因素各单独效应的平均效应交互作用(Interaction):某一因素效应随着另一因素变化而变化的情况。(如一级交互作用AB、二级交互作用ABC…13析因设计的优点可同时观察多个因素的效应,提高了实验效率;能够分析因素间的交互作用;允许一个因素在其他各因素的几个水平上来估计其效应,所得结论在实验条件的范围内是有效的析因设计的缺点当研究因素较多,且每个因素的水平数也较多时,析因设计要求的试验可能太多,以至到了无法承受的地步。如2因素,各3水平5次重复需要试验为45次;如有6个因素,每个因素都有3个水平,析因设计至少需要做36=729次试验,如果每个因素的水平数增加到5个,则析因设计至少需要做56=15625次试验,这是不能接受的15析因实验设计的其他特点要求实验时全部因素同时施加,即每次做实验都涉及到每个因素一个特定水平(若实验因素施加有先后顺序之分,称为分割或裂区设计);因素对定量观测结果的影响是平等的,即在专业上没有充分证据认为哪些因素对定量观测结果影响大、另一些影响小(若实验因素对观测结果影响在专业上能排出主、次顺序,称为系统分组或嵌套设计;可准确估计各因素及其各级交互作用效应大小(若某些交互作用的效应不能准确估计,就属于非正规的析因设计,如分式析因设计、正交设计、均匀设计等)二、析因设计的方差分析(一)两因素两水平(二)两因素三水平(三)三因素多水平(一)两因素两水平完全随机析因设计的方差分析18两因素析因设计的ANOVA两个处理因素:A、BA、B因素各有a、b个水平,共有a×b种组合每一组合下有n个受试对象全部实验受试对象总数为a×b×ni(i=1,2…,α)表示因素A的水平号,j(j=1,2,…,b)表示因素B的水平号,k(k=1,2,…,n)表示在每一组合下的受试对象号符号例6:研究不同缝合方法及缝合后时间对家兔轴突通过率(%)的影响,问①两种缝合方法间有无差别?缝合后时间长短间有无差别?②两者间有无交互作用完全随机的两因素2×2析因设计单独效应B的效应A的效应主效应A因素主效应解释为:束膜缝合与外膜缝合相比(不考虑缝合时间),神经轴突通过率提高了6%。B因素主效应解释为:缝合后2月与1月相比(不考虑缝合方法),神经轴突通过率提高了22%。B的效应A的效应交互作用22122111()()2(84)22ABabababab两条直线相互平行,表示两因素交互作用很小ANOVA分析的必要性A因素(缝合方法)的主效应为6%,B因素(缝合时间)的主效应为22%,AB的交互作用表示为2%。以上是样本均数比较结果,要推论总体均数是否有同样的特征,需要对试验结果进行方差分析后,才能下结论。a1b1a1b2a2b1a2b2合计均数24442852148例数555520∑X120220140260740∑X244001120048001440034800完全随机的方差分析变异来源SSdfMSFP-value总742019组间26203873.3332.911110.06657组内480016300误差处理组处理组间变异的分解26BA处理B2121i处理--)+A(A)+A(A=)B(B=)(=)x-x(=SSSSSSanaBBBBSSCnaBnaSSCnaAnaAASSCnXnSSABAAiABBiBAi212212221222122][)(2)(2)(TSS处理的析因分解Ti、Ai、Bi的计算T1T2T3T4B1B2A2A1析因分析结果均方假设:(二)两因素多水平完全随机析因设计的方差分析例7:观察A、B两药联合应用时的镇痛时间(min)完全随机的两因素3×3析因设计完全随机两因素析因设计方差分析表离均差平方和均方A、B两药联合运用的镇痛时间方差分析结果表均方离均差平方和34BiAi1总变异:2处理因素A的变异:3处理因素B的变异:4A与B交互作用的变异:5误差变异:变异分解(1)(1)(1)(1)1SSSSSSSSSSababNABAB总误差ABAB总误差误差222111111111abnabnabnijkijkijkijkijkijkSSYYabnYC总21111banijkjikSSYCanB21111abnijkijkSSYCbnAABABSSSSSSSSSS总误差21111abnijkABijkSSYCSSSSnABTi35表3护士进行家庭访视所花费的时间/分钟因素B:护士年龄组:岁)(j按A水平合计因素A:病种)(i1(20~)2(30~)3(40~)jkijkiTTjkijkiYS22025242530282229242728252130301.心脏病115142131388101903030394529423031363530423630402.肿瘤176150199525187933132413035454030403540403030353脑血管意外166167201534193662023242125252028302030261931234.结核病1001371283659107按B水平合计in20202060ikijkjYT5575966591812ikijkjYS216613180002284357456例5361.整理数据:求出处理因素A,B及其交互项AB观察值之和,一个因素观察值平方和、总和、总平方和等。2.提出检验假设。(1)处理因素A的假设:0:H不同病种对护士家庭访视时间无影响;1:...H有影响(2)处理因素B的假设:0:H不同年龄护士访视时间相同;1:...H不全同(3)处理因素间交互作用的假设:0:0ijH无交互作用;1:0ijH有交互作用α=0.01两因素析因分析的方差分析步骤373.计算离均差平方和及自由度6.2733601812574562总SS;59160总2222211812[388525534+365]1580.93(35)60ASS;314A90.26460(1812)](659)(596)[(557)5)(412222BSS;213B22221580.9180211153264.90356.97(41142128560)(31)6ABABSS-80.53097.35690.26493.15806.2733误差SS,5932648误差38表4护士家庭访视时间的方差分析表变异来源离均差平方和自由度均方FP因素A:病种1580.933526.9847.652.0E-14因素B:年龄264.902132.4511.986.0E-05A*B:病种*年龄356.97659.495.382.6E-04误差530.804811.04总计2733.6059395.确定P值并作出统计推断查附表5:08.548,201.0F、22.448,301.0F、20.348,601.0F计算所得F值均大于临界F值,所以P均小于0.01。(1)拒绝HO,接受1H,即至少有一个病种的访视时间长度与其他病种的访视时间长度不同。(2)拒绝HO,接受1H,即至少有一个年龄组的访视时间长度与其他年龄组不同。(3)拒绝HO,接受1H,即至少有一种ij组合水平的访视时间长度与其他组合不同。专业结论:年龄较大护士访视时间长。对肿瘤和脑血管意外病人的访视时间长。40三、交互作用交互作用(Interaction):某一因素不同水平均数随着另一因素不同水平的均数改变而改变。表5因素A与B各组合水平上平均访视时间(分)因素B水平j(护士年龄组/岁)Yj因素A水平i(病种)1(20~)2(30~)3(40~)心脏病23.028.426.225.90肿瘤35.230.039.835.00脑血管意外33.233.440.235.60结核病20.027.425.624.33Yj27.929.833.030.2041三、交互作用图图9-1因素A与B