第四章多个样本均数比较的方差分析试验设计不同,方差分析的形式也有差异本学期要学习完全随机设计,随机区组设计,拉丁方设计,两阶段交叉设计,析因设计,正交设计,嵌套设计,裂区设计基本思想是一样的:线性模型,对总变异进行分解,对自由度进行分解。安慰剂组2.4g组4.8g组7.2g组Xij┇┇┇┇┇┇┇┇SStotal=SSbetween+SSwithin第一节方差分析的基本思想(复习)P57,120obs应变量自变量:处理因素为降血脂新药,4水平方差分析的模型思想:i=1,2,…,g;j=1,2,…,niμ是所有处理的总均值αi为因素在第i个水平对应变量的附加效应,并假设所有αi之和为0ξij是随机误差,N(0,σ2)假设检验实际上就是检验各个αi是否均为0若是,则Xij~N(μ,σ2)ijiijX)()(......iijiijXXXXXX用..X估计,0iSS总=SS处理+SS误差ijiijX)()(......iijiijXXXXXX-第二节完全随机设计的方差分析例4.2120名高血脂患者随机分为4组。随机化分组方法:P57编号1234567…120随机数260873373204056930160…634序号241063915311413…75分组结果甲丁乙甲甲丁甲…丙甲1~30乙31~60丙61~90丁91~120120名高血脂患者同质性要好!随机化程序procplanseed=621105;factorsunit=120;outputout=a;run;datab;seta;if_n_31thengroup=1;elseif30_n_61thengroup=2;elseif60_n_91thengroup=3;elsegroup=4;procprintdata=b;run;分层分段随机化更好Obsunitgroup122121151310614971。。。。。。2869129561301101313123211923328222115106971176165144100105776486478473947411637………….SPSStransform→randomnumbergenerators•seeds:fixedvalue324516(数值范围0-200000)transform→Computer→randomnumbers→Rv.uniform注:每次产生随机数前均要设置种子数,这样产生的随机数可重现;对所产生的随机数进行排序,然后分段入组,即可获得样本含量相等的分组。演示:21例分成3组表4-4完全随机设计资料的方差分析222)()()(......iijiijXXXXXX变异来源自由度SSMSF总变异N-1cxginjiji112组间g-1cnxgiinjiji121SS组间/υ组间MS组间/MS组内组内N-gSS总-SS组间SS组内/υ组内每一组内的和SS总=SS组间+SS组内SPSS数据录入类型:安慰剂组2.4g组4.8g组7.2g组┇┇┇┇┇┇┇┇Ex4_2.savONEWAYldl_cBYgroup/STATISTICSDESCRIPTIVESHOMOGENEITY/MISSINGANALYSIS.描述单因子αi试验的数据结构固定效应模型fixedeffectmodel:g个水平是精心设计或精心选择,结论仅适用于所考虑的水平,不能推广。随机效应模型randomeffectmodel:g个水平是从众多水平中随机选出的,结论适用于全体多因子试验可能产生混合效应模型mixedeffectmodel:固定效应与随机效应例4-2的分析Descriptivesldl_c303.4303.71512.130563.16333.69741.374.59302.7153.63816.116512.47702.95361.564.32302.6980.49717.090772.51242.88361.683.68301.9663.74644.136281.68762.2451.893.711202.7025.83073.075832.55232.8527.894.59placebo2.4g4.8g7.2gTotalNMeanStd.DeviationStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalforMeanMinimumMaximumTestofHomogeneityofVariancesX1.6223116.188LeveneStatisticdf1df2Sig.ANOVAX32.156310.71924.884.00049.967116.43182.123119BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.表4-5例4-2的方差分析表变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.930.01组内11649.940.43优点:设计灵活,样本获取方便缺点:只能分析单因素,个体同质性要好。第三节随机区组设计的方差分析randomizedblockdesign区组A药B药C药10.820.650.5120.730.540.2330.430.340.2840.410.210.3150.680.430.24区组(block)化是提高试验精确度的一种方法,要求区组内变异性小,区组间变异性大。因为区组化设计要损失自由度(配对与成组例)例4-315只染有肉瘤的小白鼠按体重大小配成5个区组,接受三种抗癌药物治疗资料类型:区组号甲乙丙12345┇┇┇┇┇┇统计分析:SS总=SS处理+SS区组+SS误差区组处理ijjiijXi=1,2,…,g;j=1,2,…,n1、随机化分组方法区号12345小白鼠编号123456789101112131415随机数683526009953936128527005483456序号321132321231213分配结果丙乙甲甲丙乙丙乙甲乙丙甲乙甲丙随机化程序procplanseed=621105;factorsreplicate=5orderedtreat=3;treatmentsunit=3of15cyclic(123)3;run;replicate-treat---unit--11321232312456312378943121011125231131415表4-9不同药物作用后小白鼠肉瘤重量(g)区组A药B药C药合计giijx112345合计njijx1i=1,2,…,gj=1,2,…,n区组A药B药C药合计giijx112345合计njijx12计算公式变异来源自由度SSMSF总变异N-1cxginjij112处理间g-1cxnginjij2111SS处理/υ处理MS处理/MS误差区组间n-1cxgnjgiij2111SS区组/υ区组MS区组/MS误差误差N-g-n+1SS总-SS处理-SS区组SS误差/υ误差例4-4SAS程序P78datap58;dodrug=1to3;doblock=1to5;inputx@@;output;end;end;cards;0.820.730.430.410.680.650.540.340.210.430.510.230.280.310.24;run;procanova;classdrugblock;modelx=drugblock;run;例4-4p78TheANOVAProcedureDependentVariable:xSumofSourceDFSquaresMeanSquareFValuePrFModel60.456360000.076060007.960.0050Error80.076400000.00955000CorrectedTotal140.53276000R-SquareCoeffVarRootMSExMean0.85659621.525130.0977240.454000SourceDFAnovaSSMeanSquareFValuePrFdrug20.228000000.1140000011.940.0040block40.228360000.057090005.980.0158SPSS数据格式例04_04.savTestsofBetween-SubjectsEffectsDependentVariable:重量.456a6.0767.964.0053.09213.092323.742.000.2282.11411.937.004.2284.0575.978.016.0768.0103.62515.53314SourceCorrectedModelInterceptdrugblockErrorTotalCorrectedTotalTypeIIISumofSquaresdfMeanSquareFSig.RSquared=.857(AdjustedRSquared=.749)a.Drug,block均为固定效应TestsofBetween-SubjectsEffectsDependentVariable:重量3.09213.09254.156.002.2284.057a.2282.11411.937.004.0768.010b.2284.0575.978.016.0768.010bSourceHypothesisErrorInterceptHypothesisErrordrugHypothesisErrorblockTypeIIISumofSquaresdfMeanSquareFSig.MS(block)a.MS(Error)b.下面是block为随机效应的输出形式,F值不变区组因素是对试验结果有影响的非处理因素每个区组的例数等于处理的水平数区组间试验对象差异较大均衡设计不能分析交互作用(没有重复)多重比较:对显著的固定效应可用多重比较实际应用(Assumption)单因素方差分析,都要考虑:独立的随机样本正态性检验:样本含量小难于检验,凭借经验;样本大,中心极限定理又保证了抽样的正态性方差齐性检验:样本量差不多,稳健的。配伍设计、交叉设计、正交设计分析时一般不考虑上述正态性与方差齐性检验,如要分析,要进行残差分析(线性模型角度)图示法数学计算法描述性方法茎叶图,箱式图偏度直方图峰度基于理论的方法P-P图Shapiro-Wilk,Shapiro-Francia检验Q-Q图Kolmogorov-Smirnov检验(Lillefors检验)Anderson-Darling/Cramer-vonMises检验Jarque-Beratest,偏度峰度检验Pearson卡方检验正态分布的特征:对称性,正态峰平均身高(cm)172.50171.50170.50169.50168.50167.50166.50165.50164.50163.50样本数3020100检验方法:图示法和计算法1图示法:P-P图和Q-Q图NormalP-PPlotofXObservedCumProb1.00.75.50.250.00ExpectedCumProb1.00.75.50.250.00NormalQ-QPlotofXObservedValue174172170168166164162ExpectedNormalValue174172170168166164162箱式图minP25P50P75max1.5Q茎叶图xStem-and-LeafPlotFrequencyStem&Leaf1.00163.23.00164.12813.00165.115566666779919.00166.111223344455666789923.00167.11224444556666777778899