第四章多个样本均数比较的方差分析

liaojunqiu
1 ℃
2020-01-18

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

第四章多个样本均数比较的方差分析AnalysisofVariance,ANOVAContent•1.Basalidealandapplicationconditions•2.ANOVAofcompletelyrandomdesigneddata•3.ANOVAofrandomizedblockdesigneddata•4.ANOVAoflatinsquaredesigneddata•5.ANOVAofcross-overdesigneddata•6.Multiplecomparisonofsamplemeans•7.BartletttestandLevenetest第一节方差分析的基本思想及其应用条件目的：推断多个总体均数是否有差别。也可用于两个方法：方差分析，即多个样本均数比较的F检验。基本思想：根据资料设计的类型及研究目的，可将总变异分解为两个或多个部分，每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差，即可了解该因素对测定结果有无影响。应用条件：总体——正态且方差相等样本——独立、随机设计类型：完全随机设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析2221122(,),(,),,(,)ggNNN表4-1g个处理组的试验结果处理分组测量值统计量1水平X11X12…X1j…1nX1n11XS12水平X21X22…X2j…2nX2n22XS2…………………………g水平Xg1Xg2…Xgj…ggnXnggXSg完全随机设计资料的方差分析的基本思想合计NS:第i个处理组第j个观察结果XijXijX记总均数为，各处理组均数为，总例数为N＝nl+n2+…+ng，g为处理组数。11/ingijijXXN1/iniijijXXn1.总变异:全部测量值大小不同，这种变异称为总变异。总变异的大小可以用离均差平方和(sumofsquaresofdeviationsfrommean，SS)表示，即各测量值Xij与总均数差值的平方和，记为SS总。总变异SS总反映了所有测量值之间总的变异程度。计算公式为2212111,,iinnggijijijNijijijXCSSXXXC总2211,()()ingNijijijijXXCNN其中：1N总2．组间变异：各处理组由于接受处理的水平不同，各组的样本均数(i＝1，2，…，g)也大小不等，这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示，记为SS组间。21211()()inijjggiiiiiXSSnXXCn组间1g组间计算公式为3．组内变异：在同一处理组中，虽然每个受试对象接受的处理相同，但测量值仍各不相同，这种变异称为组内变异（误差）。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示，记为SS组内,表示随机误差的影响。Ng组内211()ingijiijSSXX组内SSSSSS总组间组内总组间组内三种变异的关系：SSMSSSMS组间组间组间组内组内组内均方差，均方(meansquare，MS)。检验统计量：如果，则都为随机误差的估计，F值应接近于1。如果不全相等，F值将明显大于1。用F界值（单侧界值）确定P值。12,,MSFMS组间组间组内组内12g,MSMS组间组内212,,,g第二节完全随机设计资料的方差分析(completelyrandomdesign)是采用完全随机化的分组方法，将全部试验对象分配到g个处理组（水平组），各组分别接受不同的处理，试验结束后比较各组均数之间的差别有无统计学意义，推论处理因素的效应。一、完全随机设计例4-1某医生为了研究一种降血脂新药的临床疗效，按统一纳入标准选择120名患者，采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组？（1）完全随机分组方法：1.编号：120名高血脂患者从1开始到120，见表4-2第1行（P72）；2.取随机数字：从附表15中的任一行任一列开始，如第5行第7列开始，依次读取三位数作为一个随机数录于编号下，见表4-2第2行；表4-2完全随机设计分组结果编号12345678910…119120随机数260873373204056930160905886958…220634序号241063915311413109108117…1675分组结果甲丁乙甲甲丁甲丁丁丁…甲丙3.编序号：将全部随机数字从小到大(数据相同则按先后顺序）编序号，见表4-2第3行。4.事先规定：序号1-30为甲组，序号31-60为乙组，序号61-90为丙组，序号91-120为丁组，见表4-2第四行。（2）统计分析方法选择：1.对于正态分布且方差齐同的资料，常采用完全随机设计的单因素方差分析(one-wayANOVA)或成组资料的t检验（g=2）；2.对于非正态分布或方差不齐的资料，可进行数据变换或采用Wilcoxon秩和检验。二、变异分解表4-4完全随机设计资料的方差分析表变异来源自由度SSMSF总变异N－1211ingijijXC组间g－1211()inijgjiiXCnSS组间组间MSMS组间组内组内N－gSSSS总组间SS组内组内例4-2某医生为了研究一种降血脂新药的临床疗效，按统一纳入标准选择120名高血脂患者，采用完全随机设计方法将患者等分为4组（具体分组方法见例4-1），进行双盲试验。6周后测得低密度脂蛋白作为试验结果，见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?统计量分组测量值niXX2X3.534.594.342.663.593.132.642.563.503.253.304.043.533.563.854.073.523.934.192.96安慰剂组1.373.932.332.984.003.552.964.34.162.59303.43102.91367.85降血脂新药2.423.364.322.342.682.951.563.111.811.771.982.632.862.932.172.722.652.222.902.972.4g组2.362.562.522.272.983.722.803.574.022.31302.7281.46233.002.862.282.392.282.482.283.212.232.322.682.662.322.613.642.583.652.663.682.653.024.8g组3.482.422.412.663.292.703.042.811.971.68302.7080.94225.540.891.061.081.271.631.891.192.172.281.721.981.742.163.372.971.690.942.112.812.527.2g组1.312.511.881.413.191.922.471.022.103.71301.9758.99132.13表4-34个处理组低密度脂蛋白测量值(mmol/L)三、分析步骤H0：1234，即4个试验组的总体均数相等H1：4个试验组的总体均数不全相等0.05按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。H0：即4个试验组总体均数相等H1：4个试验组总体均数不全相等12340.052.计算检验统计量:1.建立检验假设，确定检验水准:102.9181.4680.9458.99324.30ijX2367.85233.00225.54132.13958.52ijX2(324.30)/120876.42C958.52876.42=82.10SS总，总=120－1=1192222(102.91)(81.46)(80.94)(58.99)876.4232.1630303030SS组间413组间82.1032.1649.94SS组内，1204116组内32.1610.723MS组间，49.940.43116MS组内，10.7224.930.43F变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.930.01组内11649.940.43表4-5完全随机设计方差分析表列方差分析表0.053.确定P值，作出推断结论：按水准，拒绝H0，接受H1，认为4个试验组ldl-c总体均数不相等，即不同剂量药物对血脂中ldl-c降低影响有差别。注意：方差分析的结果拒绝H0，接受H1，不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别，可进行多个均数间的多重比较（见本章第六节）。当g=2时，完全随机设计方差分析与成组设计资料的t检验等价，有。tF第三节随机区组设计资料的方差分析一、随机区组设计——配伍组设计(randomizedblockdesign)随机区组设计(randomizedblockdesign)又称为配伍组设计，是配对设计的扩展。具体做法是：先按影响试验结果的非处理因素（如性别、体重、年龄、职业、病情、病程等）将受试对象配成区组(block)，再分别将各区组内的受试对象随机分配到各处理或对照组。（1）随机分组方法：（2）随机区组设计的特点随机分配的次数要重复多次，每次随机分配都对同一个区组内的受试对象进行，且各个处理组受试对象数量相同。区组内均衡。在进行统计分析时，将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来，从而减小组内离均差平方和（误差平方和），提高了统计检验效率。例4-3如何按随机区组设计，分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物？分组方法：先将小白鼠按体重编号，体重相近的3只小白鼠配成一个区组，见表4-6。在随机数字表中任选一行一列开始的2位数作为1个随机数，如从第8行第3列开始纪录，见表4-6；在每个区组内将随机数按大小排序；各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药，分配结果见表4-6。表4-65个区组小白鼠按随机区组设计分配结果区组号12345小白鼠123456789101112131415随机数683526009953936128527005483456序号321132321231213分配结果丙乙甲甲丙乙丙乙甲乙丙甲乙甲丙（3）统计方法选择：1.正态分布且方差齐同的资料，应采用两因素（处理、配伍）方差分析(two-wayANOVA)或配对t检验（g=2）；2.当不满足方差分析和t检验条件时，可对数据进行变换或采用随机区组设计资料的FriedmanM检验。处理因素(g个水平)区组编号123…g1X11X21X31…Xg12X12X22X32…Xg2………………jX1jX2jX3j…Xgj………………n1nX2nX3nX…gnX表4-7随机区组设计的试验结果二、变异分解(1)总变异：反映所有观察值之间的变异,记为SS总。(2)处理间变异：由处理因素的不同水平作用和随机误差产生的变异，记为SS处理。(3)区组间变异：由不同区组作用和随机误差产生的变异，记为SS区组.(4)误差变异：完全由随机误差产生的变异，记为SS误差。对总离均差平方和及其自由度的分解，有:SSSSSSSS处理区组总误差处理区组总误差变异来源自由度SSMSF总变异N－1211gnijijXC处理间g－12111()gnijijnXCSS处理处理MSMS处理误差区组间n－12111()gnijjigXCSS区组区组MSMS区组误差误差（n－1）（g－1）SS总－SS处理-－SS区组SS误差误差表4-8随机区组设计资料的方差分析表三、分析步骤例4-4某研究者采用随机区组设计进行实验，比较三种抗癌药物对小白鼠肉瘤抑瘤效果，先将1

第四章 多个样本均数比较的方差分析

第四章多个样本均数比较的方差分析