统计分析系统SAS软件敖雁Tel:7979358E-mail:ay@yzcn.net第五章方差分析和协方差分析ANOVA过程-----速度快,功能有限,平衡资料GLM过程-----速度慢,但功能强大(非平衡资料协方差分析)其实,这里的速度快慢只是相对而言,SAS的处理速度是首屈一指的。举个例子,一个有6600条记录的,7因素的,交叉设计的方差分析(是不是已经有人喊头痛了?),我先是用SPSSFORWIN957.5来做,运行了大约10分钟才出结果。我又换用SASFORWIN956.12来做,结果用了――2.47秒!§5.1方差分析数据集的建立技巧5.1.1方差分析的数据集格式统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的:-------数据集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;-------至少有一个处理因素变量,用于记录处理因素的类型及其水平数。例5.1某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量测定,请给出数据集的结构。解:数据集中应有两个变量,x和group。x记录肺活量的大小;group取值为1、2或3,分别代表石棉肺患者、可疑患者及非患者。例5.2某厂医务室测定了10名氟作业工人工前、工中及工后4小时的尿氟浓度,请给出数据集的结构。解:数据集中应有三个变量,x、group和worker。x记录尿氟浓度;group取值为1、2或3,分别代表工前、工中及工后;worker取值为1到10,分别代表10名工人。5.1.2方差分析数据集的建立技巧可见方差分析的数据集其变量取值有一定的规律,因此可以利用循环语句和判断语句来简化输入。例5.3请建立例5.1的数据集。例5.4请建立例5.2的数据集。§5.2引例例5.5请回答在例5.1中三组石棉矿工的用力肺活量有无差别?解:对于单因素的方差分析,在比较之前一般要考虑方差齐性的问题。这里可以用GLM过程中的HOVTEST选项实现,实际上这也是在SAS中做方差齐性检验的唯一途径。§5.3ANOVA过程5.3.2语法说明Means语句的选项主要用来指定两两比较的方法和检验水准,主要有:两两比较方法BON(Bonferroni检验)、DUNCAN(新复极差法)、DUNNETT、GABRIEL、LSD(最小显著差法T)、SCHEFFE、SIDAK、SNK(q检验)、TUKEY、WALLER其它ALPHA=p值更改水准5.3.3结果解释方差分析的统计结果部分§5.4GLM过程GLM过程:GeneralLinerModel过程,它使用最小二乘法对数据拟合广义线形模型。GLM过程中可以进行回归分析、方差分析、协方差分析、剂量――反应模型分析、多元方差分析和偏相关分析等等,其功能之强大可见一斑。5.4.1语法格式这里我们只解释协方差分析的做法:由于协变量并非我们研究的处理因素,因此在CLASS语句中不能有它的位置;但是,另一方面协变量要影响结果变量的取值,因此必须在模型中引入,怎么办?只要在MODEL语句中将其写入即可(写在分析变量的首位)。5.4.2结果解释GLM过程的结果和ANOVA过程是雷同的――注意是雷同而不是相同。在处理因素、协变量及交互作用的检验结果部分,GLM过程会给出两种结果(Ⅰ类和Ⅲ类结果)。在我们用到的范围里,两种结果是完全相同的,所以用哪一种都可以。5.4.3应用实例方差分析基础常用试验设计的ANOVA缺省数据的方差分析方差分析基础单向分组资料的ANOVE1)样本容量相等(modely=trt)2)样本容量不相等(modely=trt)3)数据转换(modelyp=trt)单一自由度的比较(modely=trt)两向分组资料的ANOVA(modely=mh)系统分组资料的ANOVA(modely=trtpot(trt))常用试验设计的ANOVA完全随机化设计(单向分组资料…)随机区组设计1)单因素(modely=blktrt)2)两因素(modely=blkaba*b)3)三因素(modely=blkaba*bca*cb*ca*b*c)(modely=blka|b|c)拉丁方设计(modely=rct)二裂式裂区设计(modely=blkaa*blkba*b)多点品种区域试验(modely=r(u)uvu*v)模型定义中可用|和@n简化表达方法