案例库下载-项目八假设检验、回归分析与方差分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

项目八假设检验、回归分析与方差分析实验3方差分析实验目的学习利用Mathematica求单因素方差分析的方法.基本命令1.调用线性回归软件包的命令Statistics\LinearRegression.m作方差分析时,必须调用线性回归软件包的命令Statistics\LinearRegression.m或输入调用整个统计软件包命令Statistics`2.线性设计回归的命令DesignedRegress在线性回归模型YX中,向量Y是因变量,也称作响应变量.矩阵X称作设计矩阵,是参数向量是误差向量DesignedRegress也是作一元和多元线性回归的命令,它的应用范围更广些.其格式与命令Regress的格式略有不同:DesignedRegress[设计矩阵X,因变量Y的值集合,RegressionReport-{选项1,选项2,选项3,…}]RegressionReport(回归报告)可以包含:ParameterCITable(参数的置信区间表PredictedResponse(因变量的预测值),MeanPredictionCITable(均值的预测区间),FitResiduals(拟合的残差),SummaryReport(总结性报告)等,但不含BestFit.实验准备—将方差分析问题纳入线性回归问题在线性回归中,把总的平方和分解为回归平方和与误差平方和之和,并在输出中给出了方差分析表.而在方差分析问题中,也把总的平方和分解为模型平方和与误差平方和之和,其方法与线性回归中的方法相同.因此只要把方差分析问题转化为线性模型的问题,就可以利用线性回归中的设计回归命令DesignedRegress做方差分析.单因素试验方差分析的模型是.,,2,1;,,2,1,),,0(~,2sjniNYjijijijjij独立各(3.1)上式也可改写成.,,2,1;,,2,1,),,0(~;,,3,2,)(,,,2,1,2111111sjniNsjYniYjijijijjijii独立各(3.2)给定具体数据后,还可(2.2)式写成线性模型的形式:YX其中X称为设计矩阵,它的元素是0或1.由于(3.2)的每一个等式的右边都有,1因此X的第一列都是1,线性模型中就有了必须要有的常数这一列.110s是线性模型中的参数.1相当于线性模型中常数项.0,12,13相当于线性模型中的参数.,,21当然也可以用2或3代替1.Y是因变量(向量),是误差向量.可以通过下面的例子来了解和熟悉此方法.实验举例例3.1(教材例3.1)今有某种型号的电池三批,它们分别是A,B,C三个工厂所生产的.为评比起质量,各随机抽取5只电池为样品,经试验得其寿命(单位:h)如下表:A4042484538B2628343230C3950405043试在显著性水平0.05下检验电池的平均寿命有无显著的差异.若差异是显著的,试求均值差,BACA及CB的置信水平为95%的置信区间.这是方差分析问题,先把它转化为线性模型:YX令,101101011011001001,515151XYYYYYYYCCBBAA,ACABA531352125111则线性模型(3.3)与方差分析模型(3.1)完全等价.模型(3.3)完全可以用DesignedRegress命令作设计回归,得到所要的方差分析表.我们面临的任务是:(1)检验3个总体的均值是否相等,即作假设检验不全相等CBACBAHH,,:;:10(2)求均值差,BACA及CB的置信水平为95%的置信区间.任务(1)等价于对模型(3.3)作检验:不全等于零ACABACABHH,:;0:10而任务(2)等价于求BCACAB及,的置信区间.在DesignedRegress命令中加入选项RegressionReport-{ParameterCITable,MeanPredictionCITable,SummaryReport}后便能完成上述任务.用回归分析作单因素方差分析完成对模型的假设检验和对模型参数的区间估计任务.输入设计矩阵和数据X1={{1.0,0,0},{1,0,0},{1,0,0},{1,0,0},{1,0,0},{1,1,0},{1,1,0},{1,1,0},{1,1,0},{1,1,0},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1}};Y1={40,42,48,45,38,26,28,34,32,30,39,50,40,50,43};再输入设计回归命令DesignedRegress[X1,Y1,RegressionReport-{ParameterCITable,MeanPredictionCITable,SummaryReport}](*回归报告输出参数的置信区间,均值的置信区间和总结报告*)执行后得到输出EstimateSECI142.61.89912{38.4622,46.7378}{ParameterCITable-2-12.62.68576{-18.4518,-6.74822}31.82.68576{-4.05178,7.65178}MeanPredictionCITable-ObservedPredictedSECI40.42.61.89912{38.4622,46.7378}42.42.61.89912{38.4622,46.7378}48.42.61.89912{38.4622,46.7378}45.42.61.89912{38.4622,46.7378}38.42.61.89912{38.4622,46.7378}26.30.1.89912{25.8622,34.1378}28.30.1.89912{25.8622,34.1378}34.30.1.89912{25.8622,34.1378}32.30.1.89912{25.8622,34.1378}30.30.1.89912{25.8622,34.1378}39.44.41.89912{40.2622,48.5378}50.44.41.89912{40.2622,48.5378}40.44.41.89912{40.2622,48.5378}50.44.41.89912{40.2622,48.5378}43.44.41.89912{40.2622,48.5378}EstimateSETStatPValue142.61.8991222.43143.63987×10-11{ParameterCITable-2-12.62.68576-4.69140.0005219631.82.685760.67020.515421Rsquared-0.739904,AdjustedRSquared-0.696554,EstimatedVariance-18.0333,ANOVATable-DFSumOfsqMeanSqFratioPvalueModel2615.6307.817.06840.000309602Error12216.418.0333Total14832.从参数置信区间表(ParameterCITable)可知:A的点估计是42.6,估计量的标准差为1.89912,A的置信水平为0.95的置信区间是(38.4622,46.7378).AB的点估计是12.6,标准差为2.68576,AB的置信水平为0.95的置信区间是).74822.6,4518.18(AC的点估计是1.8,标准差为2.68576,AC的置信水平为0.95的置信区间是).65178.7,05178.4(从均值置信区间表(MeanPredictionCITable)知:A的点估计,A的置信区间同参数置信区间表,B的点估计为30.0,置信度为0.95的置信区间是),1378.34,8622.25(C的点估计为44.4,置信度为0.95的置信区间是).5378.48,2622.40(从参数表(ParameterTable)知:关于AB是否等于零的假设检验结果是否定的,即AB不等于零.关于AC是否等于零的假设检验结果是不否定原假设,即不否定AC等于零的假设.从Rsquared-0.739904知Y的变化中的74%是由模型引起的,26%是由误差引起的.从EstimatedVariance-18.0333知模型中的误差项的方差的估计是最后从方差分析表知平方和的分解结果是:总的平方和832.0,模型引起的平方和(效应平方和)误差平方和作假设检验不全等于零ACABACABHH,:;0:10时统计量F的观察值为17.0684,F的P值为0.000309602,检验结果显然否定原假设,即三个工厂生产的电池的平均寿命有显著差异.总结起来:三个工厂生产的电池的平均寿命有显著差异.BA的置信水平为0.95的置信区间是(6.74822,18.4518).CA的置信水平为0.95的置信区间是).05178.4,65178.7(看来只有CB的置信区间未能求得.只要改变设计矩阵X,再作一次设计回归.输入X2={{1.0,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{0,1,1},{0,1,1},{0,1,1},{0,1,1},{0,1,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1}};DesignedRegress[X2,Y1,RegressionReport-{ParameterCITable,MeanPredictionCITable,SummaryReport}]就能得到类似于对11,yx的设计回归结果(输出结果省略了),从参数置信区间表可以得到CB的置信水平为0.95的置信区间是).54822.8,2518.20(例3.2(教材例3.2)将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效.下表中列出了5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比.试在水平05.0下检验这些百分比的均值有无显著的差异.青霉素四环素链霉素红霉素氯霉素29.627.35.821.629.224.332.66.217.432.828.530.811.018.325.032.034.88.319.024.2本例也是单因素方差分析问题.输入X3={{1.0,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,1,0,0,0},{1,1,0,0,0},{1,1,0,0,0},{1,1,0,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,0,1},{1,0,0,0,1},{1,0,0,0,1},{1,0,0,0,1}};Y3={29.6,24

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功