多重回归

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

GEAppliancesCopyright19999.1多重回归修订版101999年1月11日第9部分:多重回归GEAppliancesCopyright19999.2多重回归修订版101999年1月11日第9部分:多重回归目的:介绍多重回归方程,作为具有多个独立变量工序的可能模型。目标:•理解多重回归方程式的各个部分-常数和系数(参数)•采用对中概念,确保回归模型为正交•采用残差图评估模型的“良好性”•通过观察p值、R2和标准残差变差,评估回归模型。•根据数据得出等值线图,并确定“X”的最优状态GEAppliancesCopyright19999.3多重回归修订版101999年1月11日什么是多重回归?•定义连续“Y”变量与多重、连续“X”变量之间关系的方法•一种基于您提供的数据而建立的工序数学模型为何要使用多重回归?•它提供了一种采用线性方程式或二次方程式(含有二次项的方程式)模拟工序的能力方程的一般形式是什么?Yi=b0+b1*X1i+...+bk*Xki+error注意!!对于所构建的任何形式的模型,对从模型中得出的结论要倍加小心。在对基准数据进行回归时尤其如此。如果回归用的是基准数据,您必须运行DOE,以确认模型(证明这些“X”确实控制着“Y”)GEAppliancesCopyright19999.4多重回归修订版101999年1月11日多重回归方程式中的“X”可以是独立、不等变量,也可以是互相关联,如X12或X1*X2。如果平方项(X12)显著,而线性项(X1)不显著,该怎么办?在这两项相关联时,如何区别二者的影响?(X1无疑与X12相关联!)我们必须‘转换’相关联的“X”变量,才能将它们各自对“Y”的影响区别开来。转换的方法叫做“对中”。如何“对中”?将每一X值减去该X变量的平均值,然后,计算其平方值,即:2让我们举一实例....原始数据和对中数据基本正交。这可以区别影响。要使p值有效,数据必须对中。对中’“X”,以确保正交)(xxjGEAppliancesCopyright19999.5多重回归修订版101999年1月11日对中举例:数集:XX2416525636•X和X2一起改变•图象显示‘相关系数’(r)很大。相关系数表示数据点成直线的程度。对于此组数据,r=.998(如果完全相关,r=1.0)•我们希望“X”变量独立:r=0如果X和X2都影响工序,可通过‘对中’对它们的影响进行独立研究。从每个数据点中减去X的平均值:平均值=(4+5+6)/3=5GEAppliancesCopyright19999.6多重回归修订版101999年1月11日(X-5)(X-5)2-110011从每个X数据点减去平均值5,得到‘对中’的数据:转换过的数据的相关系数是:r=0.0-这两个变量现在已经独立!•线性效应可通过比较“X”处于低水平时的“Y”值和“X”处于高水平时的Y值来估计。•二次方或曲线效应可通过比较“X”处于中间水平时的Y值和“X”处于高水平及低水平时Y值的平均值来估计。将“对中”数据制成图表:(StatBasicStatisticsCorrelation...可用于计算‘r’值)MINITAB对数据“编码”时,其实是“对中”,如上例所示。GEAppliancesCopyright19999.7多重回归修订版101999年1月11日4115492569356545401105021058310574103111536215443155741519120312203332043420多重回归-扭转下例摘自:RichardA.Johnson.MillerandFreund‘sProbabilityandStatisticsforEngineers:FifthEdition.PrenticeHall.1994.的第358页。目的是估计描述以下变量之间关系的方程式:元素A的百分比,元素B的百分比使锻造合金棒断裂所需的扭转次数“扭转(twist)”指Y(响应)变量,“A”和“B”是X(独立)变量。在C1中输入“twists”,C2中输入“A”,C3中输入“B”。C1C2C3TwistsABGEAppliancesCopyright19999.8多重回归修订版101999年1月11日采用交互作用图,制成Y与A对应图和Y与B对应图STATANOVAInteractionsPlots检查“X”和“Y”之间的关系在对话框中选择“Twists”作为响应变量值,并选择“A”和“B”作为因素(自变量)。不动“BasePlotson:”以及“DataMeans”。单击“DisplayFullInteractionPlotMatrix”。单击“OK”。GEAppliancesCopyright19999.9多重回归修订版101999年1月11日1122334455101015152020204570204570AB1234510152012345101520InteractionPlot-DataMeansfortwists交互作用图分析解释:右上图(“B”在水平数轴上;不同线条代表不同的“A”值)•扭转次数随着“B”的增加而减少•两者之间的关系是曲线还是直线?左下图(“A”在水平轴上。不同线条代表不同的“B”值)•扭转次数随着“A”的减少而减少•“Y”与“A”间的关系是曲线还是直线?采用“分析反应面设计”确定平方关系是否具有统计显著性。GEAppliancesCopyright19999.10多重回归修订版101999年1月11日定义设计数据表将显示定义DOE的“stdorder”,“runorder”和“blocks”。要使用“分析RS设计”,必须有这些信息。为了用反应面(RS)设计法分析数据,首先要确定RS设计。STATDOEDefineCustomRSDesign在对话框中,选择代表因素设置的栏,单击OK。使用“高值/低值”和“设计”选项,请参见Minitab帮助。我们采用这些选项的缺省设置。GEAppliancesCopyright19999.11多重回归修订版101999年1月11日下一步,用StatDOEAnalyzeRSDesign来分析模型选择response,codedunits然后单击graphs分析反应面模型!“编码数据”选择将指导Minitab采用算法对中数据,该算法可用“定义定制RS设计”和“低值/高值”选项来定义。在本例中,我们使用缺省的低值=-1,高值=1GEAppliancesCopyright19999.12多重回归修订版101999年1月11日在图形框中,单击这些图表,并选择变量在主对话框中选择“Terms”按钮,以确定模型的种类(‘fullquadratic’)以及模型中包含的因素(全部Xs,X的平方,和交互作用),然后单击OK,接着单击“分析反应面设计”对话框中的OK。GEAppliancesCopyright19999.13多重回归修订版101999年1月11日模型评估:•“A”和“B”为统计显著的因素。•在ANOVA表中,仅线性模型为统计显著;平方和交互作用对“Y”没有显著影响,因此线性模型最适合此数据。•R2和R2adj大于90%,表明潜在的良好拟合。•‘s’(误差项的标准变差)为4.254。这是未解释的变差””-未包含于模型中的噪音。通过查看+/-6s(此例中约为25),确定是否有必要包括更多的“X”。即使“A”和“B”得到完美控制,您能容许+/-25的扭转变差吗?如果可能的话,从平方模型开始,重新拟合一个更简单的模型统计显著(p0.05)非统计显著(p0.05)仅‘线性’为统计显著会话窗口输出:GEAppliancesCopyright19999.14多重回归修订版101999年1月11日StatDOEAnalyzeRSDesign从下拉列表中选择‘linear’。‘AvailableTerms’和‘SelectedTerms’应自动改变。如前所示,从图形选项中选择残差图(9.12页)重新拟合模型数据显示,仅线性项有显著影响;残差图显示,平方模型可能不是最佳拟合方式。我们重新分析,选择“Linear”,而不是“Quadratic”……GEAppliancesCopyright19999.15多重回归修订版101999年1月11日会话窗口输出X变量和线性模型都具有统计显著性(p0.05)•线性和平方模型的R2值相似,表明线性模型仍为较好的拟合方式。下一步:复习残差图平方线性R-平方93.691.7R平方调节90.390.4•两种模型的误差项的大小相似:4.242(线性)和4.254(平方)GEAppliancesCopyright19999.16多重回归修订版101999年1月11日采用残差图帮助评估线性模型看上去,误差随拟合值的增加而增加。残差好象不太呈正态分布(请记住,我们仅有15个数据〕线性模型解释:不大可能所有的假设都严格满足。然而,此模型提供了所给定数据良好的近似值,所以,在实际工作中可能会有益。如果需要更好的拟合,可能需要对数据进行转换-也许使用“Y”的对数或倒数。下一步:重新运行“未编码”分析以获得模型系数GEAppliancesCopyright19999.17多重回归修订版101999年1月11日“未编码数据”的分析RS图重新运行STARTDOEAnalyzeRSPlots这次单击“UncodedUnits”。打开“Graphs”对话框,清除先前用过的残差图。单击OK,然后再单击OK生成输出结果。生成的输出结果为模型提供了正确、未编码的系数。GEAppliancesCopyright19999.18多重回归修订版101999年1月11日单击“Contours...”以设置图形输出……...StatDOERSPlots依次单击‘Contourplot’,和‘Setup’最后,查看等值线图,以找到最佳设置GEAppliancesCopyright19999.19多重回归修订版101999年1月11日3545556512345101520ABContourPlotoftwists扭转次数的等值线单击‘Usedifferenttypes’,在等值线图中创建短划线Click‘OK’threetimes!解释:要使扭转的数量最大,参照等值线图右下角(扭转次数=65)。读取将提供扭转次数=65(高值A,低值B)的潜在“A”和“B”值。}等值线图GEAppliancesCopyright19999.20多重回归修订版101999年1月11日另一种工具:‘逐步’回归在对影响工序的大量“X”进行筛选,以确定潜在的关键少数变量时,回归可以是一种宝贵的工具。这甚至可以采用基准数据进行,但要注意:注意!!如果不先进行DOE,以确认这些确实是控制工序的“X”,永远不要得出这些“X”就是关键少数因素的结论。‘逐步回归’将根据‘Xs’对响应变量值(“Y”)的影响而逐步将其添加到模型中。Minitab所用的第一个“X”是对‘Y’影响最大的一个变量。我们采用一种由计算机生成的、称作‘工厂模拟器’的工厂来进行逐步回归练习。该工厂生产‘小器具’,其CTQ(“Y”)是器具长度。工厂用8个(标注为A至H)连续“X”变量生成连续的“Y”对应值。工厂模拟器是一个Excel文件:FACTSIM.xlsTheFactorySimulatorisanExcelfile:FACTSIM.xlsGEAppliancesCopyright19999.21多重回归修订版101999年1月11日工厂模拟器制作‘小器具’(中下部所示红盒)单击‘Start’,启动工厂单击Yes’运行工厂模拟器单击‘All’选择所有8个“X”变量选择子群中的样本数量并选择子群数量遵照下页的程序,逐步使用‘逐步’回归方法筛选潜在的关键“Xs”GEAppliancesCopyright19999.22多重回归修订版101999年1月11日采用逐步回归方法筛选出潜在“关键少数”X(续)基本回归公式为:y=b0+

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功