使用MINTAB进行回归分析

sunny4545
1 ℃
2020-01-06

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

如何使用MINTAB进行回归分析回归分析用来检验并建立一个响应变量与多个预测变量之间的关系模形。MINITAB提供了多种最小二乘法和推理回归程序。当响应变量为连续的量值时使用最小二乘法当响应变量为分类值时使用推理回归。最小二乘法和推理回归方法都是评估关系模型中的参数并使模型的按按拟合值达到最优化。最小二乘法是使误差平方和以获得参数估计值。但是MINITAB的推理回归命令是获得参数最大概率估计。参考2-29页推理回归概要以获得更多关天推理回归分析信息。使用下表来帮助选择适当的程序。选择的程序适合的条件响应类型评估方法回归执行简单或多元回归分析：选择合适的关系模型、存贮回归统计量、检验残差分析、产生点估计、产生预测和置信区间以及进行LACK-FIT检验。连续型最小二乘法逐步回归分析为了识别预测因素中有用的子集，执行逐步、进一步选择以及后退消除等方法从关系模型中增加或消除变量。连续型最小二乘法最佳子集识别以R2为基础的预测因子最佳子集。连续型最小二乘法拟合线性图使用单个预测因子执行线性和多项回归，并且用数据绘制回归线。以实际和log10为基础。连续型最小二乘法残差图产生一组残差图用来进行残差分析。正常score图，单值残差图，残差柱状图以及残差和拟合图。连续型最小二乘法二元推理分析进行响应可能只有两个值的回归分析，例如：存在或不存在。分类最大概率顺序推理对响应可能有三个或更多的值的响应进行回归分析，该响应值有自然的顺序，例如：无影响、中等影响、严重影响。分类最大概率名义推理对响应可有三个或更多的值的响应进行回归分析，该响应值没自然的顺序，例如：甜、咸、酸分类最大概率回归您可以使用回归方法来进行用最小二乘法为基础的一元和多元回归分析。使用本程序您可以产生最小二乘法关系模型，贮存回归统计量，检验残差，产生点估计、进行预测以及置信区间，并且可以进行lack-of-fit检验。同时您也可以使用该命令产生多元回归关系模型。然而，如果您要使用一个预测因子来获得一个多元回归关系模型，您将会发现使用拟合线性图更好。数据在数字型列中输入相等长度的响应和预测因子变量，这样您的工作表中每行的数据包含着对应观察值的测量结果。在回归方程计算和方差分析表中，MINITAB忽略了响应或预测因子中所有包含丢失值的观测值列。线性回归分析1.选择统计回归回归2.在“响应”栏中，输入包含响应变量(Y)的列。3.在“预测因子”栏中输入包含预测因子(X)变量的列。4.如果需要的话，可以使用下面显示的选项，然后单击“确立”选项图形子对话框为正常、标准、已删除残差图画5个不同的残差图。参考-----2-5页选择残差图类型。有效的残差图包括：柱状图正态概率图残差图及拟合值残差图及数据顺序。每个数据点的行号都显示在图中X轴上。(例如：12345…n)独立的残差图及每个选定列。参考2-6页的残差图。结果子对话框在对话窗口中显示下列内容：不输出估计的回归关系方程，系数表、S，R2,以及方差分析表。默认的输出设置，包括上面的输出方式加上连续平方和fitsandresidualsofunusualobservations选项子对话框执行加权回归分析-----参考2-6页加权回归分析excludetheintercepttermfromtheregressionbyuncheckingFitIntercept—seeRegressionthroughtheoriginonpage2-7显示varianceinflation因子(VIF---共线性影响度量值)与每个预测因子相关-----参考2-7页Varianceinflationfactor显示杜宾-瓦特森统计，它是用来检测残差的自相关—参考2-7页检测残差的自相关显示PRESS统计以及校正的R2。当预测因子重复时，用纯误差lack-of-fit来检验关系模型的适合性，---参考2-8页检验lack-of-fit用数据子子集lack-of-fit测试来检验关系模型的适合性---参考2-8页检验lack-of-fit预测响应结果、置信区间以及新观测值的区间---参考2-9页新的观测值的预测。存储子对话框存储系数、拟合值、以及正常、标准、已删除残差图---参考2-5页选择残差类型。nstoretheleverages,Cook’sdistances,andDFITS,foridentifyingoutliers—seeIdentifyingoutliersonpage2-9.存储storethemeansquareerror,the(XX)-1matrix,andtheRmatrixoftheQRorCholeskydecomposition.(Thevariance-covariancematrixofthecoefficientsisMSE*(XX)-1.)SeeHelpforinformationonthesematrices.残差分析及回归推断当建立了回归关系模，回归分析通常没有完成。您同样也可以检验残差图和其它回归推理来评定残差图是否是随机和正态分布。MINITAB通过图形子对话图提供许多残差图，做为选择，关系模型及残差被存储以后，您可以使用统计回归残差图命令可以在同一图形窗口获得四个残差图。MINITAB也可以用回归推理来识别不正常的观测值，这些观测值可能对回归结果产生很显著的影响，参考2-9页识别OUTLIERS，您可检验一下这些异常数据看它们是否正确。假如这样的话，您可以确定它们为什么产生异常以及它们对回归关系方程有什么影响。您也可以验证当存在OUTLIERS时，回归结果的敏感程度。Outliers可以暗示关系模型不充分或者需要另外的信息。选择残差类型您可以计算三各残差类型，使用下表可以帮助您选择哪种图形。残差类型选择您需要列计算方法常规examineresidualsintheoriginalscaleofthedataresponsefit标准使用ruleofthumb来识别与关系模型关联关系不十分密切的观测值。一个标准的残差绝对值大于2，MINITAB将这些观测值显示在异常观测值表中，并有R表示。(残差)/(残差的标准差)Studentized识别与关系模型关联关系不十分密切的观测值，删除影响变量估计及参数估计的观测值。较大的Studentized残差绝对值表明关系模型中包含该观测值将会增大误差变化或者它对参数的估计有很大的影响，或者对二者都有影响。(残差)/(残差的标准差)第I个studentized残差值是用第I个被删除的观测值计算出来的。残差图MINITAB可以产生残差图这样您就可以验证您建立的关系模型的拟合度，您可以选择以下残差图：残差正态分布图：如果残差服从正态分布，图中的点将基本形成一条直线。如果图中的点背离了该直线，残差服从正态布的假设就会不成立，检验数据是否服从正态分布，可以使用统计基本统计正态检验(1-43)。残差柱状图：该图必须类似正态分布图并且其平均值为0(钟形)，许多点串远离零点，关系模型之外的因子可能影响了您的结果。残差及拟合度：本图应该显示的是残差应是随机的分布在0周围。在残差图内应该没有任何recognizablepatterns，以下的几点可以说明残差图是非随机的：----几点连续上升或下降----绝大部分的点是正残差，或绝大部的点是负残差。–patternssuchasincreasingresidualswithincreasingfits残差与顺序图：本图所有残差都是按照数据搜集顺序排列的，它可以用来发现非随机错误，特别是与时间相关的影响。残差图与其变量图：这是个残差与其它变量图。一般地，你可以使用关系模型中预测因子或变量来检查一下您的是否有您想要图形。如果某些残差值被考虑，您可以用刷子工具来标识这些值，您可以参考MINITAB使用者指南中BrushingGraphs的章节。加权回归分析加权最小二乘法回归分析用来分析观测值中包含有非常量变量的一种方法。如果变量不是常量变量那么：1)带有大变量的观测值应相应地加上较小的权重。2)带有小变量的观测值应相应地加上较大的权重。一般情况的权重是响应中纯误差变量相反值。Theusualchoiceofweightsistheinverseofpureerrorvarianceintheresponse.加权回归分析1.选择统计回归回归选项2.在“权重”栏中，输入包含权重的列，权重必须大于或等于0，在每个对话框中单击“确定”3.在数据组中有n个观测值，MINITAB产生了nn的矩阵W，权重列作为矩阵的对角和零点。MINITAB使用(XWX)-1(XWY)来计回归系数，这样就等于将加权平方和误差最小化。，式中wi为权重。通过原点的回归一般的情况下，y截矩(也叫常数项)被包含在等式，因此minitab选用下面关系模型：然而，如果在x=0时，响应值也自然为0时，可以选用一个没有截矩的关系模型。如果是这样，在选项子对话框中，不选截矩项，并且0项就会被忽略，minitab选用下面的关系模型：因为当没有常数项解释R2是非常困难的，所以R2没有显示出来。如果您想比较带有截矩项与不带有截矩项关系模型的拟合度，可以进行平均值平方误差及验证残差图。变量inflationfactorThevarianceinflationfactor(VIF)用来检测一个预测因子和剩下的预测因子是否有很强的线性关系(预测因子中存在多重共线性)。如果您的预测因子是相关的(或多重线性相关)时，VIF测量的是估计的回归因子增加程序。VIF=1时表明因子之间不相关，所有预测因子中最大的VIF通常是用来作为多重共线性的指示。MontgomeryandPeck[21]建议当VIF大于5-10时，回归系数估计得毫无结果。你应该考虑使用选项中的方法来分散预测因子间的多重共线性：重新搜集数据，删除预测因子，使用不同的预测因子或最小二乘法回归分析的替代，获得附加的信息请参考[3],[21].。检验残差的自相关在线性回归分析中，我们总是假设残差都是彼此相互独立的(即它们之间不存大自相关)。如果相互独立的假设被破坏，一些关系模型的拟合结果就会被怀疑。例如：误差的正相关可以放在系数的t值。选定一个模型后检验关系模型的假设是回归分析的一个很重要的部分。Minitab提供了两种方法也检验这个假设：1.残差与数据顺序(1234…….n)图可以提供很直观的方法来检验残差的自关性。2.杜宾-瓦特森统计测试回归残差是否存在自相关是通过两个相邻误差项的相关系数是否为0来决定的。该测试是以误差由第一顺序自回归过程的假设为基础的。如果列中有丢失的观测值，同样在计算时这些数据就会忽略了，仅仅使用没有丢失的数据。为了从检验中得出结论，您需要用表中的上下限比较显示的统计量，如果D上限，没有相关；如果D下限，表示存在正相关；如果D在上下限之间，不能确定其相关性。如果想得到其它信息，请参考[4],[22].检验lack-of-fitMINITAB提供了两种lack-of-fit检验，这样您可确定建立的回归模型是否能够完全适合您的数据。纯误差lack-of-fit检验需要副本(replicates);thedatasubsettinglack-of-fittestdoesnotrequirereplicates.纯误差lack-of-fit检验----如果您的预测因子中包含重复的数据(一个因子几个同样的X值或多预测因子中有几个同样的X值组合)，MINITAB可以为lack-of-fit计算一个纯误差检验。误差项将被分成纯误差(errorwithinreplicates)和lack-of-fit误差。F检验可以检验您是否选择了适合的回归关系方程。如果需要其它信息，请参考[9],[22],[29].数据子集lack-of-fit检验----MINITAB同样也可以进行lack-of-fit检验数据，其数据不需要副本但是要包含数据子集。该检验是非标准化的，但是它可提供关于每个变量的lack-