相关/回归-0-相关/回归(Correlation&Regression)相关/回归-1-DefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的选定MultiVariCentrallimitHypothesistestingConfidenceintervalANOVA,T-testChi-squareCorrelation,regressionStep7-Data收集路径位置相关/回归-2-目的定义并计算相关系数讨论相关性及因果关系绘制并分析拟合直线图介绍回归分析的基本知识使用回归分析技术建立数学预测模型相关/回归-3-X和Y数据类型研究Y是什么?_____________数据类型?______________X是什么?_____________数据类型?______________你将使用哪种工具?________________________设计小组想了解引擎寿命与车辆重量有无关系相关/回归-4-分析路线图(单一X:单一Y)XData离散连续YData离散连续Chi-SquareLogisticRegressionTtest/ANOVAMeans/MediansTestsRegression相关/回归-5-相关(Correlation):是什么?“相关”为什么如此重要?你是否经历过测量某些产品合格后送给顾客,但他们告诉你你的产品不符合规格?在奥运会滑冰比赛上,你认为两个裁判成绩的相关性有多高?相关/回归-6-0500100005001000XY0102030405001020304050NewXNewY这两张图有何不同?相关/回归-7-12011010090807060504011010090807060504030InputOutputR-Squared=0.876Y=9.77271+0.745022XStrongPositiveCorrelation1009080706050110100908070605040InputOutputR-Squared=0.359Y=25.7595+0.645418XModeratePositiveCorrelation90807060504085756555InputOutputR-Squared=0.115Y=56.6537+0.181987XWeakPositiveCorrelation“+”相关的强度与趋向相关/回归-8-8070605040302010011010090807060504030InputOutputR-Squared=0.876Y=99.1754-0.745022XStrongNegativeCorrelation50403020100110100908070605040InputOutputR-Squared=0.359Y=90.3013-0.645418XModerateNegativeCorrelation60504030201085756555InputOutputR-Squared=0.115Y=74.8524-0.181987XWeakNegativeCorrelation“-”负相关的强度与趋向相关/回归-9-相关系数(r)的确认有几种方法可以决定r值相关研究拟合直线图回归分析让我们一一探讨各个方法相关/回归-10-打开文件Correlation.MPJ中的工作表CorrelationExample依据产品特性,确定Customer与Supplier之间的相关性相关性分析相关/回归-11-既然我们使用统计检验方法,则“假设”需被检验!Ho:没有相关存在Ha:有相关存在若p值大于0.05,即接受Ho,亦即X与Y之间没有相关存在;若p值小于0.05,则Ho被拒绝且Ha将被接受,亦即有相关存在相关性分析相关/回归-12-结果:CorrelationExample相关:Supplier,CustomerSupplier和Customer的Pearson相关系数=0.834P值=0.000结果显示在对话窗中注意,我们得到相关系数及P值你对Supplier和Customer之间的关系有何见解?相关性分析相关/回归-13-r应该多大?依样本大小,若所得的相关系数比表中的值大,则可视为“重要”或统计显著rttntnrr222221orSampleSized.f.nn-20.100.050.020.01310.98770.99690.99950.9999420.90000.95000.98000.9900530.80540.87830.93430.9587640.72930.81140.88220.9172750.66940.75450.83290.8745860.62150.70670.78870.8343970.58220.66640.74980.79771080.54940.63190.71550.76461190.52140.60210.68510.734812100.49730.57600.65810.707913110.47620.55290.63390.683514120.45750.53240.61200.661415130.44090.51400.59230.641116140.42590.49730.57420.622617150.41240.48210.55770.605518160.40000.46830.54250.589719170.38870.45550.52850.575120180.37830.44380.51550.561421190.36870.43290.50340.548722200.35980.42270.49210.536827250.32330.38090.44510.486932300.29600.34940.40930.448737350.27460.32460.38100.418242400.25730.30440.35780.393247450.24290.28760.33840.372152500.23060.27320.32180.354262600.21080.25000.29480.324872700.19540.23190.27370.301782800.18290.21720.25650.283092900.17260.20500.24220.26731021000.16380.19460.23010.2540SignificanceLevel相关/回归-14-r应该多大?勿需担心此表,Minitab可以帮助我们在“相关”程序中选取‘显示p值’选项,Minitab将会显示是否显著寻找比0.05小的p-值相关/回归-15-在1930–1936年间,曾有人跟踪德国城镇Oldenburg的人口与鹳鸟数量之间的关系结果如下(人口以千为单位)250200150756555StorksPopulationR-Sq=87.2%Y=38.6450+0.134494XRegressionPlot显然,鹳鸟送来了婴儿!?相关举例相关/回归-16-相关(Correlation)•直线倾向(正或负)•斜率:直线角度•其测量值为r回归(Regression)•回归预测方程•其测量值为R2•残差分析•线性,二次或三次拟合最佳拟合直线相关与回归相关/回归-17-回归的定义/术语回归分析是一种用于分析变量间相关性的统计工具。在统计课程中通常被称为:“计算最佳拟合直线”本课程将讨论简单回归分析,其探讨对象为单一连续Y与单一连续X的关系下列术语可经常交换使用:回归方程式*回归线预测方程式预测线模型相关/回归-18-回归分析路线图规划分析內容收集数据利用Minitab绘制拟合直线图评估R^2和P值的显著性评估残差制订决策相关/回归-19-分析路线图范例:brake.mtw336325418375355367445385365375455395395395......SpeedBrakingDistance进行21次速度测试,你对此数据有何看法?相关/回归-20-拟合直线图我也想对相关性进行检验,并观察线性关系和数据点的之间的拟合性使用FittedLinePlot选项来看此关系相关/回归-21-提供视觉化图表和方程式拟合直线图420400380360340320480460440420400380360340320BrakingDistanceSpeedS23.7288R-Sq69.5%R-Sq(调整)67.9%拟合线图Speed=-143.6+1.459BrakingDistance相关/回归-22-Minitab:输出结果Y=182.807+.476288x该线性方程为…Y=m(x)+bm=直线斜率b=截距该方程给我们一个对能力的估计值注意R2=.695稍后将作详细讨论420400380360340320480460440420400380360340320BrakingDistanceSpeedS23.7288R-Sq69.5%R-Sq(调整)67.9%拟合线图Speed=-143.6+1.459BrakingDistance相关/回归-23-一些基础知识回顾Y截距斜率()YmXb()YbbX01相关/回归-24-使用回归方程:內推法与外推法Y=182.807+.476288x例:若速度测量值为400,我们对刹车距离的合理估计值应该是多少?例:若速度测量值为1000,我们对距离的合理估计值应该是多少?例:若速度测量值为0,我们对距离的合理估计值应该是多少?相关/回归-25-此拟合直线从何而来?Minitab将找出一条直线,使各点至该直线的距离为最小....***********拟合线实际数据点实际点与直线的距离输入变量(X)输出变量(Y)相关/回归-26-拟合直线图:预测带420400380360340320480460440420400380360340320BrakingDistanceSpeedS23.7288R-Sq69.5%R-Sq(调整)67.9%拟合线图Speed=-143.6+1.459BrakingDistance420400380360340320550500450400350300BrakingDistanceSpeedS23.7288R-Sq69.5%R-Sq(调整)67.9%回归95%预测区间拟合线图Speed=-143.6+1.459BrakingDistance相关/回归-27-置信区间ConfidenceInterval:代表基于系数b0及b1的置信区间预测区间PredictionInterval:给定X,在单一测试中Y有95%的可能性会落在预测带内420400380360340320550500450400350300BrakingDistanceSpeedS23.7288R-Sq69.5%R-Sq(调整)67.9%回归95%预测区间拟合线图Speed=-143.6+1.459BrakingDistance拟合直线图:预测带相关/回归-28-R2:其意义是什么?R2与P值,有助于我们基于统计作决策。R2被称为决定系数(coefficientofdetermination)R2值代表“多少”输出变异总量可由回归模型所解释,其值介于0到1(0%到100%)之间。此值越高表示该模型的可信度越高R2100%0%相关/回归-29-R2:值大小应为多少?视分析对象而定…就像安全系统或文件夹例如,排放废气系统实验的结果将送交交通部审查,你的数值应该“好”到什么程度?不同的课题决定不同的决策标准(通常为+60%)。我们必须认识到R2越高相关性就越强。相关/回归-30-还记得ANOVA及我们对X显著性的看法吗?区分变异的来源生产周期的所有变异周间的变异周內的变异=+()()*()yyyynyyijjnikijjnikiiik