8.1连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库第8部分:连续过程数据分析8.2连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库第8部分:连续过程数据分析目标:1.掌握如何分析连续过程变量的底线。2.确定非正态数据的可能原因及纠正问题的途径。3.使用Minitab中的六个西格玛过程分析工具进行工序能力分析。目的:对连续数据进行能力分析,并将实际问题转化为统计问题。8.3连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库分析过程的底线可以让您确定:•是均值问题、误差问题,还是两者都是?•是技术问题、控制问题,还是两者都是?在Minitab中分析连续数据的底线•首先,检查数据的正态性。–数据必须是正态,或者几乎是正态,以使用正态表将Z转化为每百万次机会的缺陷。–如果数据真正符合正态分布,那么对于任何样本大小,Minitab不接受正态的可能性是.05。–如果数据不符合正态分布,那么Minitab不接受正态的机会将随着样本规模的增加而加大。•建议在采集数据时(数据的前10个分组内),运用Minitab分析来确定是否需要收集更多数据。•继续进行数据收集,直到过程稳定(参看“要点综述”)遵循的原则:8.4连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库首先,检查数据的正态性到此为止,您已经收集了(或者正在收集)“Y”变量数据,而且还可能收集了许多相关的潜在“X”变量。在您使用六个西格玛工具确定连续数据的特性之前,您必须检查一下,看看您的数据是否正态。为什么正态很重要?因为所有分析统计过程特征的工具都是以正态分布为前提条件的。8.5连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库将数据绘制成图!如果我的数据不是正态,该怎么办?•不正确地记录了数据•测量仪器分辨力不够•过程作假/过程不真实•双态数据或多个不同的总体(看看曲线形状)•数据中的模式(与时间相关吗,模式是周期性的吗,或者数据恰好与其收集过程中已经发生的事件相吻合?)•单边规范和/或以零为界(比如,平坦、偏转,每月销售量等等)针对下面各种情况检查您的数据:8.6连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库可能性:•对您的原始测定结果取对数(任何基数)。•将您的各个测定结果变成幂的形式。(如果偏向右,试试比1小的幂。)•使用测量结果的倒数(1/y)注意:•当您转换数据的时候,您也必须转换您的规范。•您应该在整个数据分析过程中使用转换的数据。但是,如果数据的确不是正态该怎么办?您可以使用非参数统计方法。然而,这些方法对正态假设不敏感,并且不像参数统计那么有用。或者您也许能够将数据从非正态转换为正态。8.7连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库转换非正态数据注意:为了获得正态而对数据进行转换应该只在别无它法的时候采用。许多时候,由于我们的失误而导致非正态(打印错误等等),这些失误往往可以纠正。所以,一定要首先逐项检查。对于处理非正态数据,Minitab具有一个十分有用的功能:Box-Cox转换StatControlChartsBox-CoxTransformationBox-Cox转换的特征:•只适用于正数•提供lambda()值,这个值告诉您如何对该组数据进行转换,其转换的形式是:Ytransformed=Y对于所显示的数据,如何进行转换?(数据在L:Minitab\Training\Minitab\Session1\Boxcox.mtw中)2220181614121086423020100偏斜频数直方图8.8连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库Lambda转换=2Ytr=Y2=0.5Ytr=Y1/2=Y=0Ytr=loge(Y)=-0.5Ytr=1/Y1/2=-1Ytr=1/Y在95%的置信区内找到。8.9连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库转换非正态数据(续)其它可以考虑的转换方法是GeorgeBox、SorenBisgaard和HowardT.Fuller(1995。版权所有。)数据类型分布类型转换比例(p)–n个单元的样本中具有缺陷的单元数次数(c)一个单元的缺陷数样本方差(s2)二项式泊松卡方Arcsin((p)1/2)(c)1/2log8.10连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库实例:电冰箱充气板能力GEA电冰箱维修服务的一项内容是“添加制冷剂;无渗漏”。要求Bloomington小组调查这一缺陷(直接影响客户)的原因。这一过程中的潜在X值是–机器–工作站顺序–班次合理分组计划考虑到了这些变量在数据收集过程中的变化。下页显示了底线数据。总共200个数据点;40个分组,每个分组5个数据点8.11连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库分析数据的第一个步骤是什么?建立一个Minitab工作表“Y”(C5)和“X”值(C1,C4,C6)的数据已经与组号(C2)和样本号(C3)一同输入Minitab。显示在C7-T和C8-T栏的可选统计信息必须按照下面显示的顺序准确输入。当您运行六个西格玛过程报告时要使用这一信息。打开工作表:L:\Minitab\training\Minitab\session1\DK2.mtw8.12连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库首先检查正态检查响应变量‘Y’(C5栏)的形状和正态。P-值0.05该组数据不是正态!现在我们怎么办?StatBasicStatDisplayDescriptiveStatistics变量:‘Y’单击‘Graphs’单击‘GraphicalSummary’...点击‘OK’两次2.00.5-1.0-2.5-4.0Mu的95%置信区间0.0-0.1-0.2中值的95%置信区间变量:Y-0.130000.84609-0.23200最高值第三个四分位数中位数第一个四分位数最低值N峰度偏度方差StDev平均值P-值:A-平方:0.030001.030290.027102.370000.47000-0.05000-0.47000-4.570002004.36825-1.485160.8632080.929090-1.0E-010.0004.916中值的95%置信区间西格玛的95%置信区间Mu的95%置信区间Anderson-Darling正态测试描述性统计数字8.13连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库从这些图解能了解什么?如何利用对数据的了解来解决非正态问题?30020010003210-1-2-3-4-5样本YGraphPlotY-“样本”GraphBoxplotY-“班次”3213210-1-2-3-4-5机器YGraphBoxplotY-“机器”数据的图形分析顺序543213210-1-2-3-4-5YGraphBoxplotY-“顺序”3213210-1-2-3-4-5偏移Y8.14连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库数据为什么是非正态?它可能是特殊原因造成的!用解决问题的系统方法确定根本原因(X值),然后纠正或隔离过程,并分析/改进/控制对“Y”因变量有最大影响的过程。–在这个例子中,Bloomington六个西格玛小组分析所得出的结论是,每次暂停之后的第一次充气是产生偏差的原因。他们对过程进行了改进之后,重新确定底线。–如果我们到此还不能确定‘第一次充气’是产生偏差的原因,可以通过将‘第一次充气’数据点与所有其它数据点分作两组,并分别分别对其进行分析,从而得出结论。8.15连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库例2:葡萄酒质量MountainVineyards是纽约的一家葡萄酒厂,正在计划参加一次国家葡萄酒品尝大赛。在大赛的准备工作中,他们已经建立了一个项目,以便对目前的红葡萄酒产品特性进行分析和改进。从7个不同的箱子选取5瓶酒(在同一年的不同时间生产的)作为样本。用于分析葡萄酒质量(Y)的全部数据包括:•地区•装瓶日期•橡木塞•味道•透明度•香气•瓶身}潜在的X值打开工作表:\Minitab\training\Minitab\session1\winery1.mtw8.16连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库首先检查正态检查响应变量-‘质量’(C6栏)的形状和正态P-值0.05–没有证据说明数据是非正态的!StatBasicStatDisplayDescriptiveStatistics变量:‘Quality’单击‘GraphicalSummary’...单击‘HistogramofData’点击‘OK’两次8.17连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库创建一个过程报告(要点综述)六个西格玛过程报告一旦您确认数据不是非正态的,创建一个“要点综述”,对过程的特征进行总结。在所出现的菜单中,在数据栏中输入分组大小和规范,之后单击Demographics输入统计信息并单击ok8.18连续过程数据分析GEApplianceCopyright1999修订版101998年12月18日企业资料网企业资料管理库、法规库、音乐库要点综述:报告的第1页这是统计信息如果是一个稳定的过程,长期ppm线在几个分组数据之后就比较平坦,这表明已经获取了足够的数据。此图显示了短期和长期数据的比较分布。这是长期和短期Z值、以及相应的ppm数工序最佳能力(ZST)不是6,但是,ZSHIFT接近1.5,说明过程控制可以接受。Actual(LT)Potential(ST)5101520ProcessPerformanceLSLActual(LT)Potential(ST)110100100010,000100,0001,000,0001234567Actual(LT)Potential(ST)PPMSigm