1制造过程的控制Subject2.8302004年春第八讲假设检验与Shewhart图2004年3月2日2在制造中应用统计学:Shewhart方法(大约1925)•所有实际的过程都有一定程度的本质随机性;•如果所有“可指定的原因”(可辨识的扰动)被消除,一个制造过程是一个随机过程;•如果只用“公共原因”(完全随机的影响)存在,一个过程是“处于统计控制下的”。W.A.Shewhart,“TheApplicationsofStatisticsasanAidinMaintainingQualityofaManufacturedProduct”,JournaloftheAmericanStatisticalAssociation,20,No..152,Dec.1925.3“在控制下”每个样本来自同样的母体4“失控”每个样本的母体分布不同5“失控”双模均值偏移+方差改变均值偏移6换而言之•一个随机–平稳过程是:–在控制下的–只服从随机波动–这些变化是本质的和“不可缩减的*”•如果过程不是平稳的,变化的程度还能够被缩减。–引起的原因能够被“指出”。*OED:.Incapableofbeingreducedtoasmallernumberoramount;thefewestorsmallestpossible.7假设检验与Shewhart图•运行图,xbar,R和S图–S的无偏估计•侦测趋势和均值偏移–带和规则–平均运行长度8•一个在控制下的过程–具有固定μ和σ的平稳过程•H0:xbar=μ(零假设)•H1:xbar≠μ(备择假设)•服从一个正态分布–数据落入期望的置信区间Shewhart假设9•给定对统计量的假设(例如均值)•没有的单个值将等于•给定如何检验假设?–是什么?–怎样恰当地检验H0?假设检验10检验•假设是正态的α是检验的显著性水平11错误•H0被拒绝当它实际上为真的时侯(第I类)–p=?•对于双边检验p=α,对于单边检验为α/2。•H0被接受当它实际上为假的时侯(第II类)–p=?•=β...β是什么?12第II类错误•假设在真实分布p(Φ^)上有一个偏移±d•评估在一个±d的偏移发生后落入接受区域的概率13第II类错误14其它假设?15总结•取显著性水平α•确定一个可接受的β–(1-β)被称为检验“效率”•如果Φ^是样本均值,增加N有何影响?16概要•假设检验与Shewhart图••运行图,运行图,xbarxbar,,RR和和SS图图––SS的无偏估计的无偏估计•侦测趋势和均值偏移–带和规则–平均运行长度17Xbar和S图•Shewhart:–画出过程的顺序平均值•Xbar图•分布?–画出顺序样本标准差•S图•分布?18数据采样与顺序平均•给定一个过程输出xi的序列:•一个大小为n的顺序样本•取在间隔⊿T•样本序号j19数据采样样本j的均值样本j的方差20组•组内的统计–xbarj,Sj•组间的统计–xbarj的平均值–xbar(j)的方差21Xbar和S图随机数据n=522全面的统计23设置图中的控制限•期望的范围•置信区间–±n标准差的区间24•如果σx已知,那么:•但是因为我们估计样本标准差图中的控制限-xbar其中:(由于C4,它是有偏的)25图中的控制限–xbar图因为对真实的样本均值方差的估计(均值的方差)是有偏的。为了消除这个偏差,对于xbar±3S控制限,我们使用:例如:26图中的控制限–SS的估计的方差可以表示为:因此得到控制限:27xbar的例子28S的例子29由运行数据中发现问题•数据的外观–置信区间–极端点的频率–趋势30Devor等的8个规则(基于置信区间)•数据位于一个带状区域的概率•基于周期•基于线性趋势•基于均值偏移31“失控”的检验•极端点–超出±3S•不可能的点–3个中2个±2σ–5个中4个±1σ–所有的点在±1σ中32“失控”的检验•始终在中心线的上方或下方–连续8个或更多•线性趋势–6个或更多的沿着一致的方向•双模数据–在±1σ之外8个连续的点33•考虑⊿μx的一个真实偏移:•要能够检测出这个偏移,我们需要多少样本?侦测均值偏移:运行图灵敏度34平均运行长度•如果⊿μx=0,数据超出±3σ的经常程度如何?35平均运行长度•如果⊿μx=+1σ,数据超出±3σ的经常程度如何?36定义•平均运行长度(arl):在我们能够预期一个限被超出前的持续点(样本)的个数=1/Pe–对于⊿μx=0arl=3/1000=333个样本–对于⊿μx=1σarl=24/1000=42个样本甚至对于一个大到1σ的均值偏移,我们需要42个样本才能发现!!!37•假设相同的⊿μ=1σ–注意⊿μ是一个绝对值•如果我们增加n,xbar的方差减小:•因而±3σ控制限靠近样本大小n对arl的影响38ARL的例子随着n增加,Pe增加,因此arl减小。39应用Shewhart作图•找一批“在控制下”的20~25点的运行数据•计算图的中心线和控制限•开始画后续的xbarj和Sj•应用8个规则,或寻找趋势,不可能事件或极端点。•如果这些发生,过程“失控”。40失控•数据不是平稳的。(μ或σ不是常量)•过程输出被一个扰动所作用。(异因)•这个扰动是可以被辨识和消除的。–趋势指出确定的类型–与已知的事件关联•换班•更换材料41图的设计•样本大小n–中心极限定理–ARL的影响?•参考数据的选择–S是在最小吗?•采样时间⊿T–采样的成本–无数据的产品–快速的现象样本大小和“滤波”vs.对变化的响应时间42限制与扩展•需要平均•正态假设•独立假设•还有什么可选的?