5.1样本容量GEAppliancesCopyright1999修订版101999年1月11日第5部分:样本容量与风险5.2样本容量GEAppliancesCopyright1999修订版101999年1月11日目的:目标:1.说明需要确定合理样本数量的输入量(α风险、β风险、标准差s、精确度d)。2.使用输入量确定比较两个总体所需的合理样本数量。本章主要目的是为连续数据类项目确定合理的样本容量。第5部分:样本容量与风险5.3样本容量GEAppliancesCopyright1999修订版101999年1月11日总体和样本的区别总体-所有相关项目。举例-1998年5月在Decatur生产的16立方英尺冰箱。样本-代表总体的数据子集。举例-1998年5月在Decatur生产的120台16立方英尺冰箱。举例:XXXXXXXXXXXXXXXXXXXXXXXXX此矩阵图代表25个X的总体。划圈的X代表总体中的6个X样本。5.4样本容量GEAppliancesCopyright1999修订版101999年1月11日为什么仅使用样本而非整个总体?•减少时间和成本•估计难于捕获的总体(合理的样本数量可以提供总体的精确估计)何时应使用样本?•确定工序底线•控制工序的变化如何确定样本的容量?•采用样本容量表•选择样本数量提供一个特定长度的置信区间。选择样本容量需要在置信度与成本之间平衡。样本....…为何使用?5.5样本容量GEAppliancesCopyright1999修订版101999年1月11日Somepossiblesolutions:1.仅检验一个部件。如果同时检验两个部件并得到不同的结果,那么你将不知道哪一结果真实。2.检验三个样本,如果先检验的两个结果不一致,增加第三次检验作为参考。3.通常采用30个部件进行工序能力的研究,主要目的是估测标准差。4.当使用计算机模拟时,使用的样本数量超过1,000,000。这些观测成本较低,因此很容易采集到大量数据。我们应采用多大的样本容量?没有哪种经验性的规则能够放之四海而皆准,而要根据具体情况确定样本容量。特定情况是:•固有变差(s)•要求的精确度(d)•要求的置信度(如95%)•成本(时间和资金)本章将介绍确定样本容量的方法对样本容量的一点想法5.6样本容量GEAppliancesCopyright1999修订版101999年1月11日风险-当H0为真时拒绝Ho--有时称为厂商风险。风险-当H0为伪时没能拒绝Ho--有时称为消费者风险。真值决定Ho,=Ha,不=Ho,=Ha,不=1类错误2类错误正确决定正确决定1=功效发现差异-的机率和风险5.7样本容量GEAppliancesCopyright1999修订版101999年1月11日使用样本容量表需要了解什么?工序的标准差两个总体平均值的实际差异。样本平均值的差值除以标准差。事物相同时却被认为提出不同(拒绝“合格”部件)。产生1类错误的风险(一般为5%),也称为厂商风险。事物不同时却被认为相同(接受“有缺陷”部件)。产生二类错误的风险,(一般为10%)。也称为消费者风险。1-β。发现差异的机率。术语:sd检验敏感度(ds)1类错误(α错误)α风险2类错误(β错误)β风险功效5.8样本容量GEAppliancesCopyright1999修订版101999年1月11日随着样本容量的增加,实际的总体参数估算值精确度会提高样本平均值的分布少量样本(低n,高sx-bar)多个样本(高n,低sx-bar)较大的样本容量将减少估算值的误差5.9样本容量GEAppliancesCopyright1999修订版101999年1月11日d的定义小sds的值较大可以提供确定差异的最大能力d大s样本平均值之间的距离在下列情况下,很容易看出差异:•d大•s小5.10样本容量GEAppliancesCopyright1999修订版101999年1月11日1.51.41.31.21.11.00.90.80.70.60.50.40.30.20.11.00.90.80.70.60.50.40.30.20.10.0发现差异的机率灵敏系数样本容量(n)增加,发现差异的机率也提高ds样本容量(n)对检验机率的影响5.11样本容量GEAppliancesCopyright1999修订版101999年1月11日发现差异的机率–随差异d的增加而增大–随标准差s的减小而增大1.51.41.31.21.11.00.90.80.70.60.50.40.30.20.11.00.90.80.70.60.50.40.30.20.10.0发现差异的机率灵敏系数ds检验灵敏度(d/s)对检验机率的影响5.12样本容量GEAppliancesCopyright1999修订版101999年1月11日基本样本容量表仅适用于连续数据Copyright1995SixSigmaAcademy,Inc.20%10%5%1%20%10%5%1%20%10%5%1%20%10%5%1%20%10%5%1%0.222532842865130942854178939252565091958474489112020.31001461902891371902413501742342894082603313965340.4568210716377107135197981311622301461862233000.53653691044969871266384104147931191431920.625364872344860884458721026583991340.7182735532535446432435375486173980.8142127411927344925334157364656750.9111621321521273919263245293744591.091317261217223216212637233036481.171114221014182613172130192529401.2691218912152211151826162125331.358101571013199121522141821281.4579136911168111319121518251.546812581014791216101316211.6457105781268101491214191.73569467115791381012171.8345845710568117911151.924573569467106810132.0234734584569679122.1234634574568578112.2234534473458567102.322352346345746792.422352345345645682.512342335334645682.612342335234534572.712242234234534572.812232234233534562.912231234223434463.011231224223433453.111231223223423453.211231223223423353.311221223122323343.411121123122323343.511121123122322343.611121122122322343.711121122122322343.811121112112322233.911121112112222234.01112111211221223ds通常使用用于计算n的方程式请参见附录。5.13样本容量GEAppliancesCopyright1999修订版101999年1月11日要使用图表,我们必须知道d,s,,和例:您的任务是改善冰箱把手的塑料盖直径。•历史数据的平均值(X)是2”。•目标直径是1.92”。•这一过程的s0.2。您认为,将温度从250oF升至310oF可使工序回到目标平均值。采用5%的和10%的时,需要多少样本才可发现变化?ddsn使用图表举例5.14样本容量GEAppliancesCopyright1999修订版101999年1月11日1.一个话务员接完一个电话订购的平均时间是5.6分钟,这个过程的历史标准差是0.8分钟。你的任务是找到一种方法,将订购完成时间降低到4.0分钟。假定α风险为5%、β风险为10%,需要有多少样本才能恰当地估算是否发生了变化。2.假设s是1.6,n要求是何值??3.使用问题1中的初值,要求将呼叫通话时间降低0.32分钟以达到5.28分钟的平均值,这种情况下需要多少样本?要发现较小的变化,需要更多的样本样本容量练习5.15样本容量GEAppliancesCopyright1999修订版101999年1月11日单样本置信区间x是样本平均值n是样本容量t(n-1,/2)来自t-表,自由度为n-1,每个尾为/2s是样本标准差双样本置信区间x1是第一组样本的平均值x2是第二组样本的平均值n1是第一组样本的平均值n2是第二组样本的平均值t(n1+n2-2,/2)来自t-表,自由度为n1+n2-2,每尾为/2sp是合并的标准差增加样本容量可减小置信区间置信区间与样本容量(n)的平方根成反比样本容量对置信区间的影响nstx)n(1212211121nnstxxp)nn(5.16样本容量GEAppliancesCopyright1999修订版101999年1月11日您的小组在第一部分已经获取导弹发射器的基线值,这个基线值的获得不应有虚假成分。以此结果为基础,可以清楚地知道你的现状和目标之间的差距(规范要求导弹发射距离为55+/-6英尺)。在分析阶段,我们正在寻找潜在的关键少数“Xs”。现在,我们开始控制过程以便集中搜寻。对于这个练习,我们仅使用黄色导弹。过程:1.以小组形式决定,希望通过导弹发射器上的哪一个变量X的变化来改进Z值。(注意:不允许改变橡皮圈的方向或扭转橡皮圈!)2.确定适当的样本容量(样本数容表,第5部分)。3.使导弹发射器产生一个变化,并在初始设置和新设置下发射合理数量的导弹。4.在Minitab中记录“Y”结果。将数据制图,运行基本统计。5.在Minitab中,运行‘方差齐性”检验,确定标准差是否发生变化,运行双样本t-检验确定均值是否发生变化。6.变化是否具有实际重要性?7.计算原距离与新距离之间差值的双样本置信区间,并计算变化后新距离平均值的单样本置信区间。课堂练习:控制导弹发射器5.17样本容量GEAppliancesCopyright1999修订版101999年1月11日小组__________基准值:n=___平均值=____标准差=___1.您改变了哪个X变量?__________________设置是什么?旧________新___________2.样本容量确定。d=_____s=______d/s=______=_____=______n=________3.收集数据4.改变前:n=____平均值=____s=_____改变后:n=____平均值=____s=_____5.波动性的变化是否具有统计显著性?6.平均值的变化是否具有统计显著性?7.这些变化是否具有现实重要性?_________________8.平均值变化的置信区间是什么?_____________9.新设置下平均距离的置信区间是什么?____________课堂练习:控制导弹发射器5.18样本容量GEAppliancesCopyright1999修订版101999年1月11日1.d是需要检验的各平均值之间的差异大小。2检验灵敏度为d/s(用于连续数据样本容量表中)3.Alpha(是不存在差异时而声称存在差异的机率。4.Beta()是未发现重要差异的机率。5.发现差异的机率随以下方面而增加:•增加样本容量•增加平均值间的差异•减小标准变差5.增加样本容量可减小置信区间的长度。关键概念:第5部分样