六西格玛培训课件-500强外企内部培训课程(22)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

假设检验介绍绿带六西格玛DMAIC原理目的•将假设检验作为一种关键的统计概念来介绍其基本概念•了解假设检验如何为分析统计数据提供基本框架•将假设检验与即将讨论的主题联系起来流程从许多琐碎的变量X中“过滤”出少数重要的几个流程Y=f(x1,x2,x3,x4,...xn)Y在一段时间中的绩效Y的差异过程图初始能力评估FMEA减少“错误输入”引起的差异及其影响因果关系矩阵FMEA多变量多变量研究有助于确立Y和关键X之间的联系x1,x7,x18,x22,x31,x44,x57多变量分析确认噪声变量,减少实验设计中的XY=f(x7,x22,x57)实验设计确定关键X及其与Y的关系3020100555045ObservationNumberIndividualValueIChartforChart11X=50.353.0SL=54.21-3.0SL=46.50对关键X进行适当控制实际差异测量差异再现性(员工/方法)重复性(设备)我们从“Y”开始:}亲爱的艾比:你在你的专栏中写到妇女的怀孕期为266天。是谁这么说的?我怀孕的时间是10个月零5天(共305天),这是毫无疑问的,因为我知道受孕的确切日子。我的丈夫在海军供职,我不可能在其他时间受孕,因为我每次见他的时间只有一天,在孩子出生以前我没有再见过他。我不酗酒,也不在外面闲荡,这个孩子不可能不是我丈夫的。请书面声明收回266天怀孕期的说法,否则我会有大麻烦!-圣地亚哥的一名读者你会对她说什么?对她的丈夫又会说什么?250260240230270280290300220平均值在圣地亚哥感到担忧分析问题•平均怀孕时间是266天。•如果她告知怀孕时间是260天,你会怀疑吗?•如果她告知怀孕时间是400天,你会怀疑吗?•在哪一点你会开始产生怀疑?请标出长期以来,医生们已经了解到自然分娩有以下的特点...平均值=_____天标准差=_____天26616背景+1(观测值的60-75%)+2(观测值的90-98%)+3(观测值的99-100%)经验性规则-第1周回顾假设检验概念假设检验允许我们…•正确处理不确定性•最小化主观性•质疑假设•防止遗漏重要的信息•控制判断失误的风险实际问题统计问题统计解决方案实际解决方案yfxxxk(,,...,)12整体方法“有一天,统计学的思维方式将像读写能力一样成为现代公民所必需的能力。”H.G.威尔斯Circa1925年假设检验•H0:零假设•Ha:备择假设•p值:概率值•逻辑:假设没有差异检查一下,数据是否提供存在差异的证据H0:年龄不是公司聘用员工的因素Ha:年龄是公司聘用员工的因素H0:产品组合在所有欧洲国家都是一样的Ha:产品组合在一些国家是不同的H0:货运公司A准时送货=货运公司B准时送货Ha:货运公司A准时送货≠货运公司B准时送货H0=_______________________________________Ha=_______________________________________假设检验实际问题假设检验统计问题H0:组A均值=组B均值Ha:组A均值≠组B均值H0:线的斜率是0Ha:线的斜率不是0H0:组A方差=组B方差Ha:组A方差≠组B方差H0:变量X独立于变量YHa:变量X不独立于变量Y假设检验问题•将以下情况转变为统计假设(H0和Ha)。您想回答什么问题?一种新产品使用AAA没有用过的原材料。有5个可能的供应商。准时交货是关键的质量特性之一。目标是99%按时交货。假设检验问题•将以下情况转变为统计假设(H0和Ha)。您想回答什么问题?已做出改变来缩短专利批准过程的周期。这是否影响了专利申请的数量?假设检验问题•将以下情况转变为统计假设(H0和Ha)。您想回答什么问题?我们的客户在账单支付方面显示出很大的差异。新的政策向15天内支付的客户提供奖励。我们希望这会减少差异。假设检验的基本原理•根据现有的知识提出假设来解释未知的事物(H0)这种假设经常和我们希望说明的事物相反•假设H0为真•收集数据•在数据中寻找令人信服的证据来支持或反驳H0如果零假设被推翻,我们就拒绝该假设并接受备择假设(Ha)假设和判断风险•我们用已知的风险程度和置信程度来检验一个假设•要确定合适的样本大小,必须预先明确:可接受判断风险的大小检验敏感性•考虑实现一个合理抽样方案所面临的成本、时间和可获资源等实际限制提出一个“零假设”(H0)收集证据(现实样本)判断:证据说明了什么?拒绝H0?或接受H0?假设和判断风险假设检验和饮用水安全•假设零假设(H0)为真类似于假设我们的饮用水是安全的•如果数据(水质检验)表明有污染的可能,只需将水煮沸或饮用瓶装水(拒绝H0)•除非“无影响”的概率太小,否则我们不会认为我们的实验有影响在判断是否拒绝时,我们可能出现两种判断失误之一你的判断实际情况H0为真H0为假第1类失误风险)第2类失误风险)正确正确拒绝H0判断失误接受H0水质检验结果饮用水安全实际情况饮用水安全饮用水受到污染第1类失误风险)第2类失误风险)正确正确饮用水受到污染后果:________________________后果:_______________________________________示例:饮用水安全假设检验:判断•收集数据•计算检验统计数据信号对噪声比率的某种形式,如:Z值或t值•确定p值如果p值很小(如:0.05),拒绝H0•作出判断统计显著性实际显著性信号对噪声比率•信号是我们试图探测的变化或差异•噪声是系统内在的差异性•考虑比率•如果比率很小–实际没有信号或差异–只有噪声很大–信号或差异比噪声明显–这是“真实的”•如果信号对噪声比率足够大,我们认为结果是真实的信号示例–信号对噪声•我们如何知道是否已将收音机调好?我们听到清楚的说话声或音乐声(信号),而未注意任何干扰(噪声)•我们如何知道过程是否以目标为中心?信号:过程平均值和目标间的差值噪声:以过程差异为依据信号对噪声较大的信号较容易探测到较小的信号较难探测到较小的噪声使得探测信号较为容易较大的噪声使得探测信号较为困难噪声信号信号对噪声的图表阐释噪声较小均值变化:从0到5容易探测到信号(组间差异)-50510均值=0均值均值=1均值=2均值=3均值=4均值=5信号对噪声的图表阐释噪声较大均值变化:从0到5较难探测到小信号-50510均值均值=0均值=1均值=2均值=3均值=4均值=5•p值:H0为真时,观测结果可能发生的概率•以假设或实际分布(正态、t分布、X2检验、F分布等)为基础的p值•p值是所有数值统计检验的组成部分p值较小信号对噪声比率较大拒绝H0p值较大信号对噪声比率较小接受H0p值p值极为重要记住….如果p较小,必须拒绝H0!假设和判断风险P必须多小?视情况而定!•我们希望这些观测值随机出现的机率不超过10%(=.10)•百分之五更合适(=.05)•百分之一非常好(=.01)•这个水平是以“无差异”假设和某种参考分布为基础的•但是,这由兴趣和后果决定在大多数情况下,我们将使用=.051234567891011121314151617181920初步认识p值•对于一枚“均衡”的硬币,我们预计投掷的结果有50%的机率为正面•投掷20次后,你是否会怀疑硬币的均衡性…–有人11次掷到正面?–有人19次掷到正面?•你什么时候会产生怀疑?在下面划线初步认识p值•投掷20个硬币并计算掷得正面的次数,得到以下的分布图:1234567891011121314151617181920假设检验和置信区间的比较•置信区间是与假设检验相关的概念假设检验显示是否有统计差异置信区间向你提供差异(如有)的估计值它们将过程的差异性考虑在内提供更多有关结论不确定性的信息在概念上与控制图上的控制限值类似一般和p值一起成为Minitab的输出的组成部分将假设检验与DMAIC联系起来DMAIC过程改进•验证关键输入•优化关键输入过程分析•完成失效模式分析•进行多变量分析•明确潜在的关键输入•制定下一阶段的方案过程控制•实施控制方案•验证长期能力•持续改进过程定义•范围和界限•定义缺陷•小组任务书和小组领导人•估计经济影响•领导层批准过程测量•绘制过程图,确认输入和输出•因果关系矩阵•确定测量系统能力•确定过程能力基期状况统计工具方法框架•目的提供使用统计工具的有组织的方法–“你越了解一个榔头…任何事就越像一根钉子”画出统计思维的总图提供一个将Minitab与工具相联系的有组织的方法减少混淆和焦虑–“回归、方差分析和X2检验!”•根据你拥有的数据类型决定使用的工具连续型离散型分析方法框架X数据单个变量X多个变量XY数据单个变量Y多个变量Y多变量分析(注:这不同于多变量图)X数据离散型连续型Y数据离散型连续型X2检验逻辑回归t检验方差分析回归X数据离散型连续型Y数据离散型连续型多重回归逻辑回归多重中位数检验2,3,4向...方差分析逻辑回归多重分析方法框架传授内容X数据单个变量X多个变量XY数据单个变量Y多个变量Y多变量分析(注:这不同于多变量图)X数据离散型连续型Y数据离散型连续型X2检验逻辑回归t检验方差分析回归X数据离散型连续型Y数据离散型连续型多重回归逻辑回归多重中位数检验2,3,4向...多变量分析逻辑回归多重评估X、Y关系的工具Y1Y2YTargetCBAABCR51025S805075xy数据描述假设检验离散型X离散型YH0:因子相互独立X2检验相对于目标的连续型YH0:=目标单样本t检验2个水平的离散型X,连续型YH0:1=2双样本t检验3个以上水平的离散型X,连续型YH0:1=…=k方差分析连续型X;连续型YH0:斜率=0回归一名主管想知道两个数据输入操作员输入其定单信息所花的时间是否有很大差异Y是什么?______________数据类型?_______________X是什么?______________数据类型?_______________你将使用哪种类型的工具?________________________设想情况1人力资源部想看一下年龄(年长和年轻)与是否受聘之间是否有联系Y是什么?______________数据类型?_______________X是什么?______________数据类型?_______________你将使用哪种类型的工具?_________________________设想情况2一个小组想看一下花在电视广告上的费用与消费性办公用品的销量之间是否有关系Y是什么?______________数据类型?_______________X是什么?______________数据类型?_______________你将使用哪种类型的工具?_________________________设想情况3练习–市场份额•回到市场份额的案例研究。回忆一下,变量X包括:地点-国家中的区域(东、西、南、中西)学历(本科或研究生)代表入行时间(年)密度(低、中、高)红色产品的潜在客户数目•Y是2001年的市场份额•列出每个变量X的H0和Ha,并找出合适的统计工具来解决问题介绍了假设检验的基本概念了解了假设检验如何提供分析统计数据的基本框架将假设检验与DMAIC流程中即将出现的主题联系起来小结假设检验术语1.零假设(H0)–表明无改变或差异假设H0为真,直至可以拿出充分的证据来推翻该假设2.第1类错误-当H0实际为真时却加以拒绝,或在实际没有差异时认为有差异3.风险-产生第1类错误的最大风险或概率。这个概率总是大于零,通常设为5%研究人员确定拒绝H0可接受的最高风险水平4.显著性水平–与风险相同5.备择假设(Ha)–表明有改变或差异如果拒绝H0,表明该假设为真6.第2类错误-当H0实际为假时没有加以拒绝,或在实际有差异时认为没有差异术语(续)7.风险-发生第2类错误,或忽视问题的

1 / 47
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功