σσσσσσSSMC中国人民大学六西格玛质量管理研究中心六西格玛管理培训丛书(5)何晓群主编六西格玛数据分析技术何晓群编著光盘作者:陶沙苏晨辉中国人民大学出版社σσσσσσSSMC中国人民大学六西格玛质量管理研究中心3.1随机变量3.2随机变量的分布3.3随机变量的均值与方差3.4二项分布及其应用3.5泊松分布及其应用3.6正态分布及其应用3.7中心极限定理3.8各种概率分布计算的Minitab实现小组讨论与练习第3章管理中常见的几个概率分布返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心本章目标1.理解随机变量及随机变量分布的基本概念2.理解随机变量的均值及方差在管理中运用的思想3.理解二项分布的意义,掌握二项分布的应用4.掌握泊松分布的意义和应用理念5.理解正态分布与6σ的关系6.理解中心极限定理的意义7.掌握各种概率分布的计算实现返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心3.1随机变量日常生活中,生产实践中随机现象无处不在把随机现象的结果用变量来表示,就称为随机变量随机变量是随机现象表示的一种抽象,有了这种抽象,使得我们的研究更具普遍性。常用大写的字母X,Y,Z等表示随机变量,随机变量的取值常用小写字母x,y,z等表示。随机变量有离散型和连续型两大类返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心离散型随机变量定义:如果一个随机变量的取值是可数的,则称该随机变量是离散型随机变量。离散型随机变量是仅取数轴上有限个点或可列个点x1x2x3x4x5x6x7X图1公路上的汽车完好瓷砖的数目返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心连续型随机变量定义:如果一个随机变量可取数轴上某一区间内的任一值,则称该随机变量为连续型随机变量。连续型随机变量的取值可以是整个实数轴上的任一区间(a,b)(如图2)。abX图2返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心3.2随机变量的分布随机变量的取值的统计规律就是随机变量的分布。知道了一个随机变量的分布就掌握了它的关键。离散型随机变量的分布。随机变量X可能取哪些值,X取这些值的概率各是多大?连续型随机变量的分布。随机变量X在哪个区间上取值,它在任意小区间取值的概率是多少?返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心离散型随机变量的分布离散型随机变量的分布常用下面表格形式的分布列来表示:用数学表达式表示即为:P(X=xi)=pi,i=1,2,…,n离散型随机变量的分布应满足概率公理化定义的要求,即pi≥0,p1+p2+…+pn=1掷一枚骰子出现的点数及其概率就可用离散型随机变量的分布列表示:Xx1x2¨¨xnPp1p2¨¨pnX(出现的点数)123456P(所对应的概率)1/61/61/61/61/61/6返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心连续型随机变量的分布连续型随机变量X,它可取某一区间内的所有值,但它的取值不能逐一列出。我们用函数f(x)表示随机变量X的密度函数。用概率密度函数f(x)来反映随机变量X在某一区间取值的统计规律性连续型随机变量取某一固定值的概率为零在6σ管理中用连续型随机变量X常常表示产品的某种质量特性,譬如啤酒的装量、电子元件的灵敏度、电子产品的寿命等。返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心质量特性与概率密度函数在生产制造业的管理现场我们常常要抽取若干样品测定某种产品的质量特性X。如在啤酒厂今天生产的啤酒中随机抽取若干瓶量测它们的装量(ml),就可用直方图表示它们的质量特性。随着测定的数量越多,直方图就会演变成一条光滑曲线,这就是所谓的概率密度函数曲线,它就刻画出隐藏在质量特性X随机取值后面的统计规律性。这条光滑曲线f(x)告诉了我们什么信息?640645635LSLUSL640645635LSLUSL640645635LSLUSL640645635LSLUSL640645635LSLUSL640645635LSLUSL返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心概率密度曲线的几种不同情形在管理现场,不同产品的不同质量特性所表现的概率密度曲线不同,这决定了形状不同,散布不同,位置不同。正是这些不同的曲线形式决定了质量特性的差别。正态偏态形状不同散布不同位置不同返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心概率密度函数的性质概率密度曲线的纵轴在做直方图时,它是“单位长度上的频率”,由于频率的稳定性,于是用概率代替了频率,从而纵轴就演变成为“单位长度上的概率”,这也是为什么把密度曲线称为概率密度曲线的缘由。连续型随机变量的密度函数f(x)具有如下性质:1.2.3.其中表示质量特性值在区间(a,b)中的概率。这里涉及到积分概念,不必感到忧虑,因为积分计算不是重点。0)x(f1dx)x(f)bXa(Pdx)x(fba)bXa(Pf(x))bXa(Pxab返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心3.3随机变量的均值与方差前面第1章中看到的具体数据可以用均值和方差来分别描述数据的集中趋势和离种趋势,随机变量也有均值和方差的概念,用它们分别表示分布的中心位置和分散程度。在掷骰子例子中,每次掷下后出现的点数不仅相同,平均出现的点数是多少?在啤酒的装量测定中,每瓶啤酒的装量严格来说都不一样,它们的平均装量是多少?这就是随机变量的均值问题。相对均值而言,每次掷骰子出现的结果都在它的左右,那么平均的偏差有多大?假如一批瓶装啤酒的平均装量是640ml,各瓶偏离640ml的多少都不一样,它们平均偏离是多少?这就是随机变量的方差及标准差问题。返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心随机变量均值与方差的理解生产或服务过程中的差别是难以避免的。生产过程中由于种种随机因素的影响,使得我们无法避免变异的产生。在扔飞镖时,谁都想发发命中靶心,可遗憾的事常常发生!计算多次投标的平均结果就是求均值,计算相对均值的离散程度就是计算方差。5432154321如何理解上面两图的结果返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心如何理解直方图直方图的上下公差限的总宽度是对生产能力的一个设计。在大部分时间里,生产运行的结果就在这一区间上发生。譬如,根据啤酒装量的抽检数据建立了如下的直方图T废品废品期望值640返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心直方图的解释图形纵轴表示在某一范围内量测到的数目,公差限以内就是合格品,出了公差限就是废品。上图中的T值就是均值(640ml),也即数学期望。这是一个理想值,也就是说,设计人员期望每瓶啤酒的装量正好是640ml,然而由于种种说不清道不明的原因的影响,不可能,也不存在正好的640ml,于是只要在上下公差限之内的都是合格品,出了上下公差限的就是废品。假如总共抽检了300瓶啤酒,有10瓶低于下规格限LSL,15瓶超过了上规格限USL,因此,这批产品的废品率是25/300=0.083合格率是1-0.083=0.917,即合格率为91.7%返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心实际与理想的差距我们应该意识到,一个生产过程内在的精度不是由设计人员及设计方案所规定的。就像我们扔飞镖每一发都想命中靶心,但往往事与愿违。提高质量的核心就是优化流程,减小变异,提高生产流程内在的精度。这是6σ管理的精髓。返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心6σ管理的目标是缩小实际与理想的差距T是目标值,期望值,设计值。然而常常在生产实际中,生产实际的中心值会发生变化,偏离目标值。这也说明实际生产结果的中心值是独立于设计值规定的目标值(T)的。6σ管理的目的就在于优化流程,减小变异,使实际生产结果的中心值尽可能与设计的目标值重合。xLSLUSLT返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心均值的计算公式离散型随机变量的数学期望(均值)连续型随机变量的数学期望xf(x)dxE(X)μiiipxXEμ)(返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心均值计算举例例3-1.掷骰子试验中出现的点数用随机变量X表示,随机变量X的均值(数学期望)为即掷骰子出现的结果很不一样,但它们的平均取值是3.5例3-2.电子产品首次发生故障(需要维修)的时间通常遵从指数分布。譬如某种品牌的手机首次发生故障的时间T(单位:小时)遵从指数分布问计算这种品牌的手机首次需要维修的平均时间是多少小时。解:即这种品牌的手机首次需要维修的平均时间是10000小时。3.561661561461361261161iiipxE(X))x(f0001x.00001e.00x00x10000(0.0001)dx0.0001xexf(x)dxE(T)100.0001x0返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心方差的计算公式离散型随机变量的方差连续型随机变量的方差由于方差不能带单位,故用标准差来刻画随机变量相对均值的离散程度niipE(x)][xD(X)σ22f(x)dxE(x)][xD(X)σ22D(X)σσ2返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心方差计算举例例3-3.掷骰子问题中,出现点数的平均值是3.5,每次取值相对于均值的离散程度是多大?解:即相对均值平均偏离1.71点。可以证明,指数分布的均值与标准差相等,即例3-2中某种品牌的手机首次需要维修的平均时间是10000小时,即标准差σ也为10000小时。标准差如此之大有点不好理解。然而,凡是遵从指数分布的产品寿命问题就是这样,也即你的期望越高,标准差必然就大。实际中,也确有同一品牌的手机有的刚刚使用就遇到故障,而有的用了好几年也不需修理。613.5)(6613.5)(2613.5)(1D(X)σ22222.92)/62.51.50.50.51.5(2.52222221.712.92σλ1D(X)E(X)返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心3.4二项分布及其应用二项分布的概率计算公式:其中是从n个不同元素中取出x个的组合数,计算公式为:二项分布的概率计算公式中有两个重要的参数,一个是n,一个是p,故通常把二项分布记为B(n,p)n,0,1,2,xp)(1pxnx)P(Xxnxx)!(nx!n!xn返回目录xnσσσσσσSSMC中国人民大学六西格玛质量管理研究中心一个产品检验的例子例3-4.已知某生产流程生产的产品中有10%是有缺陷的,而该生产流程生产的产品是否有缺陷完全是随机的,现在随机选取5个产品,求其中有2个产品有缺陷的概率是多大?解:这是一个符合二项分布情形的问题。设X为抽取的5个产品中有缺陷的产品的个数,则X是遵从二项分布B(5,0.1)的随机变量。某一产品有缺陷的概率为p=0.1,n=5。择所要求的概率为:类似可以计算出在抽取的5件产品中有0、1、3、4、5个产品有缺陷的概率分别为)2X(Pnxxnxp)(1p520.072900.90.125232805.0)1X(P,59049.0)0X(P00001.0)5X(P,00045.0)4X(P,0081.0)3X(P返回目录σσσσσσSSMC中国人民大学六西格玛质量管理研究中心二项分布的均值与标准差可以证明,如果随机变量X~B(n,p),它们的均值、方差、标准差分别为:在例3-4中,二项分布B(5,0.