质量管理统计方法第一章质量数据的描述1.1质量数据及其分布1.2总体、样本与统计量1.3参数估计1.4假设检验1.5过程能力指数习题一31.1.1过程与过程控制系统一个产品的制造常常可以分解为若干个过程。这里讲的过程是指制造过程的一个工段、一道工序、一项操作等,是将人、设备、材料、方法、环境等五项输入资源按一定要求组合起来,转化为中间产品、半成品、零部件等输出的活动。第1节:质量数据及其分布一个好的质量管理系统不仅是若干过程的总和,而且是相互协调与相容的。如果在过程中和过程的输出处增加信息的收集,并利用统计方法对收集到的信息进行加工,通过统计处理,发现问题,寻找原因,指出进一步应采取的行动,再反馈给过程的输入,调整过程的某些输入资源,以保证过程工作正常,这样一串处理称为反馈系统。一个过程增加了反馈系统就称为过程控制系统。质量管理就是建立在“所有工作都是通过过程来完成的”基础上的。5过程控制系统:61.1.2质量特性的分布质量特性:产品满足人们某种需要所具备的属性和特征。质量特性包括直接质量特性和代用质量特性。产品的质量可以用产品的质量特性X来表示。在质量管理中遇到的质量特性的观察值(也称为数据)通常是定量的,即X的取值可以用一定的数量单位来度量的,它们又可以分为两类:连续的(计量数据)离散的(计数数据)(1)计量数据计量数据取值可以通过某种量具、仪器等的测定得到,它们可以取某一区间中的一切值。例如轴的直径,钢材的强度,产品的寿命等都属于计量数据。(2)计数数据计数数据取值是通过数数的方法获得的,它们往往只能取非负整数。例如一批产品中的不合格品的个数,铸件上的气泡个数等都属于计数数据。例如:我们一个接一个地去测量机械轴的直径x,并不断地把测量值放在x轴上,差异便会显示出来,如下图:连续分布用概率密度函数表示一般说来,只要p(x)非负,且与x轴所夹面积为1,都可称p(x)为概率密度函数。计算均值(数学期望),它表明分布的中心位置:xxpxXEd)()(计算方差,它表明分布的分散程度:计算标准差,它也表明分布的分散程度,但其单位与质量特性X、均值E(x)相同:计算概率,质量特性X位于区间[a,b]内的概率为:质量特性X取一点的概率为0,即由此可知22()()()()dVarXEXEXxEXpxx()XVarX()()bapaXbpxdx()()0baPXapxdx()()PXbPXb离散分布用分布表示12kpppXP1x2xnx该离散分布的均值、方差、标准差分别为:1()niiiEXxp22211()()()nniiiiiiVarXxEXpxpEX()XVarX1p2pnp121.1.3质量管理中的常用分布一、正态分布当收集到的数据为计量数据时,表明对应的质量特性X是一个连续型随机变量。在质量管理中最常见的连续型随机变量的分布便是正态分布,其概率密度函数为21xp222xe该密度函数呈对称钟形曲线形状定理1.1.1若则由该定理可知:2(,)XN(0,1)XUN()()()baPaXb()()bPXb()1()aPXa二、对数正态分布对数正态分布是偏态分布,一些产品的寿命、故障的修理时间、化学变化的响应时间等都服从对数正态分布,其概率密度函数如图:2(,)LN22(ln)21(),02xpxexx服从对数正态分布的质量特性X有如下特点:X是仅取正实数的随机变量,它的大量取值集中在左边,少量取值在右边且很分散。X取对数后Y=lnX服从正态分布N(),这是对数正态分布最重要的特征。是X的对数均值,是X的对数方差。X的均值与方差分别为:2(,)LN2,(ln)EX2(ln)VarX222()exp(),()()exp()12EXVarXEXe,0,()0,0.0,~.xXxpxxXXE定义设连续型随机变量的概率密度为其中为常数则称服从参数为的指数分布。记为服从指数分布的质量特性仅取非负实数,是严重偏态分布。三、指数分布——ExponentialDistributionxxx)1-e,0,()(Xx)=p(x)0,0.xxPx它的分布函数F(有一个简洁形式:F特别在产品可靠性中,有重要的应用,如一些元器件的寿命。指数分布的均值、方差、标准差分别为:1X四、二项分布二项分布即重复n次的伯努利试验。在每次试验中只有种可能的结果,而且是互相对立的,是独立的,如果事件发生的概率是P,则不发生的概率q=1-ppnpXVarnpXE1,()np(1)Xp,1,0,1kppknkXPknk二点分布特例,当n=1的二项分布称为二点分布,它的概率函数即(分布列)为:1()(1),0,1xxPXxppxXkp1x1p2xp.1,ppXVarpXE五、泊松分布,e{},0,1,2,,0!,~().kXPXkkkXXP若随机变量取一切非负整数值且概率分布为:则称服从参数为的泊松分布记为~π().X说明:泊松分布现记为六、超几何分布—,0,1,2,,knkMNMnNCCPXkknC,.,NMnXX有件产品其中有件次品今从中任取件设表示取到的次品数,则的分布律为:,nNkMX其中:。超几称服从何分布。说明:超几何分布可由二项分布近似计算Hypergeometricdistribution~(,,)XHnNM251.1.4分布的特征数一、均值与方差的运算性质1、常数c的均值仍然为c,即2、线性函数的均值与方差分别为:3、随机变量和或差的均值等于均值的和或差,即()0,()0EcVarcaXb2()(),()()EaXbaEXbVaXbaVarX()()()EXYEXEY4.若随机变量X与Y相互独立(指X的取值与Y的取值互不影响),则5.若随机变量X与Y相互独立,则其中性质3、4、5可以推广到三个或三个以上随机变量场合,但性质4与5仍然要求各随机变量相互独立。()()()VarXYVarXVarY()()()EXYEXEY..,rvXY对于与假定下列各种函数的期望存在.,2,3,.kkcEXEXkXk称的阶中心矩,,1,2,.klEXYklXYkl称为和的阶混合原点矩1.定义,,1,2,.klEXEXYEYklXYkl称为和的阶混合中心矩二、矩,1,2,,.kkmEXkXkk称为的阶原点矩简称阶矩||,1,2,.kEXkXk称为的阶绝对原点矩||,1,2,.kEXEXkXk称的阶绝对中心矩28三、变异系数为了比较不同指标的波动,需要排除数据量纲的影响,因而常采用变异系数,它是样本标准差与样本均值的比,常用表示,即vCxsCv/29例:某厂生产两种不同规格的轴,现在从每一种规格的轴中各取10根,测得它们的直径的均值与标准差分别为:产品A均值为105mm,样本标准差为1.05mm产品B均值为1500mm,样本标准差为10.5mm若从它们的样本标准差看产品B的直径的波动大,然而产品B的直径也大,从而其测量误差也大,因而直接看样本标准差就难以比较,为此我们计算各自的变异系数分别为:产品A的变异系数为1.05/105=1%产品B的变异系数为10.5/1500=0.7%由此可见产品B的直径的波动比产品A的小。..,:01,:rvXFxF设的分布函数为若数满足...FrvXPDF上分则称为的从的位图像理解数2,:XPDFfxT当的为偶函数时若数满足2...TrvX双则称为的上分位数2分位数侧:XPDFfx当的不对称时分位数常对连续分布来定义,连续分布函数F(x)的分位数是指满足如下等式的解:(01)()(x)PXxF或x四、分位数第2节总体、样本与统计量1.2.1总体与样本一、总体与个体研究对象的全体称为总体,把构成总体的每个成员称为个体。统计学关心的是研究对象(即个体)的某个数量指标,那么将每个研究对象的数量指标x称为个体,指标值的全体看作一个总体。二、样本从总体中按一定规则抽出个体的行为称为抽样,所抽出的个体就是样本,样本所含个体的数量就是样本容量.样本从总体中按一定规则抽出个体的行为称为抽样,所抽出的个体就是样本,样本所含个体的数量就是样本容量.总体分布为当样本容量为1时的样本分布.样本分布与总体分布,抽样方式,样本容量等有关.设总体X的分布为F,从中抽取一个容量为n的样本,若满足以下两个条件,则称为简单随机样本,其抽样称为简单随机抽样:12,,,nXXXX:与总体有相同代表性的分布;12,,,nXXX:相独立性互独立;简单随机样本的样本分布由总体分布决定.11,,,,.iidiidnnXXFxXXX简记为:或1.1.2从样本去认识总体频数频率表与直方图正态概率图实践中,为了研究随机现象,首要的工作是收集数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。正态分布与频率直方图数据整理:将数据分组计算各组频数作频率分布表作频率直方图计算样本特征值:样本均值、样本方差等例15为对某小麦杂交组合F2代的株高X进行研究,抽取容量为100的样本,测试的原始数据记录如下(单位:厘米),试根据以上数据,画出它的频率直方图,并以此说明随机变量X的分布状况。数据的简单处理是以一种直观明了的方式加工数据,它包括两个方面:数据整理、计算样本特征值。8788111917370929810594868186918983999198110989790839288968675928395869410299891049494929692104928595888794928610288759090801038976909177849182949910291969494908384918795858880838169958097928086919410296109918080数据整理的步骤:1.搜寻数据的最小、最大值m与M,求极差:M-m;2.根据样本容量n的大小确定分组数k;根据极差与组数确定组距(一般采用等距分组,组限一般不包含右端点);3.统计组频数,计算组频率、累计频率、组高等,制作频率分布表;4.画出频率直方图:以组距为底,组高hi为高做小矩形。iihfx组序区间范围频数fj频率Wj=fj/n累计频率Fj1[67.5,72.5)20.020.022[72.5,77.5)50.050.073[77.5,82.5)100.100.174[82.5,87.5)180.180.355[87.5,92.5)300.30.656[92.5,97.5)180.180.837[97.5,12.5)100.10.938[102.5,107.5)40.040.979[107.5,112.5)30.031.00本例中的频率分布表:使用Ecell、Matlab、SPSS等工具画出频率直方图:从频率直方图可看到:靠近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分布趋势(随机变量分布状况的最粗略的信息)。用平滑的曲线连接拟合直方图,其图形近似于正态曲线。1.2.3统计量1.统计量的定义121212,,,,(,,,),,,,,.nnnXXXXgXXXXXXgg设是来自总体的一个样本是的函数若中不含未知参数则称是一个显然统计量是一个随统计量机变量.12121212,,,,,,,(,,,)(,,,).nnnnxxxXXXgxxxgXXX设是相应于样本的样本值则称是的观察值,.统计量只与样本有关而与样本分布或其未知参数无关2.几个常用统计量