直方图一、直方图的概念直方图是频数直方图的简称,它是质量管理“老七种工具”之一。由于它是在平面直角坐标系中用一系列宽度相等、高度不等的矩形来表示数据分布状况的图形,因而被形象地称之为“直方图”。在直方图中以矩形的宽度表示数据范围的间隔,而以矩形的高度表示给定间隔内数据出现的频数,变化的高度形态表示数据的分布情况。有些国家将直方图称为柱状图。二、直方图的作用统计学的核心部分是频数分布的分析,通过直方图收集的数据就能分类到不同的数值或间隔中。在生产实际中,由于多种因素的影响,导致即使在相同的工艺条件下,加工出来的产品质量也不可能完全相同,而是在一定范围内波动。直方图就是用以分析这种波动的工具之一。它特别适用于大量计量值数据进行整理加工,找出其统计规律及分析数据分布的形态,以便对其总体的分布特征进行分析推断。直方图分析法是对过程的静态分析,因此获得的分析结论比较正确。而控制图是对过程的动态分析,可获得的信息比较多。因此,在过程能力调查及工序分析中常常将二者结合应用。采用直方图分析,其做法是将一定数量的抽样数据分成若干组,按其顺序分别在平面直角坐标上画出一系列的直方形,并将直方形一一连接起来,就形成了直方图。通过观察直方图的形状,可以实现以下几个目的:1)直方图形象地显示过程的波动状态,可借以判断生产过程的质量是否稳定,了解产品质量特性的分布状况、平均水平和分散度;2)为判断工序是否正常,工序能力是否满足需要提供证据。根据直方图提供的信息可推算出数据分布的各种特政治、过程能力指数以及过程的不合格品率等。3)通过对直方图分布中心与公差范围的比较,为进一步分析产品质量问题产生的原因,寻求和制定提高产品质量的改进措施、确定如何进行质量改进提供前提条件。三、作直方图的程序先以某厂生产的定量包装食品为例,对直方图的作图程序进行说明。该产品质量技术规范要求为g.第一步:收集数据作直方图的数据应不少于50个,一般取50个或100个为宜。本例随机抽取100包进行检测,测得的数据如表1所示(以下分析演算过程中均略去单位)。250500表21-1数据表测量单位/g515511500516510512524514518508506519517507517514503512523512508521514520524513517514509514514507508524517520509507518510518520525505519513511503502514510512523517514511521509519515513515521506509512518510522509519520516514521516512515514508522507519521519518504513519513519517522512520509505508516504第二步:找出所有数据中的最大值Xmax和最小值Xmin,本例Xmax=525,Xmin=500。第三步:求出全体数据的分布范围,即极差R。R=Xmax-Xmin=525-500=25第四步:根据数据的进行分组。组数以字母K表示。分组原则如下:1)数据为50~100个时,分5~10组;2)数据为100~150个时,分7~12组;3)数据为250个以上时,分10~20组;本例可分为7组,即K=7第五步:计算组距。用组数去除极差,可得到直方图每组的宽度,即组距的理论值,用字母h表示,本例h=R/K=25/7=3.57组距实际取值应按以下原则选取,即实际值hi≥理论值h本例取hi=4第六步:确定各组的边界值。此时应注意掌握以下技巧:一是应避免数据刚好落在组的边界上;二是要保证数据中最大值Xmax和最小值Xmin均应包括在组内。为此,应将组的边界值单位取为最小测量单位的1/2。本例最小测量单位为1。因而有:第一组下边界值为:最小值Xmin-1/2测量单位=500-0.5=499.5第二组下边界值(即第二组的下边界值)为第一组下边界值加组距,即499.5+4=503.5第二组上边界值(即第三组的下边界值)为第二组下边界值加组距,即503.5+4=507.5依此类推计算出各组的边界值。第七步:计算各组中心值距XiXi=(该组的下界限制+该组的下界限制)/2本例第一组X1=(499.5+503.5)/2=501.5第二组X2=(503.5+507.5)/2=505.5其余类推第八步:把各组上下边界值分别填入频数分布表内,并把数据表21-1中的各个数据归列到相应的组内,然后统计出各组频数f(见表21-2之①)。第九步:计算各组简化中心值ui(见表21-2之②)其方法是:先计算出频数fi最大一栏的中心值X0(见表21-2的组号4),然后用下式确定各组的ui值ui=(Xi-X0)/h式中:Xi——各组中心值本例X0=513.5由此可计算出第一组简化中心值:u1=(501.5-513.5)/4=-3第二组简化中心值:u2=(505.5-513.5)/4=-2其余推断第十步:计算频数fi与简化中心值ui的乘积,即fiui之值(见表21-2之③)第十一步:计算数据与简化中心值平方的乘积,即(见表21-2之③)第十二步:按下式计算平均值2iiufniiXnX11X也可用一下简化公式本例iiifufhXX018.51468.05.5131001745.5130iiifufhXX第十三步:计算标准偏差可用以下简化公式本例niiXXns12)(1122nufnufhsiiii4.1100171002032s第十四步:按以下方法画直方图:制作平面直角坐标系,横轴为重量。以每组对应的组距为直方图之底(各直方行之底相等);纵轴为频数,以每组对应的频数为直方形的高度。这样就可画出一个一个的直方形,每个直方形面积为数据落到这个范围之内的频数。因此,所有直方形面积之和就是频数的总和乘组距。同时,在直方图上标出有关统计数据:如标出公差范围(T)、样本量(n)、样本平均值()、样本标准偏差值(s)和的位置等(见右图)XXX四、直方图的分析1、通过图形形状分析判断取样过程是否正常画出直方图后就可根据其徒刑,观察它的整体分布形状,进而推测过程质量是否发生异常。若所作直方图符合正态分布,则说明取样过程处于正常状态;若不符合正态分布,则说明取样过程有一场因素在起作用,应查清原因。观察直方图图形时,主要应抓住以下几种特征:整体分布位置是否适当?整体分布的宽窄程度如何?整体分布形状是否发生向左或向右偏斜、是否对称、在整体分布中有无形成缺齿或折齿的现象?整体分布的左右是否呈现徒壁形状?整体分布是否过于呈现尖峰状?有无孤岛型跳离整体之间外?整体分布是否有双峰现象?整体分布是否过于平坦?右图正常性直方图是以对称轴为分布中心的对称图形,基本符合正态分布(如果用一条光滑曲线将该直方图包络,则得一条正态分布曲线),说明生产过程处于理想的统计控制状态即稳定状态;常见的直方图形态见下右图陡壁行直方图是非对称的偏态图形,故又称之为偏向性直方图,它的形成可能由单向公差(行位偏差)要求或操作者倾向性加工习惯等引起;右图平坦行直方图又称之平顶性直方图,不符合正态分布的变化规律,这种情况说明生产过程中可能有缓慢变化的异常因素在起作用,如加工刀具逐渐磨损、操作者疲劳等引起产品质量特性的产品;右上图尖峰型直方图可能由工艺规定的公差范围过宽等引起;右下图孤岛型直方图即正常型直方图旁边出现一个小直方图,说明生产过程中可能发生了原料混杂、操作漫不经心、疏忽、有操作不熟练者短时间替岗等短暂异常因素情况;右上图锯齿型直方图可能是由于数据分组过多或测量数据不准、误差过大等原因引起;右下图双峰型直方图,说明测量数据来自两个不同的总体,例如把2个操作者或2台加工设备加工的产品混为一批等2.将直方图分布中心与公差范围联合进行分析社为公差上下限,M为公差中心,为直方图分布中心。T为公差范围,B为质量特性分布范围,我们可以将直方图和公差加以对比来观察直方图徒刑,判断过程满足规范要求的程度及问题症结所在,并采取相应的对策措施。XLUTT、五、直方图的定量表示直方图定量表示的主要特性值有以下两个1、样本平均值做直方图是要保证一定的抽样数量。一般测量数据个数n应在50~250个之间。设取样数据为则平均值X用以下公式计算:平均值表示数据的分布中心位置,它与标准中心M越靠近越好。niinXnXXXnX1211)(1nXXX,...,,21XX2.标准偏差s标准偏差用以表示测量数据的分散程度,用小写字母s表示。标准偏差一般用著名的“贝塞尔公式”计算:式中为残差,用表示。niiniVninsXX12121111)(iVXXi标准偏差还可用最大残差法、最大级差法等方法求得通常用标准偏差表示测量数据的分散程度。标准偏差越小,加工精度越好;标准偏差越大,测量数据分散性越大,加工精度越差。下图是某厂两个月质量数据直方图,比较这两个月的直方图行,可见10月份更靠近公差中心M,10月份的标准偏差s比9月份小,说明10月份生产过程受控情况更好,合理有效,产品质量稳定,波动很小。