六西格玛普及培训-测量课程目录一、统计基础二、第四步:测量系统分析三、第五步:过程能力分析四、第六步:寻找潜在要因数据的两种类型连续数据:使用一种度量单位,并且可以有意义地无限分割例:电压、电流、功率、时间、距离、重量、速度离散数据:是类别信息,可以计数,但不能有意义地分割例:优秀/良好/差、接通/不通、合格/不合格、投诉次数连续数据离散数据相同数量的连续数据比离散数据能提供更多的信息连续数据的描述居中程度:measuresoflocation(centraltendency)均值Mean中位数Median众数Mode离散程度:measuresofdispersion(variation)极差Range方差Variance标准偏差StandardDeviation均值均值-总体或样本的平均值-总体的均值用µ表示-样本的均值用X表示样本均值的计算公式如下:Note:Themeanisthemostcommonmeasureoflocationorcenterofthedata.nxnxxxxn1iin21中位数与众数中位数——反应样本数据处于中间位置的数值,一系列数据由低到高排列后所得到的中间数evenisnif2xxoddisnifxx~)1]2/n([)2/n()2/]1n([偶数奇数众数——在一个数据集中出现最频繁的值离散程度的描述用来判定一个数据集合离散程度的恒量尺度极差:在一个样本中最大值与最小值的差值R=x(max)–x(min)方差:与平均值距离的平方和的平均值总体的方差用σ2表示样本的方差用s2表示标准偏差:是方差的平方根总体标准偏差用σ表示样本标准偏差用s表示1nxxsn1i2i21nxxsn1i2i统计的应用实际问题实际解决方案统计问题统计解决方案统计:研究如何以有效的方式,收集和分析那些带有随机因素的数据,从而为决策提供依据的科学。正态分布t–分布F–分布超几何分布二项式分布泊松分布–分布2连续型数据离散型数据分布种类分布的种类UnitsofMeasure直方图块的中点中心光滑连接形成曲线正态分布大多数(但不是所有)数据分布都符合正态分布或钟形曲线正态分布的特点形态如钟、左右对称平均值处分布的频数最多。越远离平均值,分布的频数也越少正态分布的要素平均值:决定正态分布曲线的中心位置标准偏差:决定正态分布曲线的“宽窄”为何要研究正态分布自然界一种最普遍的法则,反应了事物内在的变化规律进行统计分析的基础可通过少量抽样来把握全体,从而节省资源和成本正态分布简介95.5%43210-1-2-3-468.3%99.73%正态分布曲线正态分布的形状因和而异1212122112、1=21=2、1212、1212二项分布数据的形态为满意/不满意、好/坏、是/不是、及时/不及时等的时候使用。定义:在总体比率为p的总体中抽取n个样品,某特定属性(例如客户不满意的数量)有x个时,x遵守二项分布(n,p)二项分布需要满足下列条件1)贝鲁诺实验:实验的结果只存在两种可能性例)抛硬币,正面/反面2)在同一条件下进行实验3)各个实验是相互独立的,即前结果不影响后结果4)对每个实验结果的概率是相同的.泊松分布数据的形态为单位时间(面积、空间、区间)内发生特定事件的次数。如:单位合同出现缺陷的数量每天针对网络投诉的数量每天到交通银行办理业务的客户数量每个营业厅每天办理新用户业务的数量每块单板的焊点缺陷数每个绿带考试试卷的错误答案数量总体和样本总体(母本)从数学上讲,总体就是一个随机变量X。它是提供数据的原始集团,是所要研究分析的对象的全部样本(子样,抽样,试样)从总体中抽出一部分个体,总体中的这一部分个体称之为样本。它是直接被检测并提供数据的诸个体。其中样本中每一个个体称之为样品总体样本好样本的特质:样本必须是无偏颇的!当收集的样本数据不能代表总体或过程的特征时,则被取样的总体或过程就会显得与其实际不同,就产生了偏颇无偏颇:1.独立性2.代表性总体无代表性有代表性好样本的特质样本必须具有独立性要求样本即n维随机变量(X1,X2,…Xn)中X1,X2,…Xn是相互独立的随机变量,这就是说每个抽样结果既不影响其它抽样结果,也不受其它抽样结果的影响样本必须具有代表性因为抽取的样本要能代表总体的特征。所以要求每个Xi必须与总体X有相同的分布好样本的特质(续)凡满足相互独立且与总体有相同分布这两个条件的样本称为简单随机样本。获得简单随机样本的方法称为简单随机抽样统计工具最小样本容量分布图直方图或柏拉图相关图均值比较分析方差比较分析缺陷率(P)控制图3050151530100andnP5--30样本容量选择的经验数据第一步项目数据收集计划起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量思考下列问题:收集数据的目标或期望结果是什么一般来讲,为了达到目的需要收集什么数据为收集数据,你将监测什么过程第二步起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量项目数据收集计划决定测量对象时,思考下列问题:收集数据的目标或期望结果是什么?我们需要什么数据?确认所需的每一个Y或X对每一个测量,其操作定义是什么?写下每一个定义,以确保所有团队成员对于收集的数据有一个共同的理解第三步起草项目数据收集计划建立数据收集目标决定测量对象决定如何测量项目数据收集计划确定测量工具:当决定使用测量工具时,首先检查该工具是否存在;如果不存在,你将需要购置或重新选择工具。例如,如果你决定测量一个拜访电话打了多长时间,合适的测量工具可能是一只秒表,或者储存在拜访系统里的计时软件。准备抽样方案:抽样方案决定数据收集的频率和数量。小结本节介绍了数据的类型、参数和统计量、随机分布、总体和样本的概念。这些概念是统计的基础,要准确掌握。其它的基础统计知识将在学习其它统计工具时逐步介绍。课程目录一、统计基础二、第四步:测量系统分析三、第五步:过程能力分析四、第六步:寻找潜在要因6σ方法建立在这样一种思想上,基于数据的决策用于决策过程的数据必须是可靠的。基于不可靠数据的决策与无数据支持的决策没有什么差别。测量是任何6σ项目的基础测量系统是否好得足以放心用来收集数据测量系统分析将给出您答案测量系统分析测量系统分析所谓测量系统分析,是指用统计学的方法来了解测量系统中各个波动的来源,并分析它们对测量结果的影响,最后给出测量系统能否合乎使用要求。测量系统必须具备的主要特征1、准确性:偏离标准值的程度2、精确性:数据的离散程度测量系统分析基本概念量具(Gauge)各种测量仪器,包括生产及检测设备测量系统(GaugeSystem)指由人员、量具、测量方法、环境等构成的系统测量系统的准确性(Accuracy)对同一个样本作多次测量,然后计算平均值,平均值与真值之间的差异程度成为偏差,偏差越小表示准确性越高测量系统的精确性(Precision)以同样的测量方法对同一个样本在短期内重复测量多次,所得到数据的离散程度分辨力?“精确性”(R&R)(离散性---偏差)线性?偏倚?“准确性”(居中性---均值)OKOKOK连续数据测量系统分析OK稳定性?123123AB因为上面刻度的分辨率比两个被测对象之间的差异要大,两个被测对象将出现相同的测量结果,分辨力为0.1。第二个刻度的分辨率比两个被测对象之间的差异要小,被测对象将产生不同的测量结果,分辨力为0.01。A=2.25B=2.00测量仪器分辨力测量仪器分辨力:测量仪器能够识别并反映的最小变化范围的能力。看看下面的两个过程的输出结果A和B,它们的结果非常相似。测量分辨力描述了测量仪器分辨两个被测对象之间差异的能力。A=2.0B=2.0AB测量仪器的分辨力必须小于或等于规范(USL-LSL)或6倍过程标准差的10%测量的准确性是测量所得的平均值与真实值的差别真实值参考标准平均值真实值偏倚观察的平均值-偏倚准确性线性线性(Linearity)指在其量程范围内,偏倚是基准值的线性函数,即偏倚和基准值之间呈线性关系。稳定性稳定性(Stability)指在测量系统的计量特性随着时间保持恒定的能力。我们可以运用控制图(SPC)来分析和确认测量系统的稳定性。精确性精确性:通常用来描述在测量范围内重复测量的预期变差可重复性——变差由量具本身造成可再现性——变差由测量者的技巧造成RRpeatabilityproducibilityMeasSystem&ReRe(.)222两个组成部分测量系统重复性再现性在相同条件下,重复检查同一物体,产生相同结果的量具的能力。在相同条件下,对同一物体进行重复测量所得的变差:同一测量者同样的测量设备同样的被测件同样的环境条件精确性——重复性在不同的条件下测量同一物体得到相同结果的能力。不同条件下测量结果的变差:不同的测量者或者不同的测量设备(测量者和测量设备只能有一样不同)同样的被测件同样的环境条件Re*producibilityOperatorOperatorPartInteracton222再现性也有两个组成部分精确性——再现性准确性和精确性的关系AccuracyvsPrecisionbothaccurateandprecise既准确又精确accuratebutnotprecise准确但不精确precisebutnotaccurate精确但不准确neitheraccuratenorprecise既不准确也不精确数据收集原则连续数据测量系统分析2~3个测量者10~15个被测对象每一个测量者应测量所有被测对象2-3次使用代表整个过程偏差的被测对象随机取样是非常重要的2被测对象测量者1231210121测量次数......贡献百分比:1%可接受;9%可考虑;9%不可接受。调查百分比:10%可以接受;30%可考虑;30%不可接受。容差百分比:10%可接受;30%可考虑;30%不可接受。NumberofDistinctCategories:差别类数目:5可接受连续数据测量系统分析判断标准%1006%ToleranceToleranceMS%100Var%StudyTotalMS%100%22totalMSonContributipart-to-partgage差别类数目=x1.41连续数据测量系统分析离散数据测量系统分析离散数据测量系统分析判断标准效率得分(判对率)=95%,可以接受效率得分(判对率)=90%,可以考虑效率得分(判对率)=90%,不可接受数据收集原则将被测对象与要求进行比较,在通过与不通过判断基础上决定是否接受被测对象离散数据测量系统研究通常由2-5个测量者测试20-50个被测对象来进行每一个测量者应以随机顺序测量所有被测对象2-3次。2-3次评估之间相隔一段时间(如:一个星期)样本选择标准:一些可以接受,一些不合格,一些处于边缘小结测量系统分析是最关键的内容之一,必不可少。主要目的是确定项目中所使用的数据是否可靠。但需要说明的是,有时在某些管理和服务的项目中,数据是从系统中自动获取的,这时数据的可靠性仍然是需要考虑的,但可以根据实际情况定性地说明和描述所得到的数据是可靠的。课程目录一、统计基础二、第四步:测量系统分析三、第五步:过程能力分析四、第六步:寻找潜在要因波动的分类与原因通常,过程包含随机波动(由于一般或普遍原因造成的)和非随机波动(由于特殊原因造成的)。时间不合格产品率非随机波动历史水平(0)最佳水平(1)在0(±30)范围内的随机波动在1(±31)范围内的随机波动随机波动0510152025012345678SampleNumberSampleCountNPChartforC1NP=2.792UCL=7.769LCL=0普遍原因