简单统计技术介绍中国建筑材料检验认证中心马廷林2010-02-25审核员学习掌握统计技术的目的1、己有越来越多的组织开始应用统计技术;2、顾客对于组织运用统计技术的要求趋于严格;3、越来越多的组织不再满足于一般性的认证审核,而是希望认证审核成为一增值的活动。组织应策划并实施以下方面所需的监视、测量、分析和改进过程:a)证实产品要求的符合性;b)确保质量管理体系的符合性;c)持续改进质量管理体系的有效性。这应包括对统计技术在内的适用方法及其应用程度的确定。8.1总则—理解要点(1)组织为确保其产品的符合性、质量管理体系的符合性、持续改进其有效性,组织应对这些方面策划所需的监视、测量、分析和改进过程,规定这些活动的项目、方法、频次、职责和必要的记录等适当内容,并确定这些方法的应用程度实施所需的监视和测量活动,需要采用统计技术在内的适用方法统计技术可以帮助组织了解、发现产品或过程的变异,更好地利用可获得的数据进行决策,从而有助于组织解决问题并促进持续改进(参见GB/Z19027-2005《GB/T19001-2000》统计技术指南)统计技术的定义统计技术是以概率论为基础的应用数学的一个分支。统计技术是研究随机现象中确定的统计规律的学科。可理解为:运用有关的统计方法收集、整理、分析和解释统计数据,并对其所反映的问题(产品质量变异的性质、程度和原因)作出一定结论的科学技术。统计技术包括统计推断和统计控制两大内容(1)统计推断指通过对样本数据的统计计算和分析,预测尚未发生的事件和对总体质量水平进行推断。(2)统计控制指通过对样本数据的统计计算和分析,采取措施消除过程中的异常因素,以保证质量特性的分布基本保持不变,即达到稳定的受控状态。8.1总则—审核思路•组织是否对产品、过程、体系的监视、测量、分析和改进过程进行了策划•实施监视和测量活动的方法有哪些?是否适合于组织•组织的监视和测量活动采用了哪些统计技术?对此是否有规定,并按规定要求收集数据,进行了分析组织是否按策划的安排实施了监视、测量、分析和改进活动对组织应用统计技术的审核1.应由组织根据自身的实际情况识别对统计技术的需求并选择适宜的统计技术2.正确应用统计技术3.检查应用统计技术的有效性4.审核员应成为统计技术应用的推动者指导性技术文件的目的•文件:GB/Z19027-2005《GB/T19001-2000的统计技术指南》•目的:旨在帮助组织在建立、实施、保持和改进符合GB/T19001-2000所要求的质量管理体系时,确定可使用的统计技术。旨在指导和帮助组织考虑和选择适合该组织需求的统计技术。•统计技术也适用于GB/T19000族的其他标准,尤其是GB/T19001-2000.•本部分讲解GB/Z19027—2005idtISO/TR10017:2003《GB/T19001—2000的统计技术指南》•重点理解描述性统计中的趋势图、散布图和直方图;过程能力分析的概念、表述及计算;统计过程控制(SPC)图的概念;抽样、抽样检验标准:(GB/T2828.1-2003《记数抽样检验程序第一部分按接收质量限(AQL)检索的逐批检验抽样计划》)第一节GB/Z19027-200《GB/T19001—2000的统计技术指南》•GB/Z19027—2005idtISO/TR10017:2003《GB/T19001—2000的统计技术指南》是指导性技术文件,是GB/T19000族的组成部分,并与其保持一致。•此指导性文件旨在帮助组织在建立、实施、保持和改进符合GB/T19001—2000所要求的质量管理体系时确定可使用的统计技术《GB/T19001—2000的统计技术指南》识别的计量型数据和统计技术。•GB/Z19027-2005idtISO10017:2003《GB/T19001-2000的统计技术指南》中对于GB/T19001条款的实施可能有关的定量数据的需求做了识别,针对已识别的定量数据的需求列出了应用于这些数据的适当的一个或多个统计技术(见标准表)•描述性统计描述性统计是以揭示数据特性分布特性的方式汇总表达定量数据的方法。•试验设计(DOE)试验设计是指以计划好的方式进行调研,它依赖于对结果的统计评价,从而在规定的置信水平下得出结论。•假设试验假设试验是在规定的风险水平上确定一组数据是否符合已给定假设的统计方法。•测量分析测量分析(也称“测量不确定分析”或“测量系统分析”)是在系统运行的条件下,评价测量系统不确定的一套方法。•过程能力分析过程能力分析就是检查过程的固有变异和分布,从而估计其产生符合规范所允许变差范围的输出的能力。•回归分析回归分析就是将所关心的特性(通常称为“回归变量”)的性能与潜在的原因(通常称为“解释变量”)联系起来,这样一种关系可通过科学、经济、工等科学的模型作出规定,或经验得到。目的是帮助理解响应变差的潜在原因,并解释每个因素对该变差所起的作用有多大。•可靠性分析可靠性分析就是将工程和分析方法应用于评价、预算和保证所研究的产品或系统在某一段时间无故障运行。•抽样抽样是一种系统的统计方法,它是通过研究总体有代表性的部分(即样本)来获取总体的某些特性的信息。•模拟模拟是通过计算机程序用数学方式表示(理论或经验的)系统,从而解决问题的方法的集合。如果这种方法表达方式包括概率论的概念,尤其包括随机变量,模拟则称为“蒙特卡罗法”•统计过程控制(SPC)图SPC图或“控制图”是将从过程定期收集的样本所获得的数据按顺序点绘制而成的图•统计容差法统计容差法是基于某些统计原理确定容差的发方法,它利用各种零件相关尺寸的统计分布来确定组装总容差。•时间序列分析时间序列分析是研究按时间顺序收集到的一组观测结果的一族方法。描述性统计概述•统计技术一般可分为描述性统计和推断性统计两大类。•描述性统计通过对统计数据的收集、整理,用特征数据、图表或语言来揭示数据分布的规律性,是较简便和直观的方法•描述性统计也为推断性统计奠定了基础。描述性统计的概念•描述性统计是以揭示数据分布特性的方式汇总并表达定量数据的方法。•描述性统计的用途描述性统计用于汇总和表征数据。它通常是对定量数据进行分析的初始步骤,并常常是使用其他统计方法的第一步。在规定的误差界限和置信水平内,样本数据的特性可作为推断所抽取样本的总体特性的基础.•描述性统计的益处描述性统计提供了一种高效和相对简单地汇总和表征数据的方式,同时也提供了一种表达信息的便利方式。尤其是图解法,是一种非常有效的展示数据和传递信息的方法。描述性统计的特征•概括并表示定量数据是描述性统计的主要作用•揭示数据分布的特征是描述性统计的主要功能•描述性统计是一类统计方法的汇总常见的描述性统计及其应用•描述性统计提供的信息通常可通过各种图解法进•行简单有效地传递,这些图解法包括数据相对简•单地展示常见的描述性统计方法的分类:1.用数据的统计量来描述,如:均值、标准差等。2.用图示技术来描述,如:直方图、散布图、趋势图、排列图、条形图和饼分图等。3.用文字语言分析和描述,如:统计分析表、分层法、因果图、亲和图和流程图等。质量数据的分类计量值数据——服从正态分布质量数据计件值数据——服从二项分布计数值数据计点值数据——服从泊松分布质量数据的特点1.波动性2.规律性质量数据的分布及其特征值反映质量数据的波动性及规律性用随机变量的分布描述质量变异的状况1.计量值数据的正态分布正态分布的图形——正态分布曲线μ拐点σ拐点随机变量f(x)频数x正态分布曲线的特征:正态分布曲线很象寺院中倒扣着的一口钟,所以又称为钟形曲线,其特征为①在x=μ处有对称轴,且有f(x)最大值,称μ为分布中心。②拐点到对称轴的距离是σ称为标准差。③正态分布曲线向±∞无限延伸,且以X轴为渐近线。则有:f(x)>0正态分布的符号:X~N(μ,σ2)分布参数(特征值)μ,σ在质量管理中是非常重要的。但其为总体分布参数,往往不可知。需要用样本分布参数对其进行估计。样本均值样本标准差nxxi12nxxSi)(标准差(StandardDeviation)•标准差σ也称为均方差,是数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。用σ表示。因此,标准差也是一种平均数。•标准差σ是方差σ2的算术平方根。•标准差σ能反映一个数据集的离散程度。两组数据的平均数相同时,标准差未必相同。应重点掌握描述性统计中的“趋势图”、“散布图”、“直方图”趋势图也称为“运行图”或“折线图”,它是一段时间内所关心的特征值的描点图,用以观察这些特性值在该时间段内的变化状态。趋势图的作用•趋势图的主要作用是直观地反映质量特性随时间变化的趋势与走向,为决策提供依据。•趋势图也是时间序列分析中的一种简易图表法。趋势图的画法和示例•确定所需要研究的随时间变化的质量特性值,并收集随时间推移的数据;•建立平面直角坐标系横坐标表示时间系列,纵坐标表示质量特性性;•根据不同的时间所对应的不同质量特性值。在坐标系中描述出相应的点;•按照顺序将这些点连接起来,即形成趋势图;散布图又称“散点图”或“相关图”,是研究成对出现的两组数据之间相关关系的图示技术。是描述具有非确定性关系的两个因素之间关系的图形,通过确定两个因素之间的相关性,寻找问题的可能原因,从而对质量进行改进。散布图的主要作用•可以发现两组数据之间是否相关或不相关的;•如果相关可分析其相关的程度;•如果相关可进一步用回归法找出两者之间的近似函数关系。散布图的画法•测取成对的数据(一般不少于30对)•建立平面直角坐标系(X轴和Y轴的长度大致相等)•将数据表中成对的数据在坐标中打出点,形成散布图某种合成纤维的强度与其拉伸倍数有关,经试验取得24对数据序号拉伸倍数(x)强度(y)Kgf/mm2序号拉伸倍数(x)强度(y)Kgf/mm211.91.4135.05.522.01.3145.25.032.11.8156.05.542.52.5166.36.452.72.8176.56.062.72.5187.15.373.53.0198.06.583.52.7208.07.094.04.0218.98.5104.03.5229.08.0114.54.2239.58.1124.63.52410.08.1强度yKgf/mm2109876543210012345678910x拉伸倍数纤维强度拉伸倍数散布图及回归方程Q线P线散布图的分析•对散布图通常可以用简单象限法和直观分析判定法进行分析简单象限法•简单象限法是一种半定量的判断方法,可以判定两组数据之间是否是线性关系。•绘制好的散布图上划两条中值线,一条与横轴平行,一条与纵轴平行,两条直线上下或左右的点子数要大致相等(见图)。两条相互垂直的直线将图划分为四个部分,即四个象限。简单象限法•计算被两条中线分成的四个区域内的点子数n1、n2、n3、n4•计算对角线区域内的点子数之和(n1+n3,n2+n4);•进行相关性质判断:如(n1+n3)(n2+n4)为正相关如(n1+n3)(n2+n4)为负相关如(n1+n3)≈(n2+n4)为不相关本例:图中n1=12、n2=0、n3=12、n4=0。则n1+n3=24﹥n2+n4=0。因此,纤维伸长倍数与其强度存在正相关的关系。•直方图是用一系列等宽不等高的长方形不间断地排列在一起的图形,用以描述所关心的特性值的分布。•其宽度表示数据间隔范围,高度表示在此范围内的数据出现的频率,高低不同的变化形态描述了数据的分布状态。直方图的作用•直观的看出产品质量特性值的分布状态;•显示质量波动状态,判断工序是否稳定;•确定改进方向;•确定工序能力和设备能力。建立直方图的步骤和示例1.收集和记录需要进行分析的数据;2.确定数据的最大值(Xmax)和最小值(Xmin),并计算出极差:R=Xmax-Xmin;3.确定分组数K和组距d4.确定分组组界,即分组的边界值。为避免数据正好落在边界值上,通常要使各组的边界值比原测定精度高或低半个最小测量单位:第一组下限=Xmin-d/2第一组上限=第一组下限值