1统计方法培训第一部分2•一、统计的概念(一)定义•1、什么叫“统计”?•“收集和整理信息和数据的活动”。•2、什么叫“统计方法”?•“有关收集、整理、分析和解释统计数据,并对其所反映的问题做出一定结论的方法”叫统计方法。3•3、统计方法的分类•(1)描述性统计方法;(通过对数据的收集和整理来描述质量状态)•(2)推断性统计方法;(通过对样本数据的分析和解释来推断总体质量状态)4•4、统计方法的性质•描述性---通过数据的整理,找到数据的规•律,描述质量状态。•推断性---通过对样本数据的分析,来推断•整体的质量水平。•风险性---既然是用样本数据来推断整体,•就不会百分之百的正确,就有可•能出现错误,造成风险。55、统计方法的用途1)表示事物的特征;(平均值、方差、标准偏差等)2)比较两事物的差异;(假设检验、水平对比法等)3)分析影响事物的变化因素;(因果图、树图等)4)分析事物的相关关系(散布图、正交试验)5)研究取样方法;(统计抽样等)6)确定合理的试验方案;(优选法、正交试验等)7)研究数据的质量分布;(直方图、排列图等)8)研究数据的动态变化;(控制图、散布图等)9)描述质量的形成过程;(流程图等)6(二)统计方法在我国的使用:我们没有和世界工业先进的国家同步跨入统计控制的阶段1963年我国的质量管理专家刘源张先生,在北京内燃机总厂小件车间进行统计方法使用的试点。1978年我国引进全面质量管理时,全面引进老七种统计工具用于“质量管理小组”活动。1979年我国在进行质量管理活动进一步深化开展的时候,引进新七种统计工具。1993年建立ISO9000质量管理体系时,强调统计工具的使用。7(三)统计方法概念1、产品质量波动-----必然性和规律性。•2、波动的分类:•正常波动----随机原因引起、影响小、难•克服。•异常波动----系统原因引起、影响大、容•易克服。•(系统即“人、机、料、法、环、测”系统。)8•正常波动异常波动•质量水平93、数据的分类•1)计量值数据:•“能在数列上连续读值的数据”。•如:重量、长度、温度、压力、容积等•2)计数值数据:•“不能在数列上连续读值的数据”。•如:不合格数、疵点数、合格数等10•数列的读值•01234+∝•计量值••计数值114、两类统计特征数1)显示数据集中位置的统计特征数:•样本平均值(X平均值)•样本中位数(X中位数)2)显示数据离散程度的统计特征数:•样本极差(R)•样本方差(S2)•样本标准偏差(S)12X1+X2+X3+X4……..XNX(平均值)=NX(中位数)=一组数据按大小排列,中间的那个数(奇数时)。中间两个数的平均值(偶数时)R(极差)=Xmax–XminS2=1/(N-1).∑[XI-X(平均值)]2S=+√S213•例:•求1、2、3、4、5五个数的平均值、中位数、极差、方差、标准偏差。•X(平均值)=3•X(中位数)=3•R=5–1=4•S2=1/4{4+1+0+1+4}=1/4{10}=2.5•S=1.58145、统计推断的可能性•用样本推断总体是可以的其方法是:•分析样本质量分布,计算样本的平均值和标准偏差,来推断总体的质量分布。•我们习惯把总体平均值用“μ”表示,标准偏差用“σ”表示。样本平均值用“X平均”表示,标准偏差用“S”表示。156、计量值数据质量分布的规律性•1)计量值数据质量分布服从正态分布。•2)正态分布中,以X(平均)为中线•各一个“S”区间质量分布的概率是0.6826,各两个“S”区间的质量分布概率是0.9544,•各三个“S”区间的质量分布概率是0.997316•3)正态分布曲线是对称的钟形曲线。•X平均••S•拐点•-3S-2S–SS2S3S174)用样本的正态分布来推断总体的不合格率•把质量要求和质量分布进行比较:•当质量要求等于“6S”时,质量分布中心与质量要求中心重合,总体中不合格品的概率约为:0.3%•当质量要求等于“4S”时,质量分布中心与质量要求中心重合,总体中不合格品的概率约为:4.6%187、统计中的两类错误和风险•1、犯“α”弃真的错误•把一批合格的产品,经过抽样检查后,推断为不合格。犯“弃真”的错误。•2、犯“β”存伪的错误•把一批不合格的产品,经过抽样检查后,推断为合格。犯“存伪”的错误。•风险率α和β是一对矛盾,此长彼消,此消彼长。使用统计方法的目的就是使犯两种错误的机会为最小。19•β•α20统计推断案例•某省田径队有一名短跑运动员,他的100米成绩训练时模拟比赛测试5次,成绩分别是:10.2秒、10.2秒、10.0秒、9.9秒10.1秒,如果在不服兴奋剂的情况下正常发挥,该运动员有无创造9.8秒可能?(请讲出你的推断方法)21•用计算器计算如下:•知:五次测试的平均成绩是10.08秒•五次测试的标准偏差是0.13秒•推断1:该运动员100米成绩在9.95至10.21范围出现的概率是0.6826;•推断2:在9.82至10.34秒的概率是0.9544•推断3:在9.69至10.47秒的概率是0.9973•该运动员出现9.8秒以下成绩的可能是有的,但机会不多。概率大约是千分之二:•(1–0.9544)/2=0.02322二、QC小组常用的老七种统计工具•老七种统计工具的控制原理是:•“3σ原理”-----把产品质量控制在正、负3σ的范围,使产品超出控制范围的机会只有千分之三。按照这一法则进行质量控制的原理叫“3σ原理”。231、排列图•原理:“关键的少数和次要的多数”•在众多的不合格中存在着“关键的少数项目,他们所占不合格的频数多,影响大。如果把这些关键的少数项选择为小组课题,把他们的不合格降下来,整体不合格率就会明显下降。24排列图的基本图型XXX排列图25•排列图的图形说明:•1)图形基本是正方型,由一个横坐标(项目坐标)和两个纵坐标(左边是频数坐标,右边是频率坐标)组成。•2)从左向右按高低排列的柱型。•(“其它”项目排列在最后位置)•3)对应项目的累计百分比折线。•4)标注齐全(包括:图名、项目、总数、绘图人、日期、分数据值等内容)26•排列图绘制程序:•1)收集50个以上的统计数据;•2)确定分层项目名称。•3)统计项目出现频数;•4)计算单项目的百分比和从左至右项目的累计百分比;•5)绘制排列图;•6)标注。•(当排列图不能显示关键的少数时要考虑按新的标志分层,确定项目)27•使用排列图经常出现的问题•1)关键的少数不明显;•2)数据少,没有排列分析的意义;•3)“关键的少数和次要的多数”的分析和“整体与局部”的表示不是一个概念,选择使用时用混淆;•4)标注不齐全;•5)用排列图去寻找发生问题的原因;•6)“其它”项超过10%;28•排列图出现这样的情况要重新进行分层•抹灰质量6月份检查不合格排列图•N=74•20191817••一班二班四班三班29•重新分层找到夹渣的症结•N=74•38•146547••夹渣高点不平起鼓缺角其他30用排列图分析原因属于统计方法使用不恰当•质量原因排列图••20•11•6•21•人材料方法环境设备31•2、因果图•1)原理:•用头脑风暴法,针对发生问题的现场,首先考虑“人、机、料、法、环”的过程要素,进行展开思维,把有可能产生问题的潜在原因都考虑到,按照因果的逻辑关系整理出来的统计图形。•2)适用情况•单一目的,因素不交叉情况下,三层以内因果分析语言资料的整理。32•3)基本图形•原因类别•机人•第一层原因•第二层原因结•果•环法料33•4)因果关系的实例:•结果--------------30件不合格品•原因类别--------设备•第一层原因-----主轴窜动•第二层原因-----止推轴承烧毁•原因类别---------人•第一层原因------未按工艺要求操作•第二层原因------没按操作要求培训34•设备••主轴串动30•件止推轴承烧毁不•合•格•品35•5)在有“包容”情况下的处置:•法•太厚•刀工不对•竖丝••溜肉片嚼不烂•刀工不对包容“太厚”和“竖丝”两个内容363、调查表用来系统的收集资料和积累数据,确认事实并对数据进行粗略整理和分析的统计图表。1)应用程序:(1)明确收集资料的目的;(2)确定为达到目的而需收集的资料;(3)确定分析方法和负责人;(4)设计表格;(其内容要包括:收集地点、时间、方式、调查者等)(5)表格试用、修改、确定。372)种类:(1)不合格品项目调查表;(2)缺陷位置调查表;(3)质量分布调查表;(4)矩阵调查表;38(1)不合格品项目调查表插头焊接缺陷调查表(N=4870)NO项目频数累计累计%A插头槽径大3367336769.14B插头假焊521388879.84C插头焊花382427087.69D插头内有锡201447191.82E绝缘不良156462795.02F芯线未漏120474797.48G其他1234870100.00收集人搜集日期地点:39(2)缺陷位置调查表调查目的生产日期调查人型号喷漆缺陷2007年11月12日李婷KZT-2048图示***40(3)质量分布调查表频数515251555353025正20正15正正正10正正正5正正正正正正11-1212-1313-1414-1515-1616-1717-1841(4)矩阵调查表LL1L2L3L4L5L6R1R2RR3R4R5424、分层法质量波动的原因是多种多样的,收集到的质量数据带有综合性。我们使用分层法对综合的数据进行整理,可以更客观的反映事实。分层法往往和其它统计方法合并使用。(如:分层排列图、分层控制图等)1)分层法的原则:层内数据波动尽可能的小,层间的数据尽可能的大。432)分层标志:(1)人员----年龄、级别、性别等(2)机器----类型、生产线、新旧程度等(3)材料----产地、规格、厂家等(4)方法----工艺、操作方法、速度等(5)测量----设备、人员、方法等(6)时间----班次、日期等(7)环境----照明、温度、湿度等(8)其它----地区、部位、缺陷内容等443)应用程序:(1)收集数据;(2)选择分层标志;(3)将数据按层归类;(4)画分层归类图;45例如:某汽车发动机装配车间,经常发生气缸垫漏油的不合格。经调查:现场由张、王、李三个师傅操作;三位师傅各有各的操作方法;缸垫的供方是甲、乙两家。共生产50台(1)在缸垫供方忽略的情况下,以操作者为分层标志。(2)操作者忽略的情况下,以供方为分层标志。其结论是:46按操作者分层:操作者漏油不漏油漏油率%王师傅61332李师傅3925张师傅10953共计19313847按供方(生产厂家)分类:供方漏油不漏油共计甲厂91439乙厂101737共计193138%=19/5048请注意:综合分层统计的结果:甲厂缸垫乙厂缸垫合计王师傅漏油606不漏油21113李师傅漏油033不漏油549张师傅漏油3710不漏油729合计漏油91019不漏油141731共计23275049综合分层的结论是:(1)王师傅的操作方法,在装乙厂生产的汽缸垫时效果很好。(2)李师傅的操作方法,在装甲厂生产的汽缸垫时效果最佳。(3)张师傅的操作方法,对那个厂家的汽缸垫都不适用,应废止使用。505、直方图1)计量值数据显示统计样本质量分布的图形。2)取100至250个数据为统计样本,在直角坐标系内,按等距离的区间,做频数直方图。3)利用计算器进行“平均值”和“标准偏差”的计算。(卡西欧计算器使用SD程序)4)基本图形:51直方图基本图形•平均值X标准偏差S525)直方图常见的波动形态•1、正常型----中间高、两边低、左右对称•2、偏向型----一边陡、一边缓两边不对称•3、孤岛型----一个大分布带一个小的分布•4、双峰型----两个分布叠加•5、平顶型----顶部平缓,高低不明显•6、锯齿型----矩形高低交错•53直方图的常见波动形态•正常型偏向型孤岛型•双峰型平顶型锯齿型546)用直方图进行工艺验证选择质量改进的机会•(1)工艺验证时,做出正常型直方图的情况下,要计算CP值,