统计学基础初晓军•单位产品(unitproduct):为实施检验的需要而划分的基本单元。(有时也可以称为个体)•批量:单位产品的总和,又称总体。•样本:自总体中抽取一部分个体所构成的集合。•随机抽样:没有任何主观意愿和特点要求,从总体中抽取样本。•计量值:以产品本身的特性来表示,如长度,温度,重量等。•计数值:以缺陷数和个数表示。一.数据统计的基本概念两种一般类型的数据计量型计量型─数据是连续的(测量得到的)对某个特性的实际测量结果,如曲轴的直径,档距,产品的重量,等计数型计数型─数据一般是数出来的用“有/没有”型仪表的测量结果,可见缺陷的检查,丢失部品的数量,合格/不合格或对/错判断,等(1)车间生产的每支曲轴的RPM(2)一个班次生产的产品的平均RPM(3)拖板标签上的打印缺陷数(4)每份销售合同的打字错误数(5)月生产中脱离规格的产品数(6)月生产中脱离规格产品的%(7)汇总一个应收款所花费的时间(8)每生产100件产品中有缺陷产品的数量练习:是什么类型的数据?计量型计量型计量型计数型计数型计数型计数型计数型二.分布–计数型概率分布实验结果为计数型数据,为把它模型化时使用.(例如:良品/不良0/1或不良数1,2,3,…个数模型化.)l二项分布(BinomialDistribution)…不良型数据的分布lPoisson(泊松)分布(Distribution)…缺陷型数据的分布–计量型概率分布实验结果为计量型数据,为把它模型化时使用.l正态分布…一般计量型数据的分布l指数分布…有关使用寿命的数据的分布lWeibull分布…具有机械特性的数据的分布•最小值:是一组中最小的数值数据点•最大值:是一组中最大的数值数据点•范围:是最大值和最小值之间的差;范围=最大-最小•中间值:如你把你的数据按递增或递减排列,则位于中间的点是中间值如,你有依次排列的5个数据点,则第三个是中间值。如你有6个数据点,则中间值是第3个和第4个数据点的平均值三.常用术语q最小值,最大值,范围和中间值(例)•比如说,在一25个员工的班组,其中10个人的年龄。结果如下:32,33,34,34,35,37,37,39,41,44•找出最小值,最大值,范围及中间值?三.常用术语是的,中间值可能是分数或小数---即使所有数据均是整数•既然这些数据是按递增排列,则我们不用对其进行排序.•最小值=32,最大值44,范围=44-32=12•中间值=(35+37)/2=36q平均数•平均数是一列数据的“算术平均”–它是一种居中倾向的方法,并不是一种发散方法。然而,它要求考虑一些变动的统计方法–式中:•x=样本平均值•xi=数据点I•n=样本组的大小•N=总体•m=总体平均数NXNiiå==m1nXXniiå==1样本平均数总体平均数三.常用术语平均数例子•我们抽取10名员工年龄的样本32,33,34,34,35,37,37,39,41,44•平均数为多少?X=(32+33+34+34+35+37+37+39+41+44)/10=36.6三.常用术语q标准差•标准差定义如下:•更直觉的定义,可想作为“每个数据点到平均值的平均距离”21)(å=m-=sNiiNX总体标准差211)(å=--=niinxxs样本标准差三.常用术语标准偏差例子•从以上的例子可以看出样本的平均数为,X=36.6•求出样本的标准差?()()()()81.3)110(26.363426.363426.363326.3632=-+-+-+-+-=Ks三.常用术语q变动(方差)•方差定义如下:212)(å=m-=sNiiNX总体方差:样本方差:2121)(å=--=niinxxs三.常用术语•它是总体及样本标准差的平方。•这是很有用的,因为我们不能加标准差,但能加方差。四.直方图与正态分布数据收集:应注意依照分层原则按照原料、设备、班次、作业员等分别归类,防止不同层别数据混在一个群体之中。数据整理:计量值数据绘制直方图判定过程是否稳定、正常。直方图确定过程作图步骤与方法组数数据N~5050~1005~7100~250250以上6~107~1210~201.收集数据,一般要求数据至少要50个以上,并记录数据总数(N);2.将数据分组,定出组数K=1+3.23lgN,也可采用以下经验数据5.定出组界最小一组的下组界值=S-测量值的最小位数/2最小一组的上组界值=最小一组的下组界值+组距最小二组的下组界值=最小组的上组界值6.决定组的中心点组的中心点=(上组界+下组界)/27.作次数分配表依照数值的大小记入各组界内,然后计算各组出现的次数。8.绘直方图横轴表示数值的变化,纵轴表示出现的次数。9.对绘制出的直方图进行分析。即最小分辨率的一半3.找出最大值(L)和最小值(S),计算出全距(R)。4.定出组距(H):全距/组数(其结果取为最小测量单位的整数倍)四.直方图与正态分布★直方图实例练习1.某罐头厂生产罐头,罐头容量规格为310±8g,今抽验50罐数据如下:308317306314308315306302311307305310309305304310316307303318309312307305317312315305316309313307317315320311308310311314304311309309310309312316312318•请大家练习一下作次数分布表作直方图四.直方图与正态分布计算(1)确定基本内容:N=50(2)组数:K=7(参考经验数值)(3)最大值L=320最小值S=302全距R=320-302=18(4)计算组距HH=R/K即18÷7=2.5取H为3(为测定值最小单位的整数倍)(5)第一组下限值为302-0.5,上限值为第一组下限值+组距=301.5+3=304.5(6)各组中心值=(上组界+下组界)/2组号组界中心值标记F(次数)1301.5~304.530342304.5~307.5306103307.5~310.5309134310.5~313.531295313.5~316.531586316.5~319.531857319.5~322.53211四.直方图与正态分布•作直方图02468101214302305308311314317320323四.直方图与正态分布上限下限中心值上限下限中心值上限下限中心偏左的直方图考虑会出现什么问题理想型直方图中心偏右的直方图考虑会出现什么问题Ø能力分析四.直方图与正态分布上限下限下限上限分散度小的直方图能力富裕型分散度大的直方图能力不足型上限下限无富裕型直方图四.直方图与正态分布直方图的功用直方图有用呀!(1)测知工序的过程能力,是过程能力的最好最直观的写照;直方图中心越接近规格中心,表示过程越集中。分布在规格界限内,表示过程差异小或变异小。(2)计算产品的不良率,根据不良数量可以直接计算出来;无论是计数值还是计量值均可直接计算出来。(3)调查是否混入两种以上不同的数据;是否出现双峰型,是否未对设备、人员、原料、班别、生产线等加以区别。(4)测知数据是否有假;主管对下属进行控制的有效手段,数据真实性的判定手段。(5)测知分布形态;常态型、锯齿型、离岛型等进行分析。(6)以此制定产品的规格;如果规格尚未确定,可以使用平均值加(减)4倍标准差的方式指定上下限。(7)设计合理的控制界限。四.直方图与正态分布正态分布我们希望是正态分布数据的分布服从正态分布(μ,σ),平均值为μ,标准差为σ,2直方图与正态分布四.直方图与正态分布直方图形态分析对于直方图主要分析两类问题一是观察数据的分散程度二是数据分布中心与规格中心的偏离状态数据覆盖的范围,由过程固有技术特性决定。如:各项过程参数是否适当设置数据中心是否符合规格要求,由过程管理因素决定。如:各项过程参数是否在规定的条件下四.直方图与正态分布正态分布的两个基本统计量表征数据的中心(算术)平均(Average)中央值(Median)众数(Mode)表征Data的离散程度标准偏差(StandardDeviation)方差(Variance)全距(Range)百分比(Percentile)1)(12--=å=nxxSniinxxniiå=-=12)(sx=〔∑Xi〕i=1NN五.正态分布正态分布随时间变化峰态分析σ变化,而μ不变位置分析μ变化,而σ不变实际过程μ变化,σ变化五.正态分布1.对称性:以过程平均为轴左右对称2.连续性:左右两尾无限接近于横轴3.正则性:曲线下横轴上的面积等于1P(μ-1σ<X<μ+1σ)=0.6827P(μ-2σ<X<μ+2σ)=0.954P(μ-3σ<X<μ+3σ)=0.9973P(μ-6σ<X<μ+6σ)=0.9999997141正态分布的性质μ68%95%99.7%-1σ1σ-2σ-3σ3σ2σ五.正态分布过程能力--指工序处于稳定状态下,在经济及其他条件允许的范围内,工序保证产品质量的能力。B(orPC)=6σ(6倍标准差)CpBT==Ts6T---表示产品公差B---表示过程能力六.过程能力分析过程能力工序的质量能力必须在过程正式运作前予以确定,同时在运作过程中要持续稳定保证这个能力。在±3σ分布范围内的概率分布为99.73%。表示该过程产品质量波动的范围。过程能力指数--过程能力满足规格的程度Cp(CapabilityofProcess)过程能力的理解TUTLT=TU-TL-3σ3σ6σCpBT==Ts6>1TUTLT=TU-TL-3σ3σ6σCpBT==Ts6=1TUTLT=TU-TL-3σ3σ6σCpBT==Ts6<1过程结果好于过程目标过程结果等于过程目标过程结果差于过程目标六.过程能力分析s3xTCpuU-=s3xTCplL-=六.过程能力分析过程能力指数的计算CpBT==Ts6Cpk=(1-k)Cpk为修正系数单侧公差只有上限只有下限双侧公差无偏移有偏移2Tke=ε=M-μM--表示公差中心μ--表示数据分布中心s3xTCpuU-=s3xTCplL-=方法⒈方法⒉Min(Cpu、Cpl)区分计算公式3s2T-ε过程能力指数的评定停止继续加工,找出原因。否则全数检查挑选出不合格品。过程能力严重不足4级0.67>CP分析散步大的原因,全数检查或增加检验频次过程能力不足3级1>CP≥0.67必须用控制图或其他方法进行控制和监督:对产品按常规进行检验过程能力尚可2级1.33>CP≥1不是关键项目时可:1.放宽波动幅度。2.降低对材料的要求。3.减少检验的频次过程能力充分1级1.67>CP≥1.33为提高质量,对关键项目再次缩小公差范围:为提高效率降低成本放宽波动幅度,减低设备等级过程能力过剩特级CP≥1.67措施判断等级范围六.过程能力分析提高过程能力指数q调整过程分布中心,减少偏移量ε。—工具磨损、加工条件随时间变化的规律,采取调整和补偿。—通过首件检查,调整定位装置。—改变操作者的不良加工习惯。—采用更精密的量规。q提高过程能力,减少分散程度—改进工艺方法,优化过程参数,使用新材料,新技术—更新设备,提高工装精度—减少材料批次间的波动q修订公差范围—必须保证不影响产品质量,可修订不切实际的过高公差六.过程能力分析MINITAB软件使用初晓军Minitab=Mini+Tabulator=迷你+计算器BarbaraF.RyanPresident&CEO•Minitab:–72年PennState开发的系统。–82年使用于个人计算机(PC)。–6Sigma初期Motorola主要使用了SAS系统,随着GE使用Minitab软件,其使用也范围扩大到了全球。–如今大部分6Sigma的公司都在使用Minitab软件。(GE,AlliedSignal美国联合信号,Motorolaetc.)–软件对Use设计r为比较容易使用,6SIGAM典型的统计数Software占很大位置。Background主画面数据窗口:•工作表,不是Excel工作表•列名在第一行之上•同列的数据被视为来自同一个群组数据窗口:•工作表,不是Excel工作表•列名在第一行之上