创奇科技有限公司统计技术培训教材目录1基本的统计学概念(掌握)2常用统计手法(了解)3统计知识在日常品质管理活动中的应用(掌握)我们经常思考以下问题:新入厂的某规格双金与上批相比,其2.55In时间范围的设定是否需要与上批保持差异?某检验人员在校验时,其校验的产品,是否波动性过大?某C45产品的长延时试验,其合格率是多少?等等以上问题,其实质就是:如何在不确定性中,找到我们想要的信息和答案.为了找到以上答案,促使我们有必要对一门与之相关的理论进行了解和学习,这就是:概率论.概率论是对不确定现象(或称随机现象)进行研究的方法论.它需要收集数据,然后进行分析,最后得出结论.下面我们进行关于概率论的一些最基础的概念的学习:一.统计学的基本概念1.关于概率的基本概念:1.1随机现象:在一定条件下,并不总是出现相同结果的现象称为随机现象.从以上定义可以看出,随机现象至少有两个特点:1)随机现象的结果至少有两个;2)至于哪一个出现,事先并不知道.例如:抛硬币,掷骰子就是两个最简单的随机现象.抛一枚硬币,可能出现正面,也可能出现反面,至于哪一面出现,事先并不知道.又如掷一颗骰子,可能出现1到6点中某一个,至于哪一个点出现,事先并不知道.与随机现象对应的另一种现象称为确定性现象,例如,太阳从东方升起;同性电荷相斥,异性电荷相吸;向上抛一石子必然下落等.以下是随机现象的另外一些例子:1)一天内进入某超市的顾客数;2)一顾客在超市购买的商品数;3)顾客在超市排队等候付款的时间;4)C45某规格产品的1.45In的动作时间;6)点焊车间某天某规格热元件的不合格率;随机现象在质量管理中到处可见.认识一个随机现象首先要罗列出它的一切可能发生的基本结果.这里的基本结果称为”样本点”,随机现象一切可能的样本点的全体称为这个随机现象的样本空间,记做”Ω”.“抛一枚硬币”的样本空间Ω={正面,反面}“掷一颗骰子”的样本空间Ω={1,2,3,4,5,6}“某产品入库检验不良率”的样本空间Ω={p:0%≦p≥100%}注意,在对随机现象进行的1次试验(或观察)中,永远只出现1个结果.例如掷一枚硬币一次,永远只出现正面或反面的一种,而不会同时出现正面和反面.即每个样本点之间的关系是随机现象的某些样本点的集合称为随机事件,常用大写字母A,B,C表示.如在掷一颗骰子时,”出现奇点数”是一个事件,它由1点,3点,5点共三个样本点组成,若记这个事件为A,则有A={1,3,5}概率-------随机事件发生可能性大小的度量随机事件的发生与否是带有偶然性的.但随机事件发生的可能性还是在大小之别,是可以度量的.例如:1)抛一枚硬币,出现正面与出现反面的可能性各为1/2;2)体彩中心发行的36选7的彩票,其中奖率分别为:一个号码的中奖率为7/36中两个号码的中奖率为7/36*6/35三个号码的中奖率为7/36*6/35*5/34四个号码的中奖率为7/36*6/35*5/34*4/33五个号码中的中奖率为7/36*6/35*5/34*4/33*3/32六个号码的中奖率为7/36*6/35*5/34*4/33*3/32*2/31七个号码的中奖率为7/36*6/35*5/34*4/33*3/32*2/31*1/30=1/8347680上述硬币某一面出现的可能性,中奖率及常见的不合格率,废品率,合格率等都是用来度量随机事件发生的可能性大小.概率的定义:一个随机事件A发生的可能性的大小称为这个事件的概率,并用P(A)来表示.概率是一个介于0到1之间的数(用百分比表示,即0%-100%).概率越大,事件发生的可能性越大;概率越小,事件发生的可能性越小.不可能事件的概率为0,必然事件的概率为1,即:P(Φ)=0,P(Ω)=1确定概率的统计方法:确定概率的统计方法如下:(1)与事件A有关的随机现象是可以大量重复试验(或观察)的;(2)若在n次重复试验中,事件A发生kn次,则事件A发生的频率为:Pn*(A)=kn/n=事件A发生的次数/重复试验的次数(3)频率Pn*(A)会随着试验次数的不断增加而趋于稳定,这个频率的稳定值就是事件A的概率.在实际中人们无法把一个试验无限次地重复下去.只能用重复次数n较大时的频率去近似概率.这项研究在计算机键盘设计,印刷铅字的铸造,信息的编码方面都是有用的.说明:本教材上述内容教学的目的,是为了让大家了解概率等概率论中的基本概念,这些基本概念,是理解常用统计分析方法和分析工具的基础知识.(常用的统计分析方法和工具有:假设检验,方差分析,参数估计,控制图等)关于概率的确定方法,除了上述统计方法外,还有古典方法.2关于“随机变量”,“数据”,“分布”等概念产品的质量特性(如点焊件的强度,C45的长短延时)由于受人,机,料,法,环等因素的影响,总是存在不确定性(即随机性,波动性),为了使其波动性受到控制,我们需要收集数据,必要时进行分析,发现其规律.随机变量:表示随机现象的结果的变量称为随机变量.常用大写字母X,Y,Z等表示,它们的取值用相应的小写字母x,y,z等表示.假如一个随机变量仅取数轴上有限个点或可列个点,则称此随机变量为离散随机变量,其取值可称为离散型数据;假如一个随机变更的所有可能取值充满数据上一个区间(a,b),则称此随机变更为连续随机变更,或中a可以是-∞,b可以是+∞其.取值可称为连续型数据.随机变量的分布:从上图可以看出:随机变量分布的均值,方差和标准差平均值-总体或样本的平均值。用x或来表示样本,用来表示总体平均值。举例:给定一个样本:{1,3,5,4,7},平均值就是:常用统计量x=xn在这里X1是样本的第一个点,Xn是样本的最后一个点。.i1n,平均值的公式x=(1+3+5+4+7)=20=4.055样本的平均值等于4。中位数(ME)中位数也是衡量总本或样本数据集中趋势的常用指标现有以下五个数据:3.5,4.5,2.3,5.5,4.7为了考察其集中趋势,但是又不想进行麻烦的计算,我们可采用以下方法:1.将上述5个数据按从大到小(或从小到大)进行排列:5.5,4.7,4.25,4.0,2.62.找出上述排列中,处于中间位置的数,结论是4.5,即Me=4.25一般情况下,如果样本呈正态分布,则中位数和平均值的计算结果往往相差无几.而且,中位数在进行某些数据分析时,偶尔会有平均值所不具备的优越性.平均差是用来衡量一组样本数据的波动性的重要统计量,只有理解了平均差,才能更好的理解另一个更常用的统计量----标准差.以下数据是C45某规格产品的1.45In时间(单位:秒):产品编号123456789101.45试验时间12.713.711.413.511.213.812.811.415.112.9通过计算,可知其平均值为12.85对上述10个样本数据进行考察,可以看到,每个数据都与平均值有差距产品编号123456789101.45试验时间12.713.711.413.511.213.812.811.415.112.9各样本与平均值的差距-0.150.85-1.450.65-1.650.95-0.05-1.452.250.05为了衡量整组数据的离散程度,我们很自然地想到,采用一个办法,即把这些差距加起来,结果如下:Σ所有数据与平均值的差=(-0.15)+0.85+(-1.45)+…+0.05=0由于结果是0,所以就没法达到我们的目的,所以我们可以采用另一个办法,将上述差值取绝对值后再加起来,结果如下:Σ|所有数据与平均值的差=0.15+0.85+1.45+…+0.05=9.5这样,波动性就显示出来了.但是为了不同组数据间的比较,还需要将以上求和的结果进行平均,称之为平均差,即平均差=9.5/10=0.95平均差所以平均差的公式为:n标准差s2=n(Xi-X)2i=1n-1s=(Xi-X)2i=1nn-1上式中,根号里的部分就是方差的计算公式,即比较平均差和标准差,我可以看到,平均差是采用取绝对值的方法来防止加总的结果为零,而标准差是采用取平方的方法来防止加总的结果为零.这是两者的不同点.思考题:计算以下数据的平均差,平均值,中位数,方差和标准差1,2,3,4,5常用统计技术介绍假设检验方差分析实验设计统计过程控制(SPC)测量系统分析(MSA)参数估计抽样计算(GB2828.1)QC七手法之相关图,控制图等………….常用统计技术介绍关于假设检验的一些知识介绍:在现代企业的质量管理中,对过程和产品进行抽样,然后用样本来推断总体,是一个重要的品质控制手段.除了常用的批次抽样技术如GB2828外,其它的统计手段,特别是假设检验的应用,也起了重要的作用.为了说明假设检验的基本概念,我们来看一个例子:以上这种情况,就是我们所谓的假设检验.假设检验的原理:1.假定某件事是成立的,即原假设Ho是成立的;2.收集数据,却确定原假设H0成立的概率有多大;3.如果原假设成立的概率极小(一般小于5%或以下),则只好放弃原假设,接受它的对立面,即备择假设.上述原理又是建立在一个概率论的基本原理上,即小概率原理.小概率原理:小概率事件(发生概率小于5%的随机事件)在一次试验中是不会发生的.实用的而简单统计技术曼-惠特尼-威乐科克森检验(Mann-Whitney-WilcoxonTest)简称MWW检验,适用于各类连续型随机变量的样本检验.主要目的是比较两组样本所属的总体,其总体的中位数(相当于平均数)或标准差是否相等(而不管这两个总体服从什么分布).即:H0:两总体相同H1:两总体不同MWW检验的原理:1.假设两总体相同(即具有相同的平均值和标准差);2.那么,从总体N1中随机抽取n1个样本,从总体N2中抽取n2个样本,对这些样本的数据进行测量,然后进行排序和排队,则两组样本的数据应该是相互错杂的.3.如果,出现了某一个样本(n1或n2)的数据在排序后,其在队伍的排队名次(称为秩和)较高或较低,则我们只好拒绝接受两总体相同这个假设.或者说,我们有较大把握来确信,这两个总体是不同的(一般是平均值或中位数不同)MWW检验如何做.例子:某日,冲制车间的巡检员在巡检过程中,发现C45长脚的折弯角度发生批量性的不良.为了寻找导致不良发生的原因,检验员在对模具,机器等相关影响因素进行排除后,认为有可能是板材的硬度影响(从理论上讲,板材的硬度在变化时,会影响冲制件的折弯角度)为了验证自己的判断,该检验员做了如下动作:1.分别收集折弯角度OK和NG的样品6和5PCS,2.将些样品送到检验中心测量硬度,结果如下(单位:HV)样品编号123456OK样品硬度(A)120119124121125139NG样品硬度(B)1401431381541553将这些数据合并成一列:样品类别样品硬度A120A119A124A121A125A139B140B143B138B154B1554对这些数据从低到高进排序秩样品类别样品硬度1A1192A1203A1214A1245A1256B1387A1398B1409B14210B14311B1545.计算样本量较小的样本的秩和秩样品类别样品硬度1A1192A1203A1214A1245A1256B1387A1398B1409B14210B14311B154样本B数量较小(5PCS)其秩和T=6+8+9+10+11+11=446.查表,如果T≤T1或T≧T2,则判定两总体不同.注意:如果样本量相同,则计算任意一组样本的秩和即可.7.判定:由于T=44,>T2=41,故判定两总体不同,即上述产品中,折弯角度NG者有较大的硬度,于是我们找到了品质改进的方向.n1指样本量较小者由于MWW检验需要的样本量较小,计算过程简单,故鼓励大家在日常工作中多加应用.思考题:现装配校验人员反映:由于双金焊接角度较小,导致难以校验.为验证其说法是否成立,要求其提供容易校验以难以较验的样品各6PCS,测量双金的偏移角度如下(规格91±1°)样品编号123456难校样