-1-第一章概率统计基础知识在产品的整个生命周期(从市场调研到顾客服务以及产品昀终处置)的各个阶段,在所有过程的运行和结果中均可观察到变异。变异是客观存在的,提高质量的途径便是持续地减少变异,一致地满足顾客的要求。而统计技术可以帮助我们对观察到的变异进行测量、描述、分析、解释和建模,更好地理解变异的性质、程度和原因,从而有助于解决、甚至防止由变异引起的问题,并促进持续改进。作为质量工作者,要想更好地了解有关的统计技术并运用到实践活动中,就需要掌握必要的概率统计知识。第一节概率基础知识一、事件与概率㈠随机现象在一定条件下,并不总是出现相同结果的现象称为随机现象。从这个定义中可看出,随机现象有两个特点:⑴随机现象的结果至少有两个;⑵至于哪一个出现,人们事先并不知道。抛硬币、掷骰子是两个昀简单的随机现象。抛一枚硬币,可能出现正面,也可能出现反面,至于哪一面出现,事先并不知道。又如掷一颗骰子,可能出现1点到6点中某一个,至于哪一点出现,事先也并不知道。只有一个结果的现象称为确定性现象。例如,太阳从东方出,同性电荷相斥,异性电荷相吸,向上抛一颗石子必然下落等都是确定性现象。【例1.1–1】以下是随机现象的另外一些例子:⑴一天内进入某超市的顾客数;⑵一位顾客在超市中购买的商品数;⑶一位顾客在超市排队等候付款的时间;⑷一颗麦穗上长着的麦粒个数;⑸新产品在未来市场的占有率;⑹一台电视机从开始使用到发生第一次故障的时间;⑺加工机械轴的误差;-2-⑻一罐午餐肉的重量。随机现象在质量管理中到处可见。认识一个随机现象首要的是能罗列出它的一切可能发生的基本结果。这里的基本结果称为样本点,随机现象一切可能样本点的全体称为这个随机现象的样本空间,常记为Ω。“抛一枚硬币”的样本空间Ω={正面,反面};“掷一颗骰子”的样本空间Ω={1,2,3,4,5,6};“一顾客在超市中购买商品件数”的样本空间Ω={0,1,2,…。;“一台电视机从开始使用到发生第一次故障的时间”的样本空间Ω={t:t≥0};“测量某物理量的误差”的样本空间Ω={x:-∞<x<∞}。㈡随机事件随机现象的某些样本点组成的集合称为随机事件,简称事件,常用大写字母A、B、C等表示。如在掷一颗骰子时,“出现奇数点”是一个事件,它由1点、3点、5点共三个样本点组成,若记这个事件为A,则有A={1,3,5}。1、随机事件的特征从随机事件的定义可见,事件有如下几个特征:⑴任一事件A是相应样本空间Ω中的一个子集。在概率论中常用一个长方形示意样本空间Ω,用其中一个圆(或其他几何图形)示意事件A,见图1.1–1,这类图形称为维恩(Venn)图。⑵事件A发生当且仅当A中某一样本点发生,若记ω1,ω2是Ω中的两个样本点(见图1.1-1):当ω1发生,且ω1∈A(表示ω1在A中),则事件A发生;当ω2发生,且ω2∉A(表示ω2不在A中),则事件A不发生。⑶事件A的表示可用集合,也可用语言,但所用语言应是明白无误的。⑷任一样本空间Ω都有一个昀大子集,这个昀大子集就是Ω,它对应的事件称为必然事件,仍用Ω表示。如掷一颗骰子,“出现点数不超过6”就是一个必然事件,因为它含有Ω={1,2,3,4,5,6}中所有的样本点。⑸任一样本空间Ω都有一个昀小子集,这个昀小子集就是空集,它对应的事件称为不可能事件,记为Φ。如掷一颗骰子,“出现7点”就是一个不可能事件,因为它不含有Ω={1,2,3,4,5,6}中任一个样本点。-3-【例1.1–2】若产品只区分合格与不合格,并记合格品为“0”,不合格品为“1”。则检查两件产品的样本空间Ω由下列四个样本点组成。Ω={(0,0),(0,1),(1,0),(1,1)}其中样本点(0,1)表示第一件产品为合格品,第二件产品为不合格品,其他样本点可类似解释。下面几个事件可用集合表示,也可用语言表示。A=“至少有一件合格品”={(0,0),(0,1),(1,0)};B=“至少有一件不合格品”={(0,1),(1,0),(1,1)};C=“恰好有一件合格品”={(0,1),(1,0)};Ω=“至多有两件合格品”={(0,0),(0,1),(1,0),(1,1)};Φ=“有三件不合格品”。现在我们转入考察“检查三件产品”这个随机现象,它的样本空间Ω含有23=8个样本点。Ω={(0,0,0),(0,0,1),(0,1,0),(1,0,0),(0,1,1),(1,0,1),(1,1,0),(1,1,1)}下面几个事件可用集合表示,也可用语言表示。A=“至少有一件合格品”={Ω中剔去(1,1,1)的其余7个样本点};B=“至少有一件不合格品”={Ω中剔去(0,0,0)的其余7个样本点};C1=“恰有一件不合格品”={(0,0,1),(0,1,0),(1,0,0)};C2=“恰有两件不合格品”={(0,1,1),(1,0,1),(1,1,0)};C3=“全是不合格品”={(1,1,1)};C0=“没有一件是不合格品”={(0,0,0)};2、随机事件之间的关系实际中,在一个随机现象中常会遇到许多事件,它们之间有下列三种关系。⑴包含:在一个随机现象中有两个事件A与B,若事件A中任一个样本点必在B中,则称A被包含在B中,或B包含A,记为A⊂B,或B⊃A,这时事件A的发生必导致事件B发生,如图1.1-2所示。如掷一颗骰子,事件A=“出现4点”必导致事件B=“出现偶数点”的发生,故A⊂B。显然,对任一事件A,有Ω⊃A⊃Φ。⑵互不相容:在一个随机现象中有两个事件A与B,若事件A与B没有相同的样本点,则称事件A与B互不相容。这时事件A与B不可能同时发生,如图1.1-3所示,如在电视机寿命试验里,“电视机寿命小于1万小时”与“电视机寿命超过4万小时”是两个互不相容事件,因为它们无相同的样本点,或者说,它们不可能同时发生。两个事件间的互不相容性可推广到三个或更多个事件间的互不相容,例如在检查三个产品的例子(例1.1-2)中,C1=“恰有一件不合格品”,C2=“恰有两件不合格品”,C3=“全-4-是不合格品”,C0=“没有不合格品”是四个互不相容事件。⑶相等:在一个随机现象中有两个事件A与B,若事件A与B含有相同的样本点,则称事件A与B相等,记为A=B。如在掷两颗骰子的随机现象中,其样本点记为(x,y),其中x与y分别为第一与第二颗骰子出现的点数,如下两个事件:A={(x,y):x+y=奇数}B={(x,Y):x与y的奇偶性不同}可以验证A与B含有相同的样本点,故A=B。如果两个事件相等,它们必互相包含,即若A=B,则有A⊃B,B⊃A;反之若两个事件互相包含,则它们相等。㈢事件的运算事件的运算事件的运算有下列四种。(1)对立事件,在一个随机现象中,Ω是样本空间,A为事件,由在Ω中而不在A中的样本点组成的事件称为A的对立事件,记为A。图1.1-4上的阴影部分就表示A的对立事件A。可见A就是“A不发生”,例如在检查一匹布中,事件“至少有一个疵点”的对立事件是“没有疵点”。对立事件是相互的,A的对立事件是A,A的对立事件必是A。特别,必然事件Ω与不可能事件Φ互为对立事件,即Ω=Φ,φ=Ω。(2)事件A与B的并,由事件A与B中所有样本点(相同的只计入一次)组成的新事件称为A与B的并,记为AUB。如图1.1-5所示。并事件A∪B发生意味着“事件A与B中至少一个发生”。-5-(3)事件A与B的交,由事件A与B中公共的样本点组成的新事件称为事件A与B的交,记为A∩B或AB。如图1.1-6所示,交事件AB发生意味着“事件A与B同时发生”。事件的并和交可推广到更多个事件上去(见图1.1-7)。(4)事件A对B的差,由在事件A中而不在B中的样本点组成的新事件称为A对B的差,记为A-B。如图1.2-8所示。①交换律:A∪B=B∪AA∩B=B∩A-6-②结合律:A∪(B∪C)=(A∪B)∪CA∩(B∩C)=(A∩B)∩C③分配律:A∪(B∩C)=(A∪B)∩(A∪C)A∩(B∪C)=(A∩B)∪(A∩C)④对偶律:ABABABAB==∪∩∩∪以上性质都可以用维恩图加以验证,这些性质都可推广到更多个事件运算上去。(四)概率——事件发生可能性大小的度量随机事件的发生与否是带有偶然性的。但随机事件发生的可能性还是有大小之别,是可以设法度量的。而在生活、生产和经济活动中,人们很关心一个随机事件发生的可能性大小。例如:(1)抛一枚硬币,出现正面与出现反面的可能性各为1/2。足球裁判就是用抛硬币的方法让双方队长选择场地,以示机会均等。(2)某厂试制成功一种新止痛片在未来市场的占有率是多少呢?市场占有率高,就应多生产,获得更多利润;市场占有率低,就不能多生产,否则会造成积压,不仅影响资金周转,而且还要花钱去贮存与保管。(3)购买彩券的中奖机会有多少呢?如1993年7月发行的青岛啤酒股票的认购券共出售287347740张,其中有180000张认购券会中签,中签率是万分之6.264(见1993年7月30日上海证券报)。上述正面出现的机会、市场占有率、中签率以及常见的废品率、命中率等都是用来度量随机事件发生的可能性大小。一个随机事件A发生可能性的大小用这个事件的概率P(A)来表示。概率是一个介于0到1之间的数。概率愈大,事件发生的可能性就愈大;概率愈小,事件发生的可能性也就愈小。特别,不可能事件的概率为0,必然事件的概率为1,即:P(φ)=0,P(Ω)=1二、概率的古典定义与统计定义确定一个事件的概率有几种方法,这里介绍其中两种昀主要的方法,在历史上,这两种方法分别被称为概率的两种定义,即概率的古典定义及统计定义。(一)概率的古典定义用概率的古典定义确定概率方法的要点如下:(1)所涉及的随机现象只有有限个样本点,设共有n个样本点;-7-(2)每个样本点出现的可能性是相同的(等可能性);(3)若被考察的事件A含有k个样本点,则事件A的概率定义为:()kPAn==(1.1-1)【例1.1-3】掷两颗骰子,其样本点可用数对(x,y)表示,其中x与y分别表示第一与第二颗骰子出现的点数。这一随机现象的样本空间为:Ω={(x,y),x,y=1,2,3,4,5,6}它共含36个样本点,并且每个样本点出现的可能性都相同。(1)定义事件A=“点数之和为2”={(1,1)},它只含一个样本点,故P(A)=1/36。(2)定义事件B=“点数之和为5”={(1,4),(2,3),(3,2),(4,1)},它含有4个样本点,故P(B)=4/36=1/9。(3)定义事件C=“点数之和超过9”={(4,6),(5,5),(6,4),(5,6),(6,5),(6,6)},它含有6个样本点,故P(C)=6/36=1/6。(4)定义事件D=“点数之和大于3,而小于7”={(1,3)(2,2),(3,1),(1,4)(2,3),(3,2),(4,1),(1,5),(2,4),(3,3),(4,2),(5,1)},它含有12个样本点,故它的概率P(D)=12/36=1/3。用古典方法获得概率常需要排列与组合的公式。现概要介绍如下:排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。(1)乘法原理:如果做某件事需经k步才能完成,其中做第一步有m1种方法,做第二步有m2种方法,…,做第k步有mk种方法,那么完成这件事共有m1×m2×…×mk种方法。例如,甲城到乙城有3条旅游线路,由乙城到丙城有2条旅游线路,那么从甲城经乙城去丙城共有3×2=6条旅游线路。(2)加法原理:如果做某件事可由k类不同方法之一去完成,其中在第一类方法中又有m1种完成方法,在第二类方法中又有m2种完成方法,…,在第k类方法中又有mk种完成方法,那么完成这件事共有m1+m2+…+mk种方法。例如,由甲城到乙城去旅游有三类交通工具:汽车、火车和飞机,而汽车有5个班次,火车有3个班次,飞机有2个班次,那么从甲城到乙城共有5+3+2=10个班次供旅游选择。排列与组合的定义及其计算公式如下:A中所含样本点的个数Ω中样本点的总数-8-(1)排列:从n个不同元素中任取r(r≤n)个元素排成一列称为一个排列。按乘法原理,此种排列共有n×