1质量专业理论与实务(中级)精讲班第1讲讲义质量专业理论与实务(中级)精讲班第2讲讲义(三)事件的运算2.事件的运算性质(四)概率2二、古典概率的定义与统计定义一、内容提要1.概率的古典定义2.概率的统计定义3.概率的基本性质及加法法则4.条件概率及概率的乘法法则5.独立性和独立事件的概率二、重点与难点1.熟悉概率的古典定义及其简单计算2.掌握概率的统计定义3.掌握概率的基本性质4.掌握事件的互不相容性和概率的加法法则5.掌握事件的独立性、条件概率和概率的乘法法则三、内容讲解二、古典概率的定义与统计定义确定一个事件的概率有几种方法,这里介绍其中两种最主要的方法,在历史上,这两种方法分别被称为概率的两种定义,即概率的古典定义及统计定义。(一)概率的古典定义用概率的古典定义确定概率的方法的要点如下:(1)所涉及的随机现象只有有限个样本点,设共有n个样本点;(2)每个样本点出现的可能性相同(等可能性);(3)若被考察的事件A含有k个样本点,则事件A的概率为:3(二)排列与组合(二)排列与组合用古典方法求概率,经常需要用到排列与组合的公式。现简要介绍如下:排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。(1)乘法原理:如果做某件事需经k步才能完成,其中做第一步有m1种方法,做第二步m2种方法,…,做第k步有mk种方法,那么完成这件事共有m1×m2×…×mk种方法。例如,甲城到乙城有3条旅游线路,由乙城到丙城有2条旅游线路,那么从甲城经乙城去丙城共有3×2=6条旅游线路。(2)加法原理:如果做某件事可由k类不同方法之一去完成,其中在第一类方法中又有m1种完成方法,在第二类方法中又有m2种完成方法,…,在第k类方法中又有mk种完成方法,那么完成这件事共有m1+m2+…+mk种方法。例如,由甲城到乙城去旅游有三类交通工具:汽车、火车和飞机,而汽车有5个班次,火车有3个班次,飞机有2个班次,那么从甲城到乙城共有5+3+2=10个班次供旅游选择。(3)排列与组合的定义及其计算公式如下:4[例1.1-5]、[例1.1-6]5[例1.1-6](放回抽样)抽样有两种形式:不放回抽样与放回抽样。上例讨论的是不放回抽样,每次抽取一个,不放回,再抽取下一个,这相当于n个同时取出,因此可不论其次序。放回抽样是每次抽一个,将其放回,均匀混合后再抽下一个。这时要讲究先后次序,现对上例采取放回抽样方式讨论事件Bm=“恰好有m个不合格品”的概率。从N个产品中每次随机抽取一个,检查后放回抽第二个,这样直到抽出第n个产品为止。由于每次都有N种可能,故在放回抽样的问题中共有Nm个可能的样本点。事件B0=“全是合格品”发生必须从N-M个合格品中用放回抽样的方式随机抽取n次,它共含有(N-M)n种取法,故事件B0的概率为:P(B0)=(N-M)n/Nn=(1-M/N)n事件B1=“恰好有一件不合格品”发生,必须从N-M个合格品中用放回抽样抽取n-1次,而从M个不合格品中抽一次,这样就有M(N-M)n-1种取法,再考虑不合格品出现的顺序,故事件B1的概率为P(B1)=nM(N-M)n-1/Nn同样的可求Bm的概率。质量专业理论与实务(中级)精讲班第4讲讲义(三)概率的统计定义(三)概率的统计定义6(2)在英语中某些字母出现的频率远高于另外一些字母。人们对各类的英语书刊中字母出现的频率进行了统计。发现各个字母的使用频率相当稳定,其使用频率见表1.1-2。这项研究在计算机键盘设计(在方便的地方安排使用频率较高的字母键)、印刷铅字的铸造(使用频率高的字母应多铸一些)、信息的编码(使用频率高的字母用较短的码)、密码的破译等等方面都是有用的。7三、概率的性质及其运算法则三、概率的性质及其运算法则(一)概率的基本性质及加法法则根据概率的上述定义,可以看出它具有以下基本性质:8(二)条件概率及概率的乘法法则(二)条件概率及概率的乘法法则2)已活到120岁的乌龟能活到200岁的概率是多少?类似的9P(A200∣A120)=P(A120A200)/P(A120)=0.39/0.78=0.5即活到120岁的乌龟中大约有一半还能活到200岁。假如我们能获得弹药的贮存寿命,那么就可计算已存放10年的弹药再存放5年仍完好的概率。假如有一个国家的人的寿命表,就可处出30岁的人能活到60岁的概率是多少?保险公司正是利用条件概率对不同年龄的投保人计算人寿保险费率的。(三)独立性和独立事件的概率(三)独立性和独立事件的概率设有两个事件A与B,假如其中一个事件的发生不影响另一个事件的发生与否,则称事件A与B相互独立。性质7:假如两个事件A与B相互独立,则A与B同时发生的概率为:P(AB)=P(A)P(B)(1.1-5)质量专业理论与实务(中级)精讲班第5讲讲义第二节随机变量及其分布一、内容提要:1.离散随机变量的分布2.连续随机变量的分布的性质3.随机变量的均值、方差的运算性质二、考试大纲1.熟悉随机变量的概念2.掌握随机变量的取值及随机变量分布的概念3.熟悉离散随机变量的概率函数4.熟悉离散随机变量均值、方差和标准差的定义5.熟悉连续随机变量的分布密度函数6.熟悉连续随机变量均值、方差和标准差的定义7.掌握连续随机变量在某个区间内取值概率的计算方法三、内容讲解第二节随机变量及其分布一、随机变量表示随机现象结果的变量称为随机变量。常用大写字母X,Y,Z等表示,它们的取值用相应的小写字母x,y,z等表示。假如一个随机变量仅取数轴上有限个点或可列的个数点(见图1.2-1),则称此随机变量为离散随机变量,或离散型随机变量。假如一个随机变量的所有可能取值充满数轴上一个区间(a,b)(见图1.2-2),则称此随机变量为连续随机变量,或连续型随机变量,10[例1.2-1]产品的质量特性是表征产品性能的指标,产品的性能一般都具有随机性,所以每个质量特性就是一个随机变量。例如:(1)设X是一只铸件上的瑕疵数,则X是一个离散随机变量,它可以取0,1,2,…等值。为了方便,人们常用随机变量X的取值来表示事件,如“X=0”表示事件“铸件上无瑕疵”;“X=2”表示事件“铸件上有两个瑕疵”;X2表示事件“铸件上的瑕疵超过两个等等。这些事件可能发生,也可能不发生,因为X取0,1,2…等值是随机的。类似地,一平方米玻璃上的气泡数、一匹布上的疵点数、一台车床在一天内发生的故障数都是取非负整数{0,1,2,3,…}的离散随机变量。(2)一台电视机的寿命X(单位:小时)是在上取值的连续随机变量。X=0表示事件一台电视机在开箱时就发生故障;X10000表示事件:电视机寿命不超过10000小时;X40000表示事件电视机寿命超过40000小时。(3)检验一个产品,结果可能是合格品,也可能是不合格品。设X表示检验一个产品的不合格品数,则X是只能取0或1两个值的随机变量。X=0表示产品是合格品,X=1表示产品是不合格品。类似地,若检验10个产品,其中不合格品数X是仅可能取0,1,…,10等11个值的离散随机变量。更一般的,在n个产品中的不合格品数X是可能取0,1,2,…,n等n+1个值的离散随机变量。随机变量的分布二、随机变量的分布虽然随机变量的取值是随机的,但其本质上还是有规律性的,这个规律性可以用分布来描述。认识一个随机变量X的关键就是要知道它的分布,分布包含如下两方面内容:(1)X可能取哪些值,或在哪个区间上取值。(2)X取这些值的概率各是多少,或X在任一区间上取值的概率是多少?下面分离散随机变量和连续随机变量来叙述它们的分布,因为这两类随机变量是最重要的两类随机变量,而它们的分布形式是有差别的。(一)离散随机变量的分布[例1.2-2]掷两颗股子,点数分布的样本空间为:考察与这个随机现象有关的一些随机变量:设X表示“掷两颗子骰子,6点出现的个数”,它的分布列为:(2)设Y表示“掷两颗子,出现的点数之和”11这些随机变量X,Y都是各从一个侧面表示随机现象的一种结果,每个随机变量的取值都是随机的,但其分布告诉我们该随机变量取每个值的概率,使人们不仅对全局做到心中有数,而且还看到了取哪些值的可能性大,X取哪些值的可能性小,比如:X取0可能性最大,X取2的可能性最小;Y取7的可能性最大,Y取2或12的可能性最小;这些分布中的概率都可用古典方法获得,每个概率都是非负的,其和均为1。[例1.2-3]设在10个产品中有2个不合格品,从中随机取出4个,其中不合格品数X是离散随机变量,它仅可取0,1,2等三个值。X取这些值的概率为(详见例1.1-4):具体计算后可得如下分布列:从表中可见,事件X=l出现的机会最大。对同样的问题,若用放回抽样,则从10个产品(其中有2个不合格品)中随机取出4个,其中不合格品数Y是另一个随机变量,它可取0,1,2,3,4等五个值。Y取这些值的概率为(详见例1.1-6):这个分布显示了Y取哪些值概率大,哪些值概率小。还可计算有关事件的概率,比如:例[1.2-4]某厂生产的三极管,每100支装一盒,记X为一盒中不合格品数,厂方经多次抽查,根据近千次抽查的记录,用统计方法整理出如下分布:连续随机变量的分布(二)连续随机变量的分布连续随机变量X的分布可用概率密度函数p(x)表示。下面以产品的质量特性X,(如加工机械轴的直径)为例来说明p(x)的由来。假定我们一个接一个地测量产品的某个质量特性值X,把测量得到的x值一个接一个地放在数轴上。当累积到很多x值时,就形成一定的图形,为了使这个图形得以稳定,把纵轴改为单位长度上的频率,由于频率的稳定性,随着被测质量特性值x的数量愈多,这个图形就愈稳定,其外形显现出一条光滑曲线。这条曲线就是概率密度曲线,相应的函数表达式p(x)称为概率密度函数,它就是一种表示质量特性X随机取值的内在统计规律性的函数。12概率密度函数p(x)有多种形式,有的位置不同,有的散布不同,有的形状不同。这些不同的分布形式反映了质量特性总体上的差别,这种差别正是管理层应该特别关注之处。这里应强调的是:图上的纵轴原是“单位长度上的频率”,由于频率的稳定性,可用概率代替频率,从而纵轴就成为单位长度上的概率,这就是概率密度的概念,故最后形成的曲线称为概率密度曲线。概率密度函数p(x)是连续随机变量特有的概念,它有如下性质。质量专业理论与实务(中级)精讲班第6讲讲义例1.2-5[例1.2-5]考试得分是一个随机变量,下面是三个不同地区同一课程考试得分的概率密度函数(见图1.2-4)。得分可以取0到100分中的任意值,及格是50分,对每一地区,及格率大约是0.5呢?还是大大超过0.5?还是大大低于0.5?解:在图1.2-4上的50分处引一条垂线,则及格概率是:从50到100之间的面积从图1.2-4上可以看出:地区(a)的及格概率大大超过0.5。13地区(b)的及格概率大大低于0.5。地区(c)的及格概率约为0.5。随机变量分布的均值、方差与标准差14随机变量3.随机变量(或其分布)的均值与方差的运算性质:(1)设X为随机变量,a与b为任意常数,则有:质量专业理论与实务(中级)精讲班第7讲讲义(一)常用离散分布常用分布一、内容提要1、常用离散分布:二项分布、泊松分布与超几何分布2、正态分布:正态分布的概率密度函数、标准正态分布、有关正态分布的计算二、大纲要求151.掌握二项分布、泊松分布及其均值、方差和标准差以及相关概率的计算。2.了解超几何分布。3.掌握正态分布的定义及其均值、方差和标准差,标准正态分布的分位数。4.熟悉标准正态表的用法三、内容讲解四、常用分布(一)常用离散分布(非连续性的分布)这里将给出三个常用的离散分布:二项分布、泊松分布与超几何分布。1.二项分布我们来考察由n次随机试验组成的随机现象,它满足如下条件:(1)重复进行n次随机试验。比如,把一枚硬币连抛n次,检验n个产品的质量,对一个目标连续射击n次等。(2)n次试验间相互独立,即任何一次试验结果不会对其他次试验结果产生影响。(3)每次试验仅有两个可能的结果,比如,正面与反面、合格与不合格、命中与不命中、具有某特性与不具有某特性,以下统称为“成功