统计学STATISTICS3-1第3章概率与概率分布3.1随机事件及其概率3.2随机变量及其概率分布3.3大数定律与中心极限定理统计学STATISTICS3-2学习目标1.理解随机事件的概念、了解事件之间的关系2.理解概率的三种定义,掌握概率运算的法则3.理解随机变量及其概率分布的概念4.掌握二项分布、泊松分布和超几何分布的背景、均值和方差及其应用5.掌握正态分布的主要特征和应用,了解均匀分布的应用6.理解大数定律和中心极限定理的重要意义统计学STATISTICS3-33.1随机事件及其概率一、随机试验与随机事件二、随机事件的概率三、概率的运算法则统计学STATISTICS3-4一、随机试验与随机事件3.1随机事件及其概率统计学STATISTICS3-5必然现象与随机现象必然现象(确定性现象)–变化结果是事先可以确定的,一定的条件必然导致某一结果–这种关系通常可以用公式或定律来表示随机现象(偶然现象、不确定现象)–在一定条件下可能发生也可能不发生的现象–个别观察的结果完全是偶然的、随机会而定–大量观察的结果会呈现出某种规律性(随机性中寓含着规律性)——统计规律性十五的夜晚能看见月亮?十五的月亮比初十圆!统计学STATISTICS3-6随机试验严格意义上的随机试验满足三个条件:–试验可以在系统条件下重复进行;–试验的所有可能结果是明确可知的;–每次试验前不能肯定哪一个结果会出现。广义的随机试验是指对随机现象的观察(或实验)。–实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。统计学STATISTICS3-7随机事件(事件)随机事件(简称事件)–随机试验的每一个可能结果–常用大写英文字母A、B、……、来表示基本事件(样本点)–不可能再分成为两个或更多事件的事件样本空间(Ω)–基本事件的全体(全集)统计学STATISTICS3-8随机事件(续)复合事件–由某些基本事件组合而成的事件–样本空间中的子集随机事件的两种特例–必然事件•在一定条件下,每次试验都必然发生的事件•只有样本空间才是必然事件–不可能事件•在一定条件下,每次试验都必然不会发生的事件•不可能事件是一个空集(Φ)统计学STATISTICS3-9二、随机事件的概率3.1随机事件及其概率1.古典概率2.统计概率3.主观概率4.概率的基本性质统计学STATISTICS3-10随机事件的概率概率–用来度量随机事件发生的可能性大小的数值–必然事件的概率为1,表示为P()=1–不可能事件发生的可能性是零,P()=0–随机事件A的概率介于0和1之间,0P(A)1概率的三种定义,给出了确定随机事件概率的三条途经。统计学STATISTICS3-11概率的古典定义古典概型(等可能概型)——具有以下两特点–每次试验的可能结果有限(即样本空间中基本事件总数有限)–每个试验结果出现的可能性相同——它是概率论的发展过程中人们最早研究的对象统计学STATISTICS3-12概率的古典定义概率的古典定义–前提:古典概型–定义(公式)计算古典概率常用到排列组合知识nmAAP=数样本空间中基本事件总中包含的基本事件数事件)(统计学STATISTICS3-13【例3-1】设有50件产品,其中有5件次品,现从这50件中任取2件,求抽到的两件产品均为合格品的概率是多少?抽到的两件产品均为次品的概率又是多少?解:任一件被抽到的机会均等,而且从50件产品中抽出2件相当于从50个元素中取2个进行组合,共有C502种可能,所以这是一个古典概型。统计学STATISTICS3-14概率的统计定义当试验次数n很大时,事件A发生频率m/n稳定地在某一常数p上下波动,而且这种波动的幅度一般会随着试验次数增加而缩小,则定义p为事件A发生的概率nmpAP)(当n相当大时,可用事件发生的频率m/n作为其概率的一个近似值——计算概率的统计方法(频率方法)统计学STATISTICS3-15例(补充)根据古典概率定义可算出,抛一枚质地均匀的硬币,出现正面与出现反面的概率都是0.5。历史上有很多人都曾经做过抛硬币试验。试验者试验次数正面出现的频率蒲丰40400.5069K.皮尔逊120000.5016K.皮尔逊240000.5005罗曼诺夫斯基806400.4979统计学STATISTICS3-16【例3-2】某地区几年来新生儿性别的统计资料如下表所示,由此可判断该地区新生儿为男婴的概率是多少?观察年份新生儿数(个)男婴数(个)男婴比例(%)200016248270.509200112056220.516200215127740.512200314077150.508统计学STATISTICS3-173.主观概率有些随机事件发生的可能性,既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来近似主观概率——依据人们的主观判断而估计的随机事件发生的可能性大小–例如某经理认为新产品畅销的可能性是80%人们的经验、专业知识、对事件发生的众多条件或影响因素的分析等等,都是确定主观概率的依据统计学STATISTICS3-184.概率的基本性质非负性:–对任意事件A,有0P(A)1。规范性:–必然事件的概率为1,即:P()=1–不可能事件的概率为0,即:P()=0。可加性:–若A与B互斥,则:P(A∪B)=P(A)+P(B)–对于多个两两互斥事件A1,A2,…,An,则有:P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)上述三条基本性质,也称为概率的三条公理。统计学STATISTICS3-19(补充)关于概率的公理化定义概率的以上三种定义,各有其特定的应用范围,也存在局限性,都缺乏严密性。–古典定义要求试验的基本事件有限且具有等可能性–统计定义要求试验次数充分大,但试验次数究竟应该取多大、频率与概率有多么接近都没有确切说明–主观概率的确定又具有主观随意性苏联数学家柯尔莫哥洛夫于1933年提出了概率的公理化定义——通过规定应具备的基本性质来定义概率公理化定义为概率论严谨的逻辑推理打下了坚实的基础。统计学STATISTICS3-20三、概率的运算法则3.1随机事件及其概率1.加法公式2.乘法公式3.全概率公式和贝叶斯公式统计学STATISTICS3-211.加法公式用于求P(A∪B)——“A发生或B发生”的概率互斥事件(互不相容事件)–不可能同时发生的事件–没有公共样本点P(A∪B)=P(A)+P(B)互斥事件的加法公式ΩABP(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)统计学STATISTICS3-22【例3-3】设有50件产品,其中有5件次品,现从这50件中任取2件,若问至少抽到一件次品的概率?解:“至少抽到一件次品”这一事件实质上就是“抽取的2件产品中有一件次品”(记为A)与“抽取的两件产品均为次品”(记为B)这两个事件的和。由于A与B是两个互斥事件,故计算“至少抽到一件次品”的概率采用公式:P(A∪B)=P(A)+P(B)统计学STATISTICS3-23互补事件互补事件–不可能同时发生而又必然有一个会发生的两个事件互补事件的概率之和等于1)(1)(1)()(APAPAPAP或AA例如:掷一个骰子,“出现2点”的概率是1/6,则“不出现2点”的概率就是5/6。统计学STATISTICS3-24相容事件的加法公式相容事件–两个事件有可能同时发生–没有公共样本点相容事件的加法公式(广义加法公式)ABΩP(A∪B)=P(A)+P(B)-P(AB)ABΩAB事件的积(交)AB事件的和(并)统计学STATISTICS3-25【例3-4】将分别写有0至9这十个号码的小球装入一容器中,反复搅拌之后任意摇出一个小球,观察其号码。试求出现“奇数或大于等于4的数”的概率。解:所求事件=奇数(A)+大于等于4的数(B)={0,1,2,3,…,9},A={1,3,5,7,9},B={4,5,6,7,8,9}由于等可能性,P(A)=5/10,P(B)=6/10。P(A)+P(B)1,显然P(A∪B)≠P(A)+P(B)因为A和B存在共同部分AB={5,7,9},P(AB)=3/10。在P(A)+P(B)中P(AB)被重复计算了。正确计算是:P(A∪B)=5/10+6/10-3/10=8/10=0.8统计学STATISTICS3-262.乘法公式用于计算两个事件同时发生的概率。——也即“A发生且B发生”的概率P(AB)先关注事件是否相互独立统计学STATISTICS3-27(1)条件概率条件概率—在某些附加条件下计算的概率在已知事件B已经发生的条件下A发生的条件概率——P(A|B)条件概率的一般公式:)()()|(BPABPBAP其中P(B)0统计学STATISTICS3-28【例3-5】某公司甲乙两厂生产同种产品。甲厂生产400件,其中一级品为280件;乙厂生产600件,其中一级品有360件。若要从该厂的全部产品中任意抽取一件,试求:①已知抽出产品为一级品的条件下该产品出自甲厂的概率;②已知抽出产品出自甲厂的条件下该产品为一级品的概率。解:设A=“甲厂产品”,B=“一级品”,则:P(A)=0.4,P(B)=0.64,P(AB)=0.28①所求概率为事件B发生条件下A发生的条件概率P(A|B)=0.28/0.64②所求概率为事件A发生条件下B发生的条件概率P(B|A)=0.28/0.4统计学STATISTICS3-29P(A|B)=在B发生的所有可能结果中AB发生的概率即在样本空间Ω中考虑的条件概率P(A|B),就变成在新的样本空间B中计算事件AB的概率问题了(1)条件概率(续)一旦事件B已发生ABΩABBAB统计学STATISTICS3-30乘法公式的一般形式:P(AB)=P(A)·P(B|A)或P(AB)=P(B)·P(A|B)【例3-6】对例3-1中的问题(从这50件中任取2件产品,可以看成是分两次抽取,每次只抽取一件,不放回抽样)解:A1=第一次抽到合格品,A2=第二次抽到合格品,A1A2=抽到两件产品均为合格品P(A1A2)=P(A1)·P(A2|A1)=8082.02450198049445045=统计学STATISTICS3-31事件的独立性两个事件独立–一个事件的发生与否并不影响另一个事件发生的概率–P(A|B)=P(A),或P(B|A)=P(B)独立事件的乘法公式:P(AB)=P(A)·P(B)推广到n个独立事件,有:P(A1…An)=P(A1)P(A2)…P(An)统计学STATISTICS3-323.全概率公式完备事件组–事件A1、A2、…、An互不相容,–A∪A2∪…∪An=Ω–且P(Ai)0(i=1、2、...、n)对任一事件B,它总是与完备事件组A1、A2、…、An之一同时发生,则有求P(B)的全概率公式:niiiABPAPBP1)|()()(=统计学STATISTICS3-33例3-7假设有一道四选一的选择题,某学生知道正确答案的可能性为2/3,他不知道正确答案时猜对的概率是1/4。试问该生作出作答的概率?解:设A=知道正确答案,B=选择正确。“选择正确”包括:•“知道正确答案而选择正确”(即AB)•“不知道正确答案但选择正确”(即)P(B)=(2/3)×1+(1/3)×(1/4)=3/4BA)|()()|()()()()(ABPAPABPAPBAPABPBP==统计学STATISTICS3-34全概率公式——贝叶斯公式全概率公式的直观意义:–每一个Ai的发生都可能导致B出现,每一个Ai导致B发生的概率为,因此作为结果的事件B发生的概率是各个“原因”Ai引发的概率的总和相反,在观察到事件B已经发生的条件下,确定导致B发生的各个原因Ai的概率——贝叶斯公式(逆概率公式)(后验概率公式)统计学STATISTICS3-35贝叶斯公式若A1、A2、…、An为完备事件组,则对于任意随机事件B