第二节概率的定义及其确定方法1.概率的定义2.求概率的频率方法3.求概率的古典方法4.求概率的几何方法1.概率的定义事件的概率,通俗地讲,是指该事件发生可能性大小地度量.在历史上,由于随机试验及随机事件的类型很多,人们也就从不同侧面用不同方式研究了如何度量事件发生的可能性.例如,研究女婴出生的概率,瑞典人通过大量观察,测得女婴出生的频率在0.482左右波动,得出女婴出生的概率约为0.482.再如,掷两颗骰子获得双6的概率,通过简单理论推算知道,其严格等于1/36.所以,概率研究的情形很多,也相应产生了一些特殊的计算方法.但如何对概率给出一个一般性的定义,使得这些特殊的计算方法得出的概率均符合这个一般性的定义???通过对各种概率问题的深入研究,抽象出概率的一般特征(这种研究方法常称为弱抽象),伟大的数学家,现代概率论奠基者,柯尔莫哥洛夫(Kolmogorov)提出了概率的公理化的定义,引领了现代概率论的发展.概率的公理化定义(或称柯尔莫哥洛夫公理):设Ω为样本空间,F为Ω上的一个事件域.如果对任一事件A∈F,定义在F上的实值函数P(A)满足0P(A),A:)1(F对于任意非负性1)P(:)2(Ω正则性1ii1iin21)P(AAP,,A,,A,A:)3(有互不相容若可列可加性则称P(A)为事件A的概率,称(Ω,F,P)为概率空间.概率的定义并没有告诉人们如何去求概率,也没有说一个特定的样本空间对应一个特定的概率,只是告诉人们以任何方式定义的概率必须满足的条件.概率的求法,根据问题的特点,分别采取以下的不同途径进行:•频率方法•古典方法•几何方法2.求概率的频率方法事实上,人们很早就开始了这方面的思考.例如,“频率”早就被引入来描述事件发生的频繁程度.为了研究女婴出生的可能性,统计学家克拉梅(1893-1985)利用瑞典1935年的官方资料,测得女婴出生的频率在0.482左右摆动,从而得出女婴出生的概率为0.482.频率(Frequency)的定义:设随机事件A在n次试验中出现nA次,则事件A在n次试验中发生的频率为nnAfAn)(频率的性质:1)(0,A)1(Afn对任意事件1)(,)2(SfSn对必然事件易知,随机事件的频率具有以下性质:)()()()(,k,,)3(21211knnnknkAfAfAfAAAfAA则个互不相容事件是若直觉告诉我们,事件的频率应能在一定程度上反映事件发生的可能性大小.因为如果事件发生的可能性大,它在n次试验中出现的机会也多,事件发生的频率就大些.但是,频率也有明显的缺陷:随机事件的频率fn(A)随着试验总次数n的不同而不同,这种波动性在n较小时较为明显,这就为频率作为一个潜在的衡量事件发生可能性的指标蒙上了阴影.为了证明这种说法,我们考虑“抛硬币”的试验:将一枚硬币抛5次,50次,500次各做10遍,得到的数据如下表.试验序号n=5n=50n=500nHƒn(H)nHƒn(H)nHƒn(H)1234567891023151242330.40.60.21.00.20.40.80.40.60.6222521252421182427310.440.500.420.500.480.420.360.480.540.622512492562532512462442582622470.5020.4980.5120.5060.5020.4920.4880.5160.5240.494从上表也可以看出一些好消息,在n较大时,事件的频率表现出一定的稳定性:即随着n的增大,fn(A)越来越趋近于一个常数.历史上许多人投掷硬币实验的结果也证实了这点.实验者nnHfn(H)德摩根204810610.5181蒲丰404020480.5069卡.皮尔逊1200060190.5016卡.皮尔逊24000120120.5003概率的频率化定义:当与随机事件有A关的随机试验可大量重复进行时,如进行n次.当n很大时,事件A出现的频率fn(A)=nA/n将稳定地在某一数值p附近摆动,且一般随试验次数n的增大,摆动的幅度也越来越小,则称该数值p为事件A发生的概率,记为P(A)=p这种大量重复试验中事件出现的频率的稳定性表明,随机事件发生的可能性大小是随机事件本身所固有的客观属性,我们用这个频率的稳定值来表示事件发生的可能性大小是合理的,这就是概率的频率化定义.容易验证,通过频率法定义的概率满足概率的公理化定义,实际上,我们只要验证频率满足那三条性质.求概率的频率方法的最大优势在于它让我们能够求得通过理论方法无法求得的概率.现在我们来看两个例子:例一(女婴出生率的研究).拉普拉斯在18世纪末对伦敦,彼得堡,柏林和法国的众多统计资料进行研究,发现这些国家的女婴出生率都稳定地接近于0.488.统计学家克拉梅(1893-1985)用瑞典1935年地官方资料(见下表),发现女婴出生频率总是在0.482左右波动.例二(被闪电击中概率的研究).如何求一个人在某年中被闪电击中的概率?中国1.1×109人中,在2005年被闪电击中的人数为3300人,通过概率的频率方法我们知道,某人被闪电击中的概率为69103101.13300频率方法的最大缺点是必须进行大量的重复试验.在无法进行大量的重复试验时,要获得频率的稳定值是比较困难的.因此,在很多情形下,常通过如下的严格的数学推导方法(即古典方法和几何方法),以获得概率的准确值.3.求概率的古典方法原理:古典方法适应于样本空间Ω只有有限个样本点,而且每个样本点的出现是等可能的情形..n1})P({})P({,};,,,{,n21n21即样本点等可能同时设每个即个样本点有若ΩΩ},,,,{A,mAm21iii不妨记为个样本点有如果事件nmn1n1n1})P({})P({})P({P(A)m21iii性有则根据概率的可列可加nmAP(A):中所含的样本点数中所含的样本点数概率的古典计算公式所以得到Ω在应用古典方法计算概率时,最大的难点在于确定Ω和A中的样本点数,之所以难的原因在于这里面往往涉及很多排列组合的计算.例三.在标有1至10的十个同样的球中,任取一球,求取到的球的标号是不超过6的偶数的概率.解:将每个不同的球作为样本点,则样本空间含有10个样本点,且由于是任取,每个样本点是等可能的,所以这是一个古典概型问题.以A表示取到的球是不超过6的偶数,则A={2,4,6}.故P(A)=m/n=3/10=0.3例四.设有N件产品,其中D件次品,从中任取n件,求其中恰有k(k≤D)件次品的概率.nNCn,N:样本点数就是方式数方式件的不同个产品中取样本空间就是从解:,通过两个步骤完成这个事件可以件次品个产品中有所求事件是knkDC,kD)1(方式数为件件次品里取从knDNCkn,DN)2(方式数为件个正品中取从knDNkDCC,为所求事件实现的方式数所以根据乘法原理因此所求事件的概率为nNknDNkDCCC例五.袋中装有4只白球和2只红球.从袋中摸球两次,每次任取一球.有两种方式:(a)放回抽样;(b)不放回抽样.求:(1)两球颜色相同的概率;(2)两球中至少有一只白球的概率.解:(a)放回抽样故P(A)=(44)/(66)0.444,P(B)=(22)/(66)0.111,则P(AB)=P(A)+P(B)0.556,P(C)=1-P(B)0.889样本空间:取两次球,共有66种取法.定义事件:A=“两球都是白球”,共有44种取法,B=“两球都是红球”,共有22种取法,C=“两球中至少有一只白球”,则AB=“两个球颜色相同”,,BC事件(b)不放回抽样.5612P(B),5634)(AP样本空间:第一次有6种取法,第二次有5种取法,共有65种取法.事件A的样本点:第一次有4种取法,第二次有3种取法,共有43种取法.事件B的样本点:第一次有2种取法,第二次有1种取法,共有21种取法.则P(AB)=P(A)+P(B)=7/15,P(C)=1-P(B)=14/15例六.(分房问题,类比于教材中例1.2.6的盒子模型)设有n个人,每个人都等可能地被分配到N个房间中的任一间去住(n≤N),求下列事件的概率(1)指定的n个房间各有一个人住(2)恰好有n个房间,其中各住一个人解:将n个人分配到N个房间去,相当于对每个人,我们从N个房间中抽一个房间让其住,而且这种抽样是放回式的,即不同的人可以住同一房间,所以抽法总数为Nn.又因为这里不同的分配法组成了题目的样本空间,且每个样本点等可能,所以这是一个古典概型问题.(1)因指定的n个房间各有1个人住,所以其不同住法是n个人的全排列n!,所以要求的概率nNnP!1样本空间中的样本点数事件中的样本点数(2)这个事件可以通过两个步骤来完成:步骤一:从N中任取n个房间;步骤二:将n个人排列到n个房间中去,每房间一个人.nnNNnCP!2样本空间中的样本点数事件中的样本点数.!,种该事件实现的方式有所以根据乘法原理nCnN分房模型在统计物理学里也有应用.在那里将本例中的“人”理解成“粒子”,“房间”理解成不同的“能级”.例七.(生日问题)某班级有n个人(n≤365),问至少有两个人的生日在同一天的概率有多大?解:假定一年按365天计算,把365天当作365个“房间”,那么问题类比于例五.这时,事件“n个人生日全不相同”就相当于例五中的(2):“恰有n个房间,其中各住一人”.令A={n个人中至少有两个人的生日在同一天},则其对立事件是{n个人的生日全不相同}.根据例五(2)知nnnnNnCNnCAP365!!)(365所以,nnnnNnCNnCAP365!1!1)(365这个例子就是历史上著名的“生日问题”,对一些n值,计算出相应的P(A)如下表:n102023304050P(A)0.120.410.510.710.890.97上表所列的答案是出乎很多人意料的,因为”一个班级至少有两个人生日相同”的概率,并不如大多数人直觉中想象的那样小,而是相当大.这个例子告诉我们,“直觉”有时并不可靠,这就说明研究随机现象统计规律的重要性.4.求概率的几何方法原理:前面我们讨论了古典概型的概率问题.在古典概型中,我们要求样本空间的样本点数只能是有限多个,这给许多实际问题的解决带来了很大限制.有时,我们必须考虑试验结果即样本点有无限多个的随机现象.例如,向平面上一有限区域S任意投点,求点在S内的小区域G中的概率.将该例拓展到一般情形,我们说有一类随机现象,它有两个特点:在这种几何概型下,定义任意事件A的概率为(1)随机试验的样本空间Ω对应于一个几何区域S,使得样本点与S中的点一一对应.此时,试验的任一事件必与S内的某一区域G相对应.(2)任意事件A的概率只与其对应区域G的量度(如长度,面积,体积)成正比,而与G的所在位置无关.的度量的度量SGAP)(例七.从区间[0,1]内任取两个数,求这两个数的乘积小于1/4的概率.解:以x,y表示从区间[0,1]中任取的两个数,则x,y的可能变化范围为0≤x≤1,0≤y≤1.现建立直角坐标系xoy如下图,0xy11GS则(x,y)的样本空间对应于图中边长为1的正方形区域S,而我们所关心的事件A=[0,1]中任取的两个数之积小于1/4发生的充要条件是0≤x,y≤1,xy1/4这对应于图中的阴影部分G,其面积为1412ln214141141/dxxG的面积5966.012ln2/14/1SG的面积的面积故所求事件的概率由例七可知:通常在用几何法求概率时,(1)首先选定与问题有关的变量(x,y等),确定这些变量所有可能的变化区域S;(2)然后用含有这些变量的不等式来表示所关心事件A发生的充要条件,从而得到其对应的区域G;(3)最后G与S的度量的比值就是所求事件的概率.例八(会面问题).甲乙两人约定在下午6时到7时之间在某处会面,并约定先