第二章条件概率与统计独立性萨特,法国思想家、作家,存在主义哲学的大师:“Hellisotherpeople”他人即地狱对“我”来说,其他的人就像一个贼,要将“我”的世界偷去,将我纳入他们的轨道中,成为一个“在己存有”(being-in-itself),成为一个对象或东西。WhatshouldIdo?ShouldIbewhoyouwantmetobe?Justdoit!在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.一、条件概率的概念如在事件B发生的条件下求事件A发生的概率,将此概率记作P(A|B).一般地P(A|B)≠P(A)§1.条件概率,全概率公式,贝叶斯公式P(A)=1/6,例如,掷一颗均匀骰子,A={掷出2点},B={掷出偶数点},P(A|B)=?掷骰子已知事件B发生,此时试验所有可能结果构成的集合就是B,P(A|B)=1/3.B中共有3个元素,它们的出现是等可能的,其中只有1个在集A中.容易看到)()(636131BPABPP(A|B)于是P(A)=3/10,又如,10件产品中有7件正品,3件次品,7件正品中有3件一等品,4件二等品.现从这10件中任取一件,记B={取到正品}A={取到一等品},P(A|B))()(10710373BPABP则P(A)=3/10,B={取到正品}P(A|B)=3/7本例中,计算P(A)时,依据的前提条件是10件产品中一等品的比例.A={取到一等品},计算P(A|B)时,这个前提条件未变,只是加上“事件B已发生”这个新的条件.这好象给了我们一个“情报”,使我们得以在某个缩小了的范围内来考虑问题.条件概率的直观定义某个事件发生的可能性大小经常会受到另一相关事件发生与否的影响.若在事件A已发生的条件下,事件B发生的概率为p,则称p为在已知A发生的条件下,B发生的条件概率,记为.)|(ABPExample考虑美国东部某大城市警察局男性与女性警官的升职情况.警察局有1200名警官,男性960人,女性240人.在过去两年中有324名警官得到提升,男性288人,女性36人.在浏览了升职记录后,一个由女性警官组成的委员会指出在升职过程中存在性别歧视.其依据是升职人数男性与女性比为288:36;而警察局官员否认歧视,认为男性升职多只是因为警官中男性本来就比女性多很多.经过计算,男性警官升职概率为0.30,女性警官升职概率为0.15.条件概率的使用本身不能表明歧视的存在,但条件概率的数值则成为女警官们指控的有力证据!1.在古典概型中,讨论时,样本空间已缩小为“包含的所有事件”,故)|(ABPA发生的基本事件个数数同时发生的基本事件个ABAABP,)|(;)()(APABP2.同样,在几何概型中)()()|(AmABmABP.)()(APABP若事件B已发生,则为使A也发生,试验结果必须是既在B中又在A中的样本点,即此点必属于AB.由于我们已经知道B已发生,故B变成了新的样本空间,于是有(1).设A、B是两个事件,且P(B)0,则称(1))()()|(BPABPBAPABAB定义2.1.1(conditionalprobability)为在事件B发生的条件下,事件A的条件概率.条件概率的性质:|件具备概率定义的三个条条件概率AP;0|,:1ABPB对于任意的事件非负性;1|:2AP规范性,,,:321则有是两两互斥事件设可列可加性BB11iiiiABPABP.对条件概率都成立所以在前面证明的性质譬如)()()()(212121ABBPABPABPABBP)(1)(ABPABP)()()(21121ABBPABPABBP2)从加入条件后改变了的情况去算条件概率的计算1)用定义计算:,)()()|(BPABPBAPP(B)0掷骰子例:A={掷出2点},B={掷出偶数点}P(A|B)=31B发生后的缩减样本空间所含样本点总数在缩减样本空间中A所含样本点个数.)()(,)(,)(,.,)(,,)(大比一般来说中样本点数中样本点数中样本点数中样本点数则用古典概率公式发生的概率计算中表示在缩小的样本空间而的概率发生计算中表示在样本空间ABPABPABABPABABPBABPABABPAA的区别与积事件概率条件概率)()(ABPABPBASamplespaceReducedsamplespacegiveneventBAB条件概率P(A|B)的样本空间()PAB(|)PAB例甲、乙两厂共同生产1000个零件,其中300件是乙厂生产的.而在这300个零件中,有189个是标准件,现从这1000个零件中任取一个,问这个零件是乙厂生产的标准件的概率是多少?所求为P(AB).甲、乙共生产1000个189个是标准件300个乙厂生产300个乙厂生产设B={零件是乙厂生产},A={是标准件}所求为P(AB).设B={零件是乙厂生产}A={是标准件}若改为“发现它是乙厂生产的,问它是标准件的概率是多少?”求的是P(A|B).B发生,在P(AB)中作为结果;在P(A|B)中作为条件.甲、乙共生产1000个189个是标准件300个乙厂生产例人寿保险公司常常需要知道存活到某一个年龄段的人在下一年仍然存活的概率。根据统计资料可知,某城市的人由出生活到50岁的概率为0.90718,存活到51岁的概率为0.90135。问现在已经50岁的人,能够活到51岁的概率是多少?解}50{岁活到A}51{岁活到B记因此BAB要求)(ABPAB显然90135.0)()(BPABP90718.0)(AP90135.0)(BP因为从而99357.090718.090135.0)()()(APABPABP可知该城市的人在50岁到51岁之间死亡的概率约为0.00643。在平均意义下,该年龄段中每千个人中间约有6.43人死亡。由条件概率的定义:即若P(B)0,则P(AB)=P(B)P(A|B)(2))()()|(BPABPBAP而P(AB)=P(BA)乘法公式若已知P(B),P(A|B)时,可以反求P(AB).将A、B的位置对调,有故P(A)0,则P(AB)=P(A)P(B|A)(3)若P(A)0,则P(BA)=P(A)P(B|A)(2)和(3)式都称为乘法公式,利用它们可计算两个事件同时发生的概率.个事件的积事件的情况乘法定理可以推广到多,0,则且为三个事件、、设ABPCBA.||APABPABCPABCP,2,,,,,21并且个事件设有一般地nAAAnn,,0121可得则由条件概率的定义nAAAP2-211-12121||nnnnnAAAAPAAAAPAAAP112213||APAAPAAAP乘法公式应用举例一个罐子中包含b个白球和r个红球.随机地抽取一个球,观看颜色后放回罐中,并且再加进c个与所抽出的球具有相同颜色的球.这种手续进行四次,试求第一、二次取到白球且第三、四次取到红球的概率.波里亚(Pólya)罐子模型b个白球,r个红球于是W1W2R3R4表示事件“连续取四个球,第一、第二个是白球,第三、四个是红球.”b个白球,r个红球随机取一个球,观看颜色后放回罐中,并且再加进c个与所抽出的球具有相同颜色的球.解设Wi={第i次取出是白球},i=1,2,3,4Rj={第j次取出是红球},j=1,2,3,4用乘法公式容易求出当c0时,由于每次取出球后会增加下一次也取到同色球的概率.这是一个传染病模型.每次发现一个传染病患者,都会增加再传染的概率.crbcrcrbrcrbcbrbb32=P(W1)P(W2|W1)P(R3|W1W2)P(R4|W1W2R3)P(W1W2R3R4).,,,,,,,2;,,2,1,,1,,,,,2121210021构成一个完备事件组或称的一个分割,为样本空间则称 若的一组事件为的样本空间为试验设 定义nnnjinAAAAAAAAAnjiAAEAAAE样本空间的分割1A2A3AnA1nA二、全概率公式,,,2,10,则对且的一个划分为niAPi,恒有样本空间中的任一事件BniiiABPAPBP1|nAAAE,,,Thm21的样本空间,为随机试验设jiAA由))((jiBABA)()()()(21nBAPBAPBAPBP图示B1A2A3A1nAnA证明.21nBABABA化整为零各个击破)(21nAAABBB)|()()|()()|()()(2211nnABPAPABPAPABPAPBPniiiABPAPBP1|.全概率公式.,,,,的一个划分的关键是要找到一个合适时故在应用此全概率公式至少一个同时发生与这组互不相容事件中使得某个未知事件个互不相容事件组而这些简单事件组成一的简单事件再求解事件分解为若干个已知是把一个未知的复杂全概率公式的基本思想B某一事件B的发生有各种可能的原因,如果B是由原因Ai(i=1,2,…,n)所引起,则B发生的概率是每一原因都可能导致B发生,故B发生的概率是各原因引起B发生概率的总和,即全概率公式.P(BAi)=P(Ai)P(B|Ai)全概率公式.我们还可以从另一个角度去理解由此可以形象地把全概率公式看成为“由原因推结果”,每个原因对结果的发生有一定的“作用”,即结果发生的可能性与各种原因的“作用”大小有关.全概率公式表达了它们之间的关系.诸Ai是原因B是结果B1A2A3A1nAnA例有一批同一型号的产品,已知其中由一厂生产的占30%,二厂生产的占50%,三厂生产的占20%,又知这三个厂的产品次品率分别为2%,1%,1%,问从这批产品中任取一件是次品的概率是多少?设事件A为“任取一件为次品”,.3,2,1,iiBi厂的产品任取一件为为事件123,BBB解.3,2,1,,jiBBji由全概率公式得,2.0)(,5.0)(,3.0)(321BPBPBP30%20%50%2%1%1%112233()()()()()()().PAPBPABPBPABPBPAB.013.02.001.05.001.03.002.0,01.0)(,01.0)(,02.0)(321BAPBAPBAP112233()()()()()()()PAPBPABPBPABPBPAB故称此为贝叶斯公式.三、贝叶斯公式贝叶斯资料则且的一个划分为的事件为的样本空间为试验设定义),,,2,1(0)(,0)(,,,,,,21niAPBPAAAEBEin.,,2,1,)()|()()|()|(1niAPABPAPABPBAPnjjjiii证明)()()|()(BPAPABPBAPiii.,,2,1ni[证毕]njjjiiABPAPABPAP1)|()()|()(贝叶斯公式在实际中有很多应用.它可以帮助人们确定某结果(事件B)发生的最可能原因.全概率公式贝叶斯公式若干原因结果如果把随机事件B看成是结果,随机事件组A1,…,An看成可能导致结果B发生的若干原因,贝叶斯公式在决策理论中有重要应用:不断地根据新得到的信息来修正原来的观点。例某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?则表示“抽查的人不患癌症”.CCC已知P(C)=0.005,P()=0.995,P(A|C)=0.95,P(A|)=0.04求解如下:设C={抽查的人患有癌症},A={试验结果是阳性},求P(C|A).现在来分析一下结果的意义.由贝叶斯公式,可得)|()()|()()|()()|(CAPCPCAPCPCAPC