§3.2条件概率与随机变量的独立性一、条件分布的概念在第一章中,曾介绍了条件概率的概念,那是对随机事件而说的。本节要从事件的条件概率引入随机变量的条件概率分布的概念。引例考虑某大学的全体学生,从中随机抽取一个学生,分别以X和Y表示其体重和身高,则X和Y都是随机变量,它们都有一定的概率分布。现在若限制1.7Y1.8(米),在这个条件下去求X的条件分布,这就意味着要从该校的学生中把身高在1.7米和1.8米之间的那些人都挑出来,然后在挑出的学生中求其体重的分布。设X是一个随机变量,其分布函数为(){}XFxPXxx若另有一事件A已经发生,并且A的发生可能会对事件{X≤x},则对任一给定的实数x,记(|){|}XFxAPXxA并称为在事件A发生的条件下,X的条件分布函数。(|)XFxA条件分布函数例1设X在区间[0,1]上服从上的均匀分布,求在已知X1/2的条件下的条件分布函数。解因为X在[0,1]上服从均匀分布,其分布函数为0,0(),011,1xFxxxx由于X在[0,1]上服从均匀分布,故1{12}2PX当时,12X{,12}0PXxX当时,12X1{,12}()2PXxXFxF1()2Fx由条件分布函数的定义,有1{,12}|2{12}PXxXPxXPX11,1221,12xxx0,0(),011,1xFxxxx从而0,12(|12),1211,1xFxXxxx二、随机变量的独立性设A是随机变量Y所生成的事件:A={Y≤y},且则有{}0PYy{,}(,)(|){}()YPXxYyFxyFxYyPYyFy一般地,由于随机变量X,Y之间存在相互联系,因而一个随机变量的取值可能会影响另一个随机变量的取值统计规律性。在何种情况下,随机变量X,Y之间没有上述影响,而具有所谓的“独立性”,我们引入如下定义。定义1设随机变量(X,Y)的联合分布函数为F(x,y),边缘分布函数为FX(x),FY(y),若对任意实数x,y,有{,}{}{}PXxYyPXxPYy即(,)()()XYFxyFxFy则称随机变量X和Y相互独立。注:若随机变量X和Y相互独立,则联合分布由边缘分布惟一确定。定理1随机变量X与Y相互独立的充要条件是X所生成的任何事件与Y生成的任何事件独立,即,对任意实数集A,B,有{,}{}{}PXAYBPXAPYB定理2如果随机变量X与Y相互独立,则对任意函数,,均有和相互独立。1()gx2()gy1()gX2()gY证令1(),gX2(),gY对任意x,y,记11{|()}xDtgtx22{|()}yDtgty则由定理1,有12{,}{(),()}PxyPgXxgYy12{,}xyPXDYD12{}{}xyPXDPYD{}{}PxPy从而,由定义知和相互独立。关于两个随机变量的独立性的概念可以推广到n个随机变量的情形三、离散型随机变量的条件分布与独立性设(X,Y)是二维离散型随机变量,其概率分布为{,}ijijPXxYyp,1,2,ij由条件概率公式,当时,有{}0jPYy{,}{|}{}ijijjPXxYyPXxYyPYyijjpp称其为在的条件下随机变量X的条件概率分布。jYy类似地,定义在的条件下随机变量Y的条件概率函数:iXx{,}{|}{}ijjiiPXxYyPYyXxPXxijipp1,2,i1,2,j条件分布是一种概率分布,它具有概率分布的一切性质。定义2若对(X,Y)的据有可能取值(xi,yj),有{,}{}{}ijijPXxYyPXxPYy即ijijppp,1,2,ij则称X和Y相互独立。例2设X和Y的联合分布律为XY-1020.10.200.30.050.10.1500.1012(1)求Y=0时,X的条件概率分布;(2)判断X与是否相互独立?解(1){0}0.20.0500.25PY在Y=0时,X的条件概率分布为{0,0}0.2{0|0}0.8{0}0.25PXYPXYPY{1,0}0.05{1|0}0.2{0}0.25PXYPXYPYXY-1020.10.200.30.050.10.1500.1012{2,0}0{2|0}0{0}0.25PXYPXYPY即X012P{X=xi|Y=0}0.80.20同理{0}0.10.200.3PX故X=0时,Y的条件概率分布为{0,1}0.11{1|0}{0}0.33PXYPYXPX{0,0}0.22{0|0}{0}0.33PXYPYXPX{0,2}0{2|0}0{0}0.3PXYPYXPX(2)因为{0}0.10.20.3PX{1}0.10.30.150.55PY{0,1}{0}{1}PXYPXPY所以X与Y不相互独立。而,可见{0,1}0.1PXY即Y-102P{Y=yi|X=0}1/32/30例3设随机变量X与Y相互独立,下表列出了二维随机变量联合分布律及关于X和关于Y的边缘分布律中的部分数值,试将其余数值填入表中的空白处.XY1y2y3y{}iiPXxp{}ijPYyp1x2x1818161解由于11112111{,}{}{,}6824PXxYyPYyPXxyy又因为X与Y相互独立,有1111{}{}{,}PXxPYyPXxYy11241{}164PXxXY1y2y3y{}iiPXxp{}ijPYyp1x2x18181611241413{,}PXxYy1111424812112213{}144PXx3428381213又设22{,}PXxYya则2231{}{}()48aPXxPYya21{}()8PYya由独立性,有解得13432a或38a于是2331324888p2131882p31211283p四、连续型随机变量的条件密度与独立性设(X,Y)是二维离散型随机变量,由于对任意的x,y{}0PXx{}0PYy所以不能直接用条件概率公式引入“条件分布函数”。定义3设二维离散型随机变量(X,Y)的概率密度为f(x,y),边缘密度为fX(x),fY(y),则对一切使fX(x)0的x,定义在X=x的条件下Y的条件概率密度为|(,)(|)()XYYfxyfxyfy类似地,对一切使fY(y)0的y,定义在Y=y的条件下X的条件概率密度为|(,)(|)()YXXfxyfyyfx关于定义内涵的解释:以为例|(,)(|)()XYYfxyfxyfy|(,){,}(|)(){}XYYfxydxdyPxXxdxyYydyfyydxfydyPyYydy{|}PxXxdxyYydy也就是说,对很小的dx和dy,fX|Y(x|y)表示已知Y取值于y和y+dy之间的条件下,X取值于x和x+dx之间的条件概率。运用条件概率密度,可以在已知某一随机变量值的条件下,定义与另一随机变量有关的事件的条件概率。即若(X,Y)是连续型随机变量,则对任一集合A,|{|}(|)XYAPXAYyfxydx特别地,取A=(-∞,+∞),定义在已知Y=y的条件下X的条件分布函数为||(|){|}(|)xXYXYFxyPXxYyftydt二维连续型随机变量的独立性定义4设(X,Y)为二维连续型随机变量,f(x,y)为其联合概率密度,fX(x),fY(y)分别为X与Y的边缘密度,若任意的x,y,有(,)()()XYfxyfxfy几乎处处成立,则称X,Y相互独立。注:“几乎处处成立”的含义是:在平面上除去面积为0的集合外,处处成立。例4设(X,Y)的概率密度为(),0,0(,)0,xyxexyfxy其它问X和Y是否独立?(),0,0(,)0,xyxexyfxy其它解()(,)Xfxfxydy()0()xyXfxxedy0xyxeedy0()|xyxeexxe当x0时,,0()0,xXxexfx其它所以同样,有()0()xyYfyxedx当x0时,0yxexedxye00[|]yxxexeedx0[]yxee,0()0,yYeyfy其它而对一切x,y均有(,)()()XYfxyfxfy故X与Y相互独立。例5甲乙两人约定中午12时30分在某地会面.如果甲来到的时间在12:15到12:45之间是均匀分布.乙独立地到达,而且到达时间在12:00到13:00之间是均匀分布.试求先到的人等待另一人到达的时间不超过5分钟的概率.又甲先到的概率是多少?解设X为甲到达时刻,Y为乙到达时刻,以12时为起点,以分为单位,依题意,~(15,45)XU~(0,60)YU即有1,1545()300,Xxfx其它1,060()600,Yyfy其它xyo605545yx5xy5xy15由X,Y独立性知1,1545,060(,)()()18000,XYxyfxyfxfy其它先到的人等待另一人到达的时间不超过5分钟的概率为{||5}PXY,甲先到的概率为{}PXY{||5}{55}PXYPXY45515511800xxdydx45151180dx16xyo605545yx5xy5xy154560151{}1800xPXYdydx45151(60)1800xdx2451516018002xx45151(120)|900xx12例6设221212(,)~(,,,,)XYN(1)求和|(|)XYfxy|(|)YXfyx(2)证明X与Y相互独立的充要条件是0解|(,)(|)()XYYfxyfxyfy221122222121222221()()()()222(1)212()2212112xxyyyee21221212(1)21121xye21222211()2(1)21121xye故在Y=y的条件下,X服从正态分布:对称地,在X=x的条件下,Y服从正态分布:2211222(|)~(),(1)XYyNy2222111(|)~(),(1)YXxNx(2)比较与和的密度函数:f(x,y),fX(x),fY(y)可知,当且仅当时,221212(,,,,)N211(,)N222(,)N0(,)()()XYfxyfxfy即,当且仅当时,X与Y相互独立。0例7设随机变量(X,Y)的概率密度为,0(,)0,yexyfxy其它(2)求在Y=y的条件下,X的条件概率密度。(1)求X与Y的边缘概率密度,并判断X与Y相互独立。xyoyx解(1)由()(,)Xfxfxydy()x当x≤0时,()0Xfx当x0时,()yxXxfxedye所以,0()0,0xXexfxx类似得,0()0,yYyeyfyy0(2)求在Y=y的条件下,X的条件概率密度。由(1)知,当y0时,fY(y)0的条件