第五节条件分布与条件期望设(X,Y)是二维离散型随机变量,其分布律为P{X=xi,Y=yj}=pij,i,j=1,2,….(X,Y)关于X和关于Y的边缘分布律分别为P{X=xi}=pi·i=1,2,….P{Y=yj}=p·jj=1,2,….设pi·0,p·j0,考虑在事件{Y=yj}已发生的条件下事件{X=xi}发生的概率,即{X=xi|Y=yj},i=1,2,….的概率,由条件概率公式,.,2,1,}{},{}|{ippyYPyYxXPyYxXPjijjjiji一、离散型随机变量的条件分布律显然,上述条件概率具有分布律的特性(1).P{X=xi|Y=yj}≥0;1}|{).2(11jjijijijippppyYxXP1.定义设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=yj}0,则称.2,1,}{},{}|{ippyYPyYxXPyYxXPjijjjiji为在Y=yj条件下随机变量X的条件分布律。同理,对于固定的i,若P{X=xi}0,则称.,2,1,}{},{}|{jppxXPyYxXPxXyYPiijijiij为在X=xi条件下随机变量Y的条件分布律。2.条件分布函数xxjijjYXiyYxXPyYxXPyxF}|{}|{)|(|jxxijxxjijppppii同理:iyyijiXYppxyFj)|(|例二维离散型随机变量(X,Y)的分布律如表XYX1=-1X2=1X3=2Y=01/1203/12Y=3/22/121/121/12Y=23/121/120求条件分布律P{X=xi|Y=2}.解:X与Y的边缘分布如表:XYX1=-1X2=1X3=2p.jY=01/1203/124/12Y=3/22/121/121/124/12Y=23/121/1204/12pi.6/122/122/124/12P{X=-1|Y=2}=p13/p.3=3/4;P{X=1|Y=2}=p23/p.3=1/4;P{X=2|Y=2}=p33/p.3=0;又如:P{X=1|Y=0}=p21/p.1=0等;设(X,Y)是二维连续型随机变量,这时由于对任意x,y有P{X=x}=0,P{Y=y}=0,因此不能直接用条件概率公式引入条件分布函数P{X≤x|Y=y}.下面我们用极限的方法来处理.给定y,设对于任意固定的正数ε,P{y-ε<Y≤y+ε}0,于是对于任意x有}{},{}|{yYyPyYyxXPyYyxXP上式给出了在任意y-ε<Y≤y+ε下X的条件分布函数,现在我们引入以下的定义.二、连续型随机变量条件分布的定义1.条件分布函数的定义:给定y,设对于任意实数x,若极限}{},{lim}|{lim00yYyPyYyxXPyYyxXP存在,则称此极限为在条件Y=y下X的条件分布函数,记为P{X≤x|Y=y}或记为FX|Y(x|y).2.公式:设(X,Y)的分布函数为F(x,y),概率密度为p(x,y).若在点(x,y)处p(x,y)连续,且pY(y)0,则有}{},{lim)|(0|yYyPyYyxXPyxFYXxYYXYxYXduypyupyxFypduyupyxF)(),()|()(),()|(||或写成,亦即)()(),(),(lim0yFyFyxFyxFYY2/)()(2/),(),(lim0yFyFyxFyxFYY)(),(yFdydyyxFY3.条件概率密度定义yXXYYXdvxpvxpxyFxyF)(),()|()|(||和类似地可以定义)(),()|(|ypyxpyxpYYX同理,)(),()|(|xpyxpxypXXY称为在Y=y条件下X的条件概率密度,且满足概率密度的两个性质。称为在X=x条件下X的条件概率密度,且满足概率密度的两个性质。例:设(X,Y)服从二维正态分布N(µ1,µ2,σ12,σ22,),求在X=x的条件下,Y的条件密度函数pY|X(y|x).解:(X,Y)的密度函数为]})())((2)([)1(21exp{121),(2222212121212221yyxxyxpyx,由以前的例子知道21212)(121)(xXexp所以X=x条件下Y的条件概率密度为]12)(exp[121)(),()|(2222112222|xyxpyxpxypXXY这正是正态分布)1,(2221122xN例:设数X在区间(0,1)上随机地取值,当观察到X=x(0x1)时,数Y在区间(x,1)上随机取值.求Y的概率密度pY(y).解:按题意X具有概率密度其它0101)(xxpX对于任意的x(0x1),在X=x的条件下,Y的条件概率密度其它01011)|(|yxxxypXY于是得关于Y的边缘概率密度为dxyxfypY),()(其它010)1ln(110yydxxydxxypxpXYX)|()(|三、连续场合的全概率公式和贝叶斯公式),|()()|()(),(||xypxpyxpypyxpXYXYXY由条件概率密度定义知,故.)|()()(|dyyxpypxpYXYX.)|()()(|dxxypxpypXYXY全概率公式的密度函数形式代入条件概率密度定义式,即得.)|()()|()()|(|||dxxypxpxypxpyxpXYXXYXYX.)|()()|()()|(|||dyyxpypyxpypxypYXYYXYXY贝叶斯公式的密度函数形式例设X~),,(21N在X=x的条件下),,(|22xNxXY~求Y的概率密度).(ypY解根据题意,有2122)(121)(xXexp2222)(2|21)|(xyXYexyp.)|()()(|dxxypxpypXYXY故.21212222122)(22)(1dxeexyx.212222122)(2)(21dxexyx按x配方积分.)(21)(2)(222122212ye即Y仍服从正态分布.),(2221N二、条件数学期望1定义:X在Y=y的条件下的条件分布的数学期望(若存在)称为X在Y=y的条件下的条件期望.具体定义式:(1)当(X,Y)为离散随机向量时,,)|()|(iiiyYxXPxyYXE(2)当(X,Y)为连续随机向量时,,)|()|(|dxyxxpyYXEYX同样地可定义Y在X=x的条件下的条件期望.若记),|()(yYXEyg可以看出,X在Y=y的条件下的条件期望是y的函数,它是一个变量.这不同于无条件期望E(X).)|(yYXEY取确定值y的条件下Y取值随机的条件下)|(YXE则)|()(YXEYg作为随机变量Y的函数,我们可称之为在给定Y的条件下X的条件期望,它是随机变量.2.重期望公式定理:设(X,Y)为二维随机向量,且E(X)存在,则)).|(()(YXEEXE证明:略.特殊的情形(1)Y离散情形下)()(YEgXE.)()|(jjjyYPyYXE(2)Y连续情形下)()(YEgXE.)()|(ypyYXEY给定Y=y时算X的条件期望,然后按Y=y的可能性大小进行加权平均条件期望的应用设在一个指定的时间内供给一水电公司的电能ξ是一个随机变量,且ξ在[10,30]上服从均匀分布.该公司对于电能的需要量η也是一个随机变量,且η在[10,20]上服从均匀分布.对于所供给的电能,公司取得每千瓦0.03元利润,如果需要量超过所能供给的电能,公司就从另外的来源取得附加的电能加以补充,并取得每千瓦0.01元利润,问在所考虑的指定时间内,公司所获得的利润的期望值是多少?例解:设T是公司所获得的利润,则当时,)20,10[x),(01.003.0,03.0T2010101)02.001.0(10103.0)|(xxdyxydyyxTE2001.004.005.0xx当时,]30,20[x由全概率公式,得201010103.0)|(dyyxTE45.030202010245.0201)001.004.005.0(201))|((dxdxxTEE43.0(随即个随机变量和的数学期望)例设,,,,21nXXX为一列独立同分布的随机变量,N是只取正整数的随机变量,且N与{Xn,n=1,2,…}相互独立.则有).()()(11NEXEXENii证明:)(1NiiXE)).|((1NXEENii).()|(11nNPnNXEnNii).()(11nNPXEnnii).()(11nNPXnEn).()(11nNPnXEn=E(N)).()(1NEXE该结果的应用:见P197