第4章随机变量数字特征数学期望方差与标准差协方差与相关系数矩条件数学期望在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.然而,在实际问题中,概率分布一般是较难确定的.而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.因此,在对随机变量的研究中,确定某些数字特征是重要的.在这些数字特征中,最常用的是数学期望、方差、协方差和相关系数§4.1一维随机变量的数字特征引例一位射手的水平用打出的环数来记,其分布列为:4.1.1随机变量的数学期望1.01.03.02.01.006.006.005.002.001.010987654321~X则射手射击100次的平均环数近似为:)10(10)9(9)3(3)2(2)1(11001010100109100531002210011100101010930864532211XPXPXPXPXP由于打出环数的概率不同,所以不是1到10的算术平均.若当时,则称为随机变量X的数学期望或均值,记作,即有)(][kkkkkkxXPxpxXEkkkpxkkkpx,)(kkpxXP1.离散型随机变量的数学期望设随机变量X的分布律为][XE例1甲、乙两射手的稳定成绩分别为X(甲中环数)8910概率0.30.10.6Y(乙中环数)8910概率0.20.40.4试比较甲、乙两射手谁优谁劣。解甲的平均环数3.96.0101.093.08][XE2.94.0104.092.08][YE因此,从某种角度说,甲比乙射击本领高。乙的平均环数例2X~B(n,p),求E[X]。nkknkknnkknkknnkknkknqpCnpqpkCqpkCXE111110][11knknnCkC)!1()1()1(!)1()1(11kknnnnCkknnnkkCknkn二项分布的数学期望11011)(nniiniinqpnpqpCnpnp例3若X服从泊松分布P(λ),试求E[X]。解:ekkXEkk0!][0!iiie11!1kkkeee泊松分布的数学期望几何分布的期望p1]X[E,2,1kpq)kX(P1k则若证明:p1q11ppkq]X[E21k1k例4例5设想这样一种博彩游戏,博彩者将本金1元压注在1到6的某个数字上,然后掷三颗骰子,若所压的数字出现i次(i=1,2,3),则下注者赢i元,否则没收1元本金,试问这样的游戏规则对下注者是否有利?解:用随机变量X表示下注者1元注金带来的赢利,其可能取值是-1,1,2,3。显然可以用考察E[X]是否等于零来评价这一游戏规则对下注者是否有利。X的分布列为03332232133003)65()61(C)65()61(C)65)(61(C)65()61(C3211216121615216752161253211即216172161321615221675216125)1(]X[E由于平均赢利小于0,故这一游戏规则对下注者是不利的。)xX(P)x(g)]X(g[Ekkk时,,当已知kkkkkpxgpxXP)()(离散型随机变量函数的数学期望g(X)的数学期望为例6设X的分布律为X-1013概率81418341求E[X2]及E[-X+2]。019P2X412141411419211410][2XE法一:413831410811][22222XE法二:解:的分布列为:2)1(X41114123832141208121]2X[E数学期望在医学上的一个应用AnapplicationofExpectedValueinMedicine考虑用验血的方法在人群中普查某种疾病。集体做法是每10个人一组,把这10个人的血液样本混合起来进行化验。如果结果为阴性,则10个人只需化验1次;若结果为阳性,则需对10个人在逐个化验,总计化验11次。假定人群中这种病的患病率是10%,且每人患病与否是相互独立的。试问:这种分组化验的方法与通常的逐一化验方法相比,是否能减少化验次数?分析:设随机抽取的10人组所需的化验次数为X我们需要计算X的数学期望,然后与10比较化验次数X的可能取值为1,11先求出化验次数X的分布律。{X=1}=“10人都是阴性”{X=11}=“至少1人阳性”结论:分组化验法的次数少于逐一化验法的次数注意求X期望值的步骤!10109.0)1.01()1(XP109.01)11(XP10513.79.01119.01][1010)(-XE二、连续型随机变量的数学期望设X是连续型随机变量,其密度函数为f(x),在数轴上取很密的分点x0x1x2…,则X落在小区间[xi,xi+1)的概率是小区间[xi,xi+1)阴影面积近似为iixxf)(1)(iixxdxxf))((1iiixxxfiixxf)(由于xi与xi+1很接近,所以区间[xi,xi+1)中的值可以用xi来近似代替.这正是的渐近和式.因此X与以概率取值xi的离散型随机变量近似,该离散型随机变量的数学期望是小区间[xi,xi+1)阴影面积近似为iixxf)(iixxf)(iiiixxfx)(dxxxf)(定义若连续型随机变量X有概率密度函数f(x),并且积分收敛,则称积分为X的数学期望,记为E[X],即dxxfxdxxxfdxxxfXE][例7设X服从均匀分布,其分布密度为其它,0,1bxaabx解:2211][22ababdxabxXEba2ba求E[X]。均匀分布的期望dxxxf]X[Edxe2x222x,则令xu例8解:].X[E),(N~X2,求若正态分布的期望10212][2222duedueuXEuu][XE例90,00,:xxexfx密度函数为].[0XEX的指数分布,求服从参数为设0][dxexdxxxfXEx000dxexexdexxx解:指数分布的期望110xe设X服从柯西分布,即有密度函数证明X不存在数学期望。211xx证:0221211dxxxdxxx2020221ln1lim1ln1111xxxxdx故E[X]不存在。例10连续型随机变量函数的数学期望dxxfxgXg)](E[:,),(则且的密度函数为若连续型随机变量dxxfxgxfX当我们求E[g(X)]时,不必知道g(X)的分布,而只需知道X的分布就可以了.这给求随机变量函数的期望带来很大方便.例11解:0xdxsin21dxxxsin]X[sinE202,0x,02,0x,21x].[,sin],2,0[~YEXYUX试求若的密度函数为:X数学期望的性质(1)常数c的数学期望等于这个常数,即E[c]=c。证:随机变量X服从单点分布,即P(X=c)=1,所以,E[X]=E[c]=c×1=c(2)设c是常数,若E[X]存在,则E[cX]也存在,并且有E[cX]=cE[X]。)]X(g[E)]X(f[E)X(g)X(fE(3)]Y[E]X[E]XY[EY,X相互独立,则若]Y[E]X[E]YX[Ec]Y[bE]X[aE]cbYaX[E(4)特别地(5)b]X[Ea]X[E,bXa存在,且则若注:这些性质可以推广到多个随机变量上。]X[Ec]X[Ec]X[Ec]XcXcXc[Enn2211nn2211]X[E]X[E]X[E]XXX[EXXXn21n21n21相互独立,则、、若例12在n次重复独立试验中,每次成功的概率为p。设Xi表示第i次试验成功的次数,则Xi有分布律Xi01概率1-pppp1p10]X[Ei并且有n21XXX设np]X[E]X[E]X[E]XXX[E][En21n21此外,我们可以推导出η~B(n,p)则上一节我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征.但是在一些场合,仅仅知道平均值是不够的.4.1.2方差与标准差例如,某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图:若让你就上述结果评价一下两台仪器的优劣,你认为哪台仪器好一些呢?a乙仪器测量结果a甲仪器测量结果较好测量结果的均值都是a因为乙仪器的测量结果集中在均值附近又如,甲、乙两门炮同时向一目标射击10发炮弹,其落点距目标的位置如图:你认为哪门炮射击效果好一些呢?甲炮射击结果乙炮射击结果乙炮因为乙炮的弹着点较集中在中心附近.中心中心由此可见,研究随机变量与其均值的偏离程度是十分必要的.那么,用怎样的量去度量这个偏离程度呢?容易看到这个数字特征就是我们这一讲要介绍的方差]]X[EX[E能度量随机变量与其均值E[X]的偏离程度.但由于上式带有绝对值,运算不方便,通常用量]])X[EX[(E2来度量随机变量X与其均值E[X]的偏离程度.].[][).(,XXXVarXDX的标准差,记为为而称或记为的方差为则称如果有有限的数学期望,设随机变量,]])[[(2XEXEX定义]])X[EX[(E]X[Var21、对于离散型随机变量X,若有分布律p(xi),则jj2j2)x(p]X[Ex]X[EXE]X[Var2、对于连续型随机变量X,若有分布密度f(x),则dx)x(f]X[Ex]X[Var2由方差的定义,有由数学期望的性质,可导出计算方差的另一个公式:2222222])X[E(]X[E])X[E(]X[E]X[E2]X[E]X[EX]X[E2XE]X[EXE]X[Var方差的计算步骤Step1:计算期望E[X]Step2:计算E[X2]Step3:计算Var[X]离散型连续型离散型连续型kkkkk2211xpxpxpxp]X[Edx)x(xf]X[Ek2kk2kk2222112xpxpxpxp]X[Edx)x(fx]X[E2222])X[E(]X[E]X[Var例1].[][),,(~XXVarpnBX和试求若解:nkknkknnkknkknnkknkknnkknkknqpknCqpkkCqpCkqpCkXE111112022][二项分布的方差nkknkknqpkCnp111110111011niiniinniiniinqpCqpiCnp101111niiniinkiqpCinp11nqppnnpnpqnpqnpnppnnp