§3.2随机变量的方差数学期望反映了随机变量取值的平均水平,例如对正态分布,即使它们的均值相同,密度它是随机变量的重要数字特征然而,一个随机曲线的形状也可能有很大的差异.又如考察两个变量的数学期望往往不能很好地反映随机变量的全部特点,特别是随机变量取值的离散程度.化情况.为了反映随机变量的这种离散程度,我们引入方差概念.一样的,还必须考虑这两个班级学生的两极分绩相同,也不能说明这两个班级的学习情况是平行班级的学习情况,即使两个班级的平均成一、方差的概念1.定义1定义3.2.1设变量的方差,并记为.由定义可知.它与E2)(EE2)(EEDD0D存在,如果方差的平方根存在,则称为随机又称为标准差或根方差,常记为是一个随机变量,数学期望或Var的单位一致.注意方差是反映随机变量取值相对于均值E实上(()0EEEE描述.但2()E2()E离程度的数量指标,为了避免正负偏差相互抵消(事其数学期望,反映这种偏差程度的大小.偏),这种偏差用平方项也是一个随机变量,因此取为离散型的随机变量,它的分布列为iaaa21iiaPpippp21则D2)(EE2222211()2iiiiiiiaEpaaEEpEE为连续型的随机变量,它的密度函数为,D2()()xExpxdx=则p(x)若=若=2.方差的计算公式,所以得方差的计算公式222222DEEEEEEE22()EE通常情况下都用此公式计算方差.D22()EE注意上式可变形为E22)(ED因为数理统计中应用相当广泛.==.此式在二、几种常用分布的方差1)退化分布=1=)(cPEc2)两点分布的分布列为10ipp1pEpD22()EEp2ppqc为常数=0即常数的方差为0,D设====,3)二项分布knkknqpCkP)(k=0,1,2,因为2211100()nnkknkkknknnkkEkCpqnpkCpq11110(1)nkkkknknknpkCpq11111100nnkknkkknknnkknpkCpqnpCpq上式右端前项和式恰是(,1,)bknp~b(k;n,p),n,的数学期望,2(1)[(1)1]Enpnpnpnpnp22()EE=D21nnp2()npnpnpq后项和式为1()1npq+4)Poisson分布),p(ekk!(k=0,1,20,故则==k)=设~p(k,,n),因为E12201()()!(1)!kkkkEkekekk10(1)!kkkkkek00!!kkkkkeekk2故2222().DEE可见,对服从泊松分布的随机变量来说,它的数学期望与方差相等,都等于已知=.5)几何分布设pqk1E22111111[(1)]kkkkkkEkpqpkkqkq已知221(1)kkpqkkqp01()kkpqqp11()1pqqp221qpp22222211()qqDEEpppp故k=1,2,=k)=~g(k;p)p(=1/p,因为6)均匀分布设~,,Uab1,,()0,,xabbapxxab已知2abE32222222()4()3()().12bbaaxaabbExpxdxbabaDEE即,,因为设)(~E1,E因为2222()()xxExpxdxxedxxde22022[]xxxeedx22222211()()()DEE所以7)指数分布,已知8)正态分布设),(~2N,E对正态分布,我们直接采用定义来计算()D22()221()2xDxedx22222xyyyedy2222[]22yyyeedy,已知22212yedy2由此可知,正态分布的第二个参数数学期望和标准差它就是正态分布的标准差。因此,正态分布由其2的概率意义,(或方差)所唯一确定.三、方差的性质性质1若0Dcc性质2若c2DccD222222.DcEcEcEcEcEEcD事实上性质3若存在,则DD()DDD为常数,则为常数,则是两个相互独立的随机变量,且,,事实上222222222()()[()](2)()2()[()2()]DEEEEEEEEEEEE因为,().EEE于是DDEEEED2222)()()(一般地,若,相互独立,所以有相互独立,则DkDkkkD222121)(为常数)2k1k更一般地,若12,,nnnDDD11性质4对任意的常数EC2)(CED事实上22222()()()2()()()().ECEEECEEECEEECDEC两两独立,则,则有(,在理论研究和实践应用中,为了简化证明或方便计算,往往对随机变量进行所谓标准化,即如随机变量D*D*为*0*1D,.的标准化随机变量,由期望和方差的性质易验,存在和,则令,称例3.2.1若解:令不出现次试验中在第出现次试验中在第AiAii,0,1{1,2,,iniDnpn1,21DDD.nDnpq+~b(k;n,p)求D.+例3.2.2设掷两颗骰子,用第二颗骰子出现的点数,求两颗骰子出现点数之差的方差.解:令出现的点数则分别表示第一、,分别表示第一、第二颗骰子,同分布,分布列为与=E27E34461)654321(2222222E22()DDEE1229)27(3442=故62912292)(D6,5,4,3,2,1,61kkPkP四、契贝晓夫不等式我们知道方差反映了随机变量离开数学期望的平均偏离程度,如果随机变量方差为(与EDEPEDD的数学期望为,,事件,那么对任意大于零的常数应该)发生的概率越大那有一定的关系,粗略的说,如果么)(EP就有下面著名的契贝晓夫不等式.定理3.2.1对任意的随机变量,若aED又存在2)(DaP下面给出契贝晓夫不等式的证明也会越大,将这个直觉严格化,,则对任意正数有证明仅以连续型情形给出证明,设是一个连续型随机变量,密度函数)(xp则22||||222()(||)()()1()().xaxaxaPapxdxpxdxDxapxdx在上述证明中,如果把密度函数换成分布列,把积分号换成求和号,即得到离散型情形的证明.契贝晓夫不等式也可以表示成2()1DPa由切比雪夫不等式看出,D发生的概率越小,此可见,方差刻划了随机变量取值的离散程度.越小,事件的附近取值.由越是集中在注意在契贝晓夫不等式给出的估计式中,不需要知道随机变量具体服从什么分布,只须知道方差D及数学期望E来是比较方便的.但因为它没有完整的用到随机变量的统计规律——分布函数或密度函数,所以一般说来,它给的估计往往是比较粗糙的.两个数字特征就够了,因而使用起利用契贝晓夫不等式可以证明下列事实:随机变量0D某个常数值的概率为1,即1)(aP这个结论的充分性是显然的,下面证明必要性:0)1()1()1()0(01211nnnnDnEPnEPEP取的充要条件是的方差由此知0)(EP从而其中常数aE在方差已知的条件下,契贝晓夫不等式给出了它的期望E即为的偏差不小于的概率估计式。与例如取=2,则有2(2)0.254DPEDD于是,对任意的分布,只要期望与方差都存在,则随机变量E均方差的概率小于0.25.的偏差不小于两倍的与它的期望例3.2.3在每一次试验中,事件A发生的概率为0.75,试用契贝晓夫不等式,求:独立性试验次数n最小值时,事件A出现的频率在0.74至0.76之间的概率为0.90.解:设,且;,0.75bkn0.75,0.750.250.1875EnDnn为n次试验中,事件发生的次数,则所求为满足(0.740.76)0.90Pn(0.740.76)(0.010.750.01)(0.01)PPnnnPEnn在契贝晓夫不等式中取0.01n21.875(0.740.76)(0.01)11(0.01)DPPEnnnn依题意,取n使1.87510.9n18750n的最小n,由,则,解得.即n取18750时,可以使得在n次独立重复试验中,事件出现的频率在0.74至0.76之间的概率为0.90.