1第三章随机变量的数字特征§3.3协方差和相关系数(续)2定义设为二维随机变量,如果(,)XY[(())(())]EXEXYEY--存在,称其为与的协方差,记为XY(,)[(())(())]EXEXYECovXYY=--协方差内容复习用公式(,(()()))EXYEXCovXEYY-=3协方差性质:),(),(1CovabbaCov),(),(),(22121CovCovCov0),(3Cov相互独立,则与),(2)(4CovDDD(,(()()))EXYEXCovXEYY-=4(,)[(())(())]EECvEoxxhxhh--=协方差注:1°协方差可正、可负、可为零。2°受量纲的影响,不便于实际应用。为了方便应用,消除了量纲的影响,EEDDxxhhxhhxDEDEE(,)CovxhDDEEE))((与的相关系数5定义3.5(P.95)设,则称0,0DD(,)Cov为与的相关系数。DDEEE))((相关系数(,)CovDD6221)~(0,1),,2~(1,1),,3)~(1,1),23,UUU求)求求例4.解:1)(,)CovDD(,)()()()ECvEEoxhxhxh-=()Ex=12()Dx=112[]()()()EDEhxx=+2=+=1111243[]()()()DEEhhh=-22[]()()EExh=-24=-=21145345,(),xfx其它x1010()()EExhx=3xdx130114(,)Covxh1111423121120.9681412457221)~(0,1),,2~(1,1),,3)~(1,1),23,UUU求)求求例4.解:2)(,)CovDD(,)()()()ECvEEoxhxhxh-=()Ex=0()Dx=16,(),xfx其它x11120()()EExhx=3xdx13110(,)Covxh00000DD8221)~(0,1),,2~(1,1),,3)~(1,1),23,UUU求)求求例4.解:3)(,)CovDD(,)(,)CovCovxhxx23319DDD(,)()()()ECvEEoxhxhxh-=()()EEExxxx2323()()EEExxxx22323EEEExxxx222323EEDxxx22333()DDhx=+23DDxx==2399221)~(0,1),,0.9682~(1,1),,03)~(1,1),23,1UUU求)求求例4.以上结果说明了什么现象?yx=2yx=+32相关系数刻划了两个变量间线性相关程度10P.100解因,4,322DDDDCov),(6)21(43所以)2,3(24191)23(CovDDDD),(213124191CovDD3(,)CovDD例5.11)23,(),(CovCov)2,()3,(CovCov),(21),(31CovCov),(2131CovD0故0(,)CovDDxhz32Dx9(,)Covxh612相关系数的性质(1).|ρXY|≤1,即“相关系数的绝对值不大于1”。******()()()2cov(,)DDDxhxhxh2(1)xhr方差的非负性11xhr01xhr证明13(2).若与相互独立,则0xhr(,)0CovxhxhQ与相互独立,则证明(,)=0CovDDxhxhrxh定义若,0则称与不相关。注:与相互独立)即0(与不相关见P.96例114P.96例6150160),(DDCov所以与的相关系数即与不相关。但与也不独立,因为0}0,0{P1618282}0{}0{PP172°与相互独立)即0(与不相关例1但二元正态分布除外);,;,(),(222211N~设,则•是与的相关系数;•与相互独立=0。(,)Cov0与不独立18证明(充分性)设η=aξ+b,则E(η)=aE(ξ)+b,D(η)=a2D(ξ)即|ρξη|=1(必要性(略))(3).|ρξη|=1的充分必要条件是ξ与η以概率1存在线性关系,即P(η=aξ+b)=1,a≠0,a,b为常数。10Cov(,)()10aaDaaaDDDaDxhxhxrxhxxCov(,)()EEExhxhxh(())()EabEaEbxxxx22()()EabaEbExxxx22()aEbEaEbExxxx22[()]aEExxaDx19即X与Y以概率1存在线性关系,此时称X,Y正线性相关。当ρXY=-1时即X与Y以概率1存在线性关系,此时称X,Y负线性相关。(3).|ρXY|=1的充分必要条件是X与Y以概率1存在线性关系,即P(Y=aX+b)=1,a≠0,a,b为常数。当ρXY=1一般有当ρXY0称X,Y正相关。当ρXY0称X,Y负相关。当ρXY=0称X,Y不相关。•••••°°°°°0020相关系数只能说明与无线性关系022~(1,1),,0U)求例4.中21小结这一节我们介绍了协方差、相关系数、相关系数是刻划两个变量间线性相关程度的一个重要的数字特征.注意独立与不相关并不是等价的.当(X,Y)服从二维正态分布时,有X与Y独立X与Y不相关22另外一些较常用的数字特征原点矩中心矩定义3.6混合中心矩定义3.7众数定义3.8中位数定义3.9变异系数定义3.10偏度定义3.11峰度定义3.12,(),,,kkEkk设是随的点机量阶变12L原矩:{[()]},,,kkEkEk的阶:23L中心矩23第三章小结一、概念及计算公式E1iiipx离dxxfx)(连)]([gEkkkpxg)(离dxxfxg)()(连)],([gEijijjipyxg),(离dxdyyxfyxg),(),(连数学期望242)(EED))((),(EEECov)0,0(),(DDDDCovEEE)(22)(EE方差协方差相关系数25相互独立,则,,,21nLniiiniiiDaaD121)(二、性质期望方差niiiniiiEaaE11)()()()(,,,,212121nnnEEEELLL则相互独立ccE)(0)(cDaEaE)(DaaD2)(无26),(),(1CovabbaCov),(),(),(22121CovCovCov0),(3Cov相互独立,则与),(2)(4CovDDD协方差(P.95)相关系数(P.95)1112°与相互独立0ba,1||31}{baP三、重要分布的数字特征(P.95表3.5)27第四章大数定律与中心极限定理28概率论与数理统计是研究随机现象统计规律性的学科.随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来.也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象.研究大量的随机现象,常常采用极限形式,由此导致对极限定理进行研究.极限定理的内容很广泛,其中最重要的有两种:与大数定律中心极限定理29大数定律从理论上解决:用频率近似代替概率问题:用样本均值近似代替理论均值问题:nnAPA)(xE中心极限定理阐述:独立随机变量之和以正态分布为极限分布问题,即用正态分布作近似计算问题。30第四章大数定律与中心极限定理§4.1大数定律31大量的随机现象中平均结果的稳定性大数定律的客观背景大量抛掷硬币正面出现频率字母使用频率生产过程中的废品率……32“大数”就是指涉及大量数目的观察值,它表明大数定律中所指出的现象,只有在大量次数的试验和观察之下才成立。例如,一所大学里有上万名学生,如果随意地观察一个学生的身高X1,则X1与全校学生的平均身高a可能相差甚远;如果观察10个学生的身高并取其平均,则它就有更大的机会与a更接近;如果观察100个学生,则这100个人的平均身高将与a更加接近,这是我们在日常经验中所体会到的事实,大数定律正是对这一事实从理论上进行的概括和论证。33在实践中人们认识到大量测量值的算术平均值也具有稳定性,而这种稳定性就是本节所要讨论的大数定律的客观背景,而这些理论正是概率论的理论基础。大数定律以确切的数学形式表达了这种规律性,并论证了它的成立条件,即从理论上阐述了这种大量的、在一定条件下的、重复的随机现象呈现的规律性即稳定性。由于大数定律的作用,大量随机因素的总体作用必然导致某种不依赖于个别随机事件的结果。34迄今为止,人们已发现很多大数定律(lawsoflargenumbers)。所谓大数定律,简单地说,就是大量数目的随机变量所呈现出的规律,这种规律一般用随机变量序列的某种收敛性来刻画。下面,先介绍一个重要的基本概念和一个重要的不等式:依概率收敛性切比雪夫不等式35定义1若存在常数a,使对任给常数,有01}|{|limaPnn}{n则称随机变量序列依概率收敛于a。LLLLLL)(an当n充分大时,几乎所有的都落在a的邻域内。n抛硬币试验的频率稳定性12PAnnn说明1lim{||}1nnPalim{||}0nnPa说明2Pna36切比雪夫(Chebyshev)不等式设的期望E和方差D存在,则对任给常数,有02}|{|DEP或21}|{|DEP)(E37证(对连续型)设),(xf~则||)(}|{|ExdxxfEP)1||(Ex21||22)()(ExdxxfExdxxfEx)()(122D212}|{|DEP切比雪夫(Chebyshev)不等式38当D(X)已知时,切比雪夫不等式给出了X与E(X)的偏差小于的概率的估计值.切比雪夫不等式只利用随机变量的数学期望及方差就可对的概率分布进行估计。(不需要知道具体的分布)从切比雪夫不等式还可以看出,对于给定的0,当方差越小时,事件{|X-E(X)|≥}发生的概率也越小,即X的取值越集中在E(X)附近.这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量.切比雪夫不等式的用途:(1)估计事件的概率。(2)证明大数定律;2(){|()|}DXPE39切比雪夫不等式的应用22{},{}1.DXPXEXDXPXEX粗略估计X在内的概率;),(EXEX例1设随机变量X的数学期望EX=11,方差DX=9,则根据切比雪夫不等式估计.___}202{XP解由有2{}1DXPXEX