1设(X,Y)为二维随机变量,若E{[X-E(X)][Y-E(Y)]}存在,则称其为随机变量X与Y的协方差,记为Cov(X,Y).即)]}()][({[),(CovYEYXEXEYX.)()(),Cov(的相关系数与为随机变量YXYDXDYXρXY若D(X)0,D(Y)0,称若,0XY称X,Y不相关.1.定义2)]}()][({[),Cov(YEYXEXEYX)]([)]([YEYEXEXE.0相互独立和若随机变量YX2.说明3.协方差的计算公式则,},{ijjipyYxXP(1)若(X,Y)为离散型,jiijjipYEyXExYXCov,)]()][([),((2)若(X,Y)为连续型,其概率密度为f(x,y),则dxdyyxfYEyXExYXCov),()]()][([),(法一:3);()()(),Cov()1(YEXEXYEYX).,Cov(2)()()()2(YXYDXDYXD证明)]}()][({[),Cov()1(YEYXEXEYX)]()()()([YEXEYXEXYEXYE).()()(YEXEXYE)()()()(2)(YEXEYEXEXYE法二:44.性质);,Cov(),Cov()1(XYYX;,,),Cov(),Cov()2(为常数baYXabbYaX).,Cov(),Cov(),Cov()3(2121YXYXYXX(5)Cov(X,X)=D(X);(4)若X与Y独立,则Cov(X,Y)=0.5例4?,,)cos(,cos,]π2,0[的相关系数和求是常数这里的均匀分布服从设aa解,0dcosπ21)(π20xxE,21dcosπ21)(π2022xxE,0d)(cosπ21)(π20xaxE,21d)(cosπ21)(π2022xaxE,cos21d)cos(cosπ21)(π20axaxxE数为由以上数据可得相关系.cosa6,,1,0时当a,,1,π时当a.存在线性关系,0,23π2π时或当aa.不相关与,122但.不独立与因此.cosa的相关系数和的均匀分布服从,)cos(,cos,]π2,0[a7(1)3.注意相互独立不相关(2)0,XYρYX不相关0),Cov(YX()()()()()().EXYEXEYDXYDXDY4.相关系数的性质.1)1(XYρ.1}{,:1)2(baXYPbaρXY使存在常数的充要条件是意义|ρXY|=1当且仅当Y跟X几乎有线性关系.这说明了相关系数的概率意义.ρXY并不是刻画X,Y之间的“一般”关系,而是刻画X,Y之间线性相关程度.82020/2/58例设随机变量(X,Y)的联合概率分布列为-101-11/125/12012/123/121/12XY试分析随机变量(X,Y)的相关性和独立性。Cov(,)E()E()E()12166311(1)1(1)11121212121212120XYXYXY解:-1XY与不相关。11P1,P1,P1,10212P1,1P1P1XYXYXYXYXY又与不独立。9例设(X,Y)服从以坐标原点为中心,R为半径的圆内部的均匀分布,试分析随机变量X与Y的相关性和独立性.解:由已知得其它,0,1),(2222RyxRyxf01),()(22222yRyRRRdxRxdydxdyyxxfXE01),()(22222xRxRRRdyRydxdxdyyxyfYE01),()(22222xRxRRRdyRxydxdxdyyxxyfXYE0)()()(),(YEXEXYEYXCov故0XY10又因为其它,0,2),()(222RxRRxRdyyxfxfX其它,0,2),()(222RyRRyRdxyxfyfY)()(),(yfxfyxfYX所以X与Y不相互独立故X,Y不相关,不相互独立.11相关系数的意义.Y,X,ρXY较密切的线性关系表明较大时 当.,,线性相关的程度较差较小时当YXρXY.,0不相关YXρXY和称时当12第十五讲大数定律与中心极限定理1.切比雪夫不等式2.大数定律3.中心极限定理13一、切比雪夫不等式0设随机变量X的方差D(X)存在,则对任意的,有2(){()}DXPXEX≥≤或2(){()}1DXPXEX≥142(){()}.DXPXEXεε221[()]()dXEXfxxε2().DXε22()()()dXEXεXEXfxxε得{()}PXEXε()()dXEXεfxx证明取连续型随机变量的情况来证明.则有的概率密度为设),(xfX15例1设随机变量的数学期望,方差则由切比雪夫不等式有P{-3}2(){|()|};DPE222D1P{-3}==(3)991P{-3}9解:根据切比雪夫不等式)(E2)(D16例2.设X~0()!00nxxexfxnx用切比雪夫不等式证明[02(1)]1nPXnn证明:E(X)=0!nxxxedxn=n+10[!]nxxedxn注:E(X2)=20!nxxxedxn=(n+1)(n+2)所以,D(X)=E(X2)-(E(X))2=n+1[02(1)][||1]PXnPXEXn211(1)nn1nn1n17例3设每次试验中,事件A发生的概率为0.75,试用切比雪夫不等式估计,n多大时,才能在n次独立重复试验中,事件A出现的频率在0.74~0.76之间的概率大于0.90?解设X表示n次独立重复试验中事件A发生的次数,则X~B(n,0.75)nXDnXE1875.0)(,75.0)(90.076.074.0nXP要使,求n事件A发生的频率18即90.076.074.0nXnP即90.001.0|75.0|nnXP由切比雪夫不等式,=0.01n,故2)01.0(1875.0101.0|75.0|nnnnXP令90.0)01.0(1875.012nn解得18750n19切比雪夫不等式说明,越小,则越小,越大,也就是说,随机变量取值基本上集中在附近,这进一步说明了方差的意义。同时当和已知时,切比雪夫不等式给出了概率的一个上界,该上界并不涉及随机变的具体概率分布,而只与其方差和有关,因此,切比雪夫不等式在理论和实际中都有相当广泛的应用。需要指出的是,虽然切比雪夫不等式应用广泛,但在一个具体问题中,由它给出的概率上界通常比较保守。)(XD}|)({|XEXP}|)({|XEXP)(XEX)(XE)(XD}|)({|XEXPX)(XD20反复投骰子得到的平均值会越来越趋向于3.5投硬币,正面朝上的概率是0.5:在大量的反复投硬币的试验中,你可以预测大概有一半的次数是正面朝上的。似乎概率值和期望值都可以通过平均长期的反复实验来解释。概率中最基本的理论:大数定律,也被称为均值定律21在介绍大数定律之前,我们先来看看大数定律在试验中发挥的作用图1.投骰子实验的连续平均数22图2.投硬币和投骰子的相对频率正面朝上的频率投到6的频率23定义a是一常数,0limaYPnn(或)1limaYPnn则称随机变量序列,,,,21nYYY依概率收敛于常数a,记作aYnPn,,,,21nYYY是一系列随机变量,设0有若24切比雪夫大数定律,,,,21nXXX相互独立,设随机变量序列(指任意给定n1,相互独立),且具有相同的数学期望和方差nXXX,,,21,2,1,)(,)(2kXDXEkk则0有01lim1nkknXnP或11lim1nkknXnP算术平均值25定理的意义:当n足够大时,算术平均值几乎就是一个常数,可以用算术平均值近似地代替数学期望.具有相同数学期望和方差的独立随机变量序列的算术平均值依概率收敛于数学期望.即)(01111nEXnXnPniinii26本结果由俄国数学家切比雪夫于1866年证明,是关于大数定律的普遍结果,许多大数定律的古典结果都是它的特例。27贝努里(Bernoulli)大数定律设nA是n次独立重复试验中事件A发生的次数,p是每次试验中A发生的概率,则0有0limpnnPAn或1limpnnPAn28在概率的统计定义中,事件A发生的频率“稳定于”事件A在一次试验中发生的概率是指:nnAnnA频率与p有较大偏差pnnA是小概率事件,因而在n足够大时,可以用频率近似代替p.这种稳定称为依概率稳定.贝努里(Bernoulli)大数定律的意义:29中心极限定理定理独立同分布的中心极限定理设随机变量序列,,,,21nXXX相互独立,服从同一分布,且有期望和方差:,2,1,0)(,)(2kXDXEkk则对于任意实数x,xtnkkndtexnnXP21221lim30注:则为nkkX1的标准化随机变量.)(limxxYPnn即n足够大时,的分布函数近似于标准正态随机变量的分布函数nnXYnkkn1记)1,0(~NYn近似nkkX1nYnn),(2nnN近似服从nYnY31定理3德莫佛—拉普拉斯中心极限定理(DeMoivre-Laplace)设,0p1,n=1,2,…则对任一实数x,有xtnndtexpnpnpYP2221)1(lim即对任意的ab,batnndtebpnpnpYaP2221)1(lim(近似)),(~pnBYn),(~npqnpNYnpq132正态分布的概率密度的图形x33二项分布的随机变量可看作许多相互独立的0-1分布的随机变量之和,下面是当时,的概率分布图00.050.10.150.205101520P)5.0,20(~BXX34例设有一大批种子,其中良种占1/6.试估计在任选的6000粒种子中,良种所占比例与1/6比较上下不超过1%的概率.解设X表示6000粒种子中的良种数,则X~B(6000,1/6)65000)(,1000)(XDXE356500010009406500010001060650006065000601650006029624.001.0616000XP601000XP65000,1000~NX近似36比较几个近似计算的结果用中心极限定理9624.001.0616000XP用二项分布(精确结果)9590.001.0616000XP用Poisson分布9379.001.0616000XP用Chebyshev不等式7685.001.0616000XP37作业P127-128