——byxxxxxxx第三节协方差与相关系数一、协方差1、引入背景二维随机变量(X,Y)的相互关系如何描述?n维变量间的关系举例:(1)不同地区气温间的关系;(2)人的身高、体重间的关系;(3)不同股票收益率间的关系;(4)公司经营业绩与资本结构间的关系。(X,Y)为二维随机变量,则称下式为X、Y的协方差。Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}⑴协方差为X,Y偏差[X-E(X)]与[Y-E(Y)]乘积的数学期望(3)当X,Y相同时,Cov(X,X)=D(X)=Var(X).2、协方差的定义说明:(2)Cov(X,Y)0,正相关;Cov(X,Y)0,负相关。=0,不相关(4)由定义可知,Cov(X,Y)=Cov(Y,X).(4)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)(2)对称性:Cov(X,Y)=Cov(Y,X)(3)Cov(aX,bY)=abCov(X,Y)a,b是常数3、协方差的主要性质⑴Cov(X,Y)=E(XY)-E(X)E(Y)(最常用计算方法)证:(1)Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)(3)Cov(aX,bY)=E{[aX-E(aX)][bY-bE(Y)]}=abcov(X,Y)=E{ab[X-E(X)][Y-E(Y)]}(4)Cov(X1+X2,Y)=E{[X1+X2-E(X1+X2)][Y-E(Y)]}=Cov(X1,Y)+Cov(X2,Y)=E{[X1-E(X1)][Y-E(Y)]}+E{[X2-E(X2)][Y-E(Y)]}}二、相关系数1、相关系数的定义((),(),,(),(),)()(0.).XYDXDYXYDXDCovYXXYDXDYY分别为随机变量的方差且则称为与的(线性)相关系数说明:(2)相关系数无量纲,消除了量纲不同对相关程度的影响。()()()((1).),XYXEXXYEYDXDYY为的标准化变量间的差与协方(3)与Cov(X,Y)同号。0,正相关;0,负相关;=0,不相关2、相关系数的性质(1)1.XY(2)1,(0),{}1XYabPYabX存在实数使1)1,XYYX与存在严格线性关系.2)0,XYYX与不存在线性关系.3)XYYX越接近1,与线性相关程度越高;XYYX越接近0,与线性相关程度越低.结论:0≤D(Y-tX)=t2D(X)-2tCov(X,Y))+D(Y)(,)()CovXYtDX令,则上式为D(Y-tX)=)()],([)(2XDYXCovYD2()[1,)()()](CovXYDXDDYY2()[1]DY2101证1:(1)根据方差的性质,对于任意实数t1,(2)()0DYbX时5,()0{}1DXPXa根据方差性质1{{}}PYbXaPYabX例设(X,Y)的分布律为:X\Y-101P{X=i}-1010¼0¼0¼0¼0¼½¼P{Y=j¼½¼1从而COV(X,Y)=0,不相关P{X=-1}P{Y=0}=1/8P{X=-1,Y=0}X,Y不独立。111424()1*0*1*0EX111424()1*0*1*0EY14()(1)*(1)*0(1)*0*(1)*1*0...1*1*00EXYCov(X,Y)=E(XY)-E(X)E(Y)