第3章概率分布的特征第3章23.1期望值:集中趋势的度量3.2方差:离散程度的度量3.3协方差3.4相关系数3.5条件期望值3.6偏度和峰度3.7从总体到样本3.8总结第3章33.1期望值:集中趋势的度量期望值(expectedvalue):集中趋势的度量离散型随机变量的期望值用符号E(X)表示。定义为:xxxfXE)()(例3-1掷一个骰子若干次。随机变量X表示正面朝上的数字,求X的期望值。(下表)第3章4表3-1随机变量(正面朝上数字)的期望值正面朝上的数字概率数字*概率Xf(x)xf(x)11/61/621/62/631/63/641/64/651/65/661/66/6E(X)=21/6=3.5第3章5概率密度1/6图3-1离散型随机变量(例3-1)的期望值,E(X)f(x)X第3章6?在上例中,打印机销售量的期望值是多少?我们仍可从表2-4中得到。例3-2在例2-17中,电脑销售量的期望值是多少?我们可从中得到。把变量X的各可能值与其相对应的概率之积累加即得电脑销售量的期望值。0(0.08)+1(0.12)+2(0.24)+3(0.24)+4(0.32)=2.6因此,电脑每天的平均销售量为2.6台。表2-40(0.11)+1(0.16)+2(0.23)+3(0.27)+4(0.23)=2.35即每天打印机的平均销售量为2.35台。第3章700.0800.1110.1210.1620.2420.2330.2430.2740.3240.23总计1.00总计1.00Xf(X)Yf(Y)表2-4个人电脑售出数量X和打印机售出数量Y的边缘分布第3章81.若b为常数,则有:E(b)=b2.给定随机变量X和Y,有E(X+Y)=E(X)+E(Y)3.)()()|(YEXEYXE4.)()()(YEXEXYE5.若a为常数,则有:)()(XaEaXE6.若a、b为常数,那么:bXaEbaXE)()(3.1.1期望的性质除非两R.V相互独立。第3章93.2方差(variance):离散程度的度量方差定义为:表明了随机变量X的各取值与其期望值的偏离程度。如图3-2。22))(()var(XEXEXx若X为离散型随机变量,通常用下列公式计算方差xxfXExX)())(()var(2标准差(standarddeviation,s.d):方差的正的方根。第3章103-2第3章11例3-4:接例3-1,求随机变量X(表示正面朝上的数字)的方差。正面朝上的数字概率Xf(x)(x-(EX))2*f(x)11/6(1-3.5)2(1/6)21/6(2-3.5)2(1/6)31/6(3-3.5)2(1/6)41/6(4-3.5)2(1/6)51/6(5-3.5)2(1/6)61/6(6-3.5)2(1/6)总计=2.9167VAR(X)=2.9167第3章121.常数的方差为零。2.若X与Y是两个相互独立的随机变量,那么:var(X+Y)=var(X)+var(Y)var(X-Y)=var(X)+var(Y)3.若b是常数,则var(X+b)=var(X)4.如果a是常数,则)var()var(2XaaX5.如果a,b是常数,则)var()var(2XabaX)var()var()var(22YbXabYaX6.如果X与Y相互独立,a,b是常数,则3.2.1方差的性质:第3章133.2.2切比雪夫不等式如果随机变量X的均值和方差分别为,那么对任意给的正数c,有:2,xx211)|(|ccXPxx例3-5:一个油炸圈饼店每天上午8点到9点平均卖出油炸圈饼100个,方差为25。那么,某天在8到9点间卖出90~110个油炸圈饼的概率至少是多少?2211)5*2|100(|XP第3章143.2.3变异系数变异系数(coefficientofvariation,V)度量相对变动,定义为:100xxV例3-6:某讲师讲授两个班的初级经济计量学课程,每班各15名学生。在期中考试中,A班平均83分,标准差为10,B班平均88分,标准差为16。哪个班的成绩更好?181.181008816,048.121008310BAVV由于A班的相对变动小,所以说A班成绩的总体情况好于B班。第3章153.3协方差(covariance)令随机变量X和Y的期望分别为其协方差为:,,yxuuuE(XY)-uuYuXEYXyxyx))((),cov(假定X和Y是离散型随机变量,协方差用下式计算u-uYXXYfYXfuYuXYXyxXYXYyx),(),())((),cov(对于连续型随机变量可用积分符号代替求和符号。第3章161.若随机变量X,Y独立,协方差为零。2.其中,a,b,c,d为常数。),cov(),cov(YXbddYcbXa3.cov(X,X)=var(X)协方差的性质第3章17例3-7:再次回到个人电脑/打印机销售一例,现利用协方差的计算公式计算电脑销售量X和打印机销售量Y的协方差。已知:35.2,6.2yx06.715.0*4*403.0*1*003.0*0*0)(=XYE0.030.030.020.020.010.020.050.060.020.010.010.020.100.050.050.010.010.050.100.100.010.010.010.050.150.080.120.240.240.3201234总计f(x)出售个人电脑的数量(X)01234表2-3个人电脑售出数量X和打印机售出数量Y的二元概率分布总计f(y)0.110.160.230.270.271.00出售打印机的数量(Y)uE(XY)-uYXyx95.035.2*6.206.7),cov(=第3章18相关系数定义如下yxYX),cov(113.4.1相关系数的性质3.4相关系数(correlation)1.相关系数与协方差同号2.相关系数度量了两变量间的线性关系3.相关系数是一个纯数值,且满足:4.如果两变量独立,则协方差、相关系数都为0,但如果两变量的相关系数为0,并不意味着这两个变量相互独立。5.相关并不一定意味着存在因果关系。第3章193-3第3章20例3-8继续个人电脑/打印机一例,现计算两变量的相关系数。已知两个变量的协方差为0.95,根据表2-4中的数据可以得到4124.1,2649.1yx5317.04124.1*2649.195.0),cov(yxYX即两变量存在一定的正相关关系,这也是很容易理解的。第3章213.4.2相关变量的方差),cov(2)var()var()var(22YXabYbXabYaX特别地:yxyxYXYXYXYX2)var()var()var(2)var()var()var(第3章22)|()|()|()|(xXYYfxXYEyYXXfyYXE3.5条件期望值(conditionalexpectation)例3-9:在个人电脑/打印机一例中,计算E(Y|X=2),即在每天售出2台个人电脑的条件下销售打印机的条件期望。)2()2,1()2|1(875.1)2|4(4)2|3(3)2|2(2)2|1()2|()2|(XfXYfXYfXYfXYfXYfXYfXYYfXYE第3章233.6偏度(skewness)与峰度(kurtosis)偏度与峰度是用于描述概率密度函数形状的数字特征。偏度S是对称性的度量,峰度K是一个概率密度函数高低或胖瘦的度量。二阶矩的平方四阶矩=二阶矩的立方三阶矩的平方=2243223)()()()(xxxxuXEuXEKuXEuXES偏度大于0,称其为正偏或右偏,偏度小于0为负偏或左偏。可以计算得到正态分布的S=0,K=3。第3章24第3章253.7从总体到样本如果我们想考察我国20岁女性的身高情况,我们知道,若设其为X,这是一个随机变量。描述该随机变量,可以用概率密度函数或用期望、方差等数字特征。但这些都是未知的。现在,我们可以把我国所有20岁女性身高值构成的集合看成是一个总体,我们来考察这一总体的情况。考察方法之一是从总体中抽取一个样本,通过样本的特征来反映总体的情况。所以我们必须知道样本矩(samplemoments)的计算方法。第3章261.样本均值niinXX12.样本方差niixnXXS1221)()()(11),cov(YYXXnYXii3.样本协方差4.样本相关系数yxiiSSYYXXn)()(11样本从总体中抽取的样本设为:nXXX,,,21第3章275.样本偏度与样本峰度对照下公式总体偏度S总体峰度K样本三阶矩与样本四阶矩为:2243223)()()()(xxxxuXEuXEKuXEuXESniinXX131)(niinXX141)(第3章28例3-11:设有两变量X(股票价格)和Y(消费者价格CPI)构成的二元总体。假设从该总体中得到一个随机样本(见Excel文件),在本例中,股票价格X用道-琼斯指数均值来度量,消费者价格Y用消费者价格指数来度量。求该随机样本的各样本矩。利用Excel文件具体计算。第3章29作业:第3章书后习题:3.5、3.7、3.13