计量经济学-知识点网络结构图

waxz2667
1 ℃
2020-05-15

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1.期望值E（Y）记为μYE(Y)=y1p1+y2p2+…+ykpk=∑yipiki=12.Y的方差记为Var(Y)=E[(Y−μY)2]标准差记为σYVar(Y)=σY2=E[(Y−μY)2]=∑(yi−μY)2piki=13.偏度(度量分布对称性)=E[(Y−μY)]3σY3峰度（度量分布尾部粗细）=E[(Y−μY)]4σY44.矩Y的r阶矩E(Yr)2.1随机变量和概率分布2.2期望值、均值和方差1.简单随机抽样独立同分布（i,i,d）2.样本均值的抽样分布：由于Y是随机的故它有概率分布，称为Y的抽样分布E(Y)=μYVar(Y)=σY2nstd.dev(Y)=σY=σY√n(标准差)2.5随机抽样和样本均值的分布1.正态分布简记N(μ,σ2),当μ=0，σ2=1时为标准正态分布正态分布的计算Pr（Y≤C2）=Pr(Z≤d2)=Φ（d2）（d2=C2−μd）Pr（Y≥C1）=Pr(Z≤d1)=1-Φ（d1）（d1=C1−μd）二维正态分布：若X和Y服从协方差为σXY的二维正态分布，且a,b为常数ax+by服从分布N(aμX+bμY,a2σX2+bσY2+abσXY)(X.Y∽N)(2)卡方分布：是m个独立标准正态随机变量平方和服从的分布，分布依赖于m称为卡方分布的自由度记χm2(3)学生t分布：定义标准正态随机变量与和它独立自由度为m的卡方随机变量除以自由度m的平方根之比的分布tm∽Z√wm服从自由度为m的学生t分布[w为自由度为m的卡方分布随机变量（4）F分布：具有自由度m和n的F分布定义为自由度为m的卡方随机变量，除以m与它独立的自由度为n的卡方随机变量除以n之比的分布记为Fm,n∽Wm⁄Vn⁄2.4正态分布、卡方分布、学生t分布和F分布2.3二维随机变量1.联合概率分布Pr（X=x,Y=y）边缘概率分布Pr（Y=y）=∑Pr（X=xi,Y=yi）li=1给定X时Y的条件分布：Pr（Y=y|X=x）2.给定X时Y的条件分布期望E(Y|X=x)=∑yiki=1Pr（Y=yi|X=x）3.期望的迭代原则E(Y)=∑E(Y|X=xi)li=1Pr（X=xi）(期望值×权重)=E(Y)=E[E(Y|X)]4.条件方差：Var(Y|X=x)=∑[yi−E(Y|X=x)2ki=1Pr（Y=yi|X=x）5.独立性：Pr（Y=y|X=x）=Pr（Y=y）6.协方差：Cov(X,Y)=σXY=E[(X-μX)(Y−μY)]=∑∑(xj−lj=1ki=1μX)(yi−μY)Pr（X=xi,Y=yi）相关系数：cov(X.Y)=COV(X,Y)√Var(X)Var(Y)=σXYσXσY若Cov(X,Y)=0⇒X、Y不相关7.随机变量的期望和方差E(a+bX+Cy)=a+bμX+cμYVar(a+by)=b2σY2E(Y2)=σY2+μY2Var(aX+bY)=a2σX2+2abσXY+b2σY2Cov(a+bx+cy)=bσXY+cσXYE(X.Y)=σXY+μXμY|Cov(X,Y)|≤1且|σXY|√σX2σY2Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)=σX2+σY2+2σXY二、概率论的复习概念：结果、概率、样本空间、事件、累积概率分布、累积分布函数（c.d.f）、累积分布、贝努力分布、概率密度函数（p.d.f）2.6抽样分布的大样本近似1.精确分布：我们称精确描述Y分布的抽样分布为Y的精确分布或有限样本分布2.近似分布：近似的方法是样本容量较大时抽样分布的近似分布。常称抽样分布的这种大样本近似分布为渐近分布（n→∞时非常精确）三、统计学复习3.1总体均值的估计3.2有关总体均值的假设检验1.原假设;统计假设检验的出发点是确定要检验的假设2.备择假设：假设检验中需要利用数据比较原假设和另一具假设最一般的备择假设为E（Y）≠uY.0称为双边备择假设3．显著性概率P值=PrH0[|Y−uY.0|||Yact-uY.0|]P值较大时，观测到的Yact与原假设相符，但当P值较小时则不相符4.样本方差：Sy2=1n−1∑(Yi−Y)2ni=1Sy为样本标准差（Sy=TSSn−1）Y的标准误σY=Sy√n⁄为Y的标准误记为SE(Y)或σŶ5.P值（还可）=PrH0[|Y−uY.0σY||Yact−uY.0σY|]=2Φ（−|Yact−uY.0σY|）=2Φ（−|Yact−uY.0SE(Y)|）6.t统计量或t比t=Y−uY.0SE(Y)tact=Yact−uY.0SE(Y)tact表示实际计算得到的t统计量值P值=2Φ（−|tact|）7.当P值小于5%时拒绝原假设⟺当|tact|1.96时拒绝H0几个概念：第Ⅰ类错误、第Ⅱ类错误、显著水平、临界值、拒绝域、接受域、水平、势显著水平越小，临界值就越大，且原假设错误时要拒绝原假设就越困难8.单边备的择假设：H1:E(Y)μY.0P值=PrH0（Ztact）=1-Φ（tact）5%的显著水平下，单边检验的N(0.1)临界值为1.6453.3总体均值的置信区间1.置信集：指定概率包含真实总体均值μY的取值集合，它是一个区间被称为置信区间2.μY的95%置信区间为Y-1.96SE(Y)≤μY≤Y+1.96SE(Y)1.估计量同估计值的概念及区别：估计量是一个随机变量，估计值为非随机数2.无偏性：uY的一个估计量uŶE(uŶ)=uY则称估计量uŶ无偏uŶ是uY的一个无偏估计量3.一致性：当样本容量增大时，uŶ落入真值uY小区间内（uY−c,uY+c)概率为1uŶ与uY一致，即uŶP→uY，则uŶ是uY的一个一致估计量4.有效性：令uỸ是uY的另一个估计量且uŶ与uỸ都无偏，又Var(uŶ)Var(uỸ)则称uŶ比uỸ有效5.Y的性质：（1）Y是uY的另一个估计量，即YP→uY（2）Y是所有Y1Y2Yn加权平均类无偏估计量中最有效的估计量也即Y是最佳线性无偏估计量（3）Y是uY的最小二乘估计量即m=Y时∑(Yi−m)2ni=1最小3.4不同总体的均值比较1.两均值之差的假设检验：H0：μm-μw=d0H1：μm-μw≠d0Ym−Yw服从N[μm-μw，（σm2nm⁄）+（σw2nw⁄）t=(Ym−Yw)−d0SE(Ym−Yw)(比较两均值的t统计量)2．两总体均值之差的置信区间：(Ym−Yw)±1.96SE(Ym−Yw)3.5基于试验数据的因果效应的均值之差的估计因果效应（也称处理效应）：具体地，处理水平x对Y的因果效应为条件期望之差，即E(Y|X=x)-E(Y|X=0)3.6样本容量较小时使用t统计量（n100)t=Y−uY.0√SY2n⁄=Y−uY.0√σY2n⁄√(n−1）SY2σY2⁄n−1⁄=z√wn−1⁄⁄(t服从自由度为n-1的学生t分布3.7散点图，样本协方差和样本相关系数样本相关系数rxy=样本协方差样本标准差=SxySxSySxyP→σxyrxyP→Corr(Xi,Yi)4.1线性回归模型四、一元线性回归模型4.2线性回归模型的系数估计1.线性回归模型的函数估计：预测误差平方和为∑(ni=1Yi−β0+β1Xi)2斜率β1和截距β0的OLS估计量β1̂=∑(Xi−X)̅̅̅(Yi−Y)̅̅̅ni=1∑(Xi−X̅ni=1)2=SXYSX2β0̂=Y̅-β1̂X̅Yî=β0̂+β1̂Xiμî=Yi-Yî2.使用OLS估计量的原因（1）OLS是实践中最常使用的方法（2）OLS估计量无偏一致4.3拟合优度1.假设一：给定Xi时μi的条件分布均值为零（其它素与X无关）2.假设二：（Xi，Yi）i=1,2,3,…,n独立同分布3.假设三：不可能出现大异常值⇔0𝐸(Xi4)∞0𝐸(Yi4)∞(或XY具有有限峰度)4.4最小二乘假设4.5OLS估计量的抽样分布1.若最小二乘假设成立，则在大样本下，β0̂和β1̂服从联合正态抽样分布β1̂的大样本正态分布为N(β1,σβ1̂2)其中方差σβ1̂2为σβ1̂2=1nVar[(Xi−μx)ui][Var(Xi)]2β0̂的大样本正态分布为N(β0,σβ0̂2)其中σβ0̂2=1nVar(Hiui)[E(Hi2)]2,其中Hi=1-(μxE(Xi2))Xi2.推论：Xi的方差越大β1̂的方差σβ1̂2就越小，同时误差项ui的方差越小，β1̂的方差越小一般形式：Yi=β0+β1Xi+μi(Y为因变量X为自变量或回归变量)β0+β1Xi为总体回归线或总体回归函数1.R2和回归标准误差衡量了OLS回归线拟合数据的效果，R2是指可由Xi解释（或预测）的Yi样本方差的比例R2=ESSTSS其中ESS=∑(Yî−Y̅ni=1)2TSS=∑(Yi−Y̅ni=1)2残差平方差或SSR为OLS残差的平方和SSR=∑ui2̂ni=1TSS=ESS+SSR⟹R2=1−SSRTSS(R2一般小于1大于0)(SY=TSSn−1)2.回归标准误（SER）是回归误差μi的标准估计量SER=Sû其中Sû2=1n−2∑ui2̂ni=1=SSRn−25.1某个回哪系数的假设检验五、一元线性回归5.2回归系数的置信区间1.β1的95%的置信区间=[β1̂−1.96SE(β1̂),β1̂+1.96SE(β1̂)]2.X变化的预期效应的置信区间=[β1̂△x−1.96SE(β1̂)×△x,β1̂△x+1.96SE(β1̂)×△x]5.3X为二值变量时的回归1.二值变量也叫指示变量或虚拟变量2.以Di为回归变量总体回归模型为：Yi=β0+β1Di+μiOLS估计量β视为两组抽样的Yi的样本均值之差是有现实意义的Testscorê=650.0(1.3)+7.4(1.8)DR2=0.035SER=18.7其中括号内数字表示，标准误SE(β1̂)SE(β0̂)R2=ESSTSSSER=SSRn−2=1n−2∑ui2̂ni=15.4同方差和异方差1.定义：如果对任意i=1,2,3…,n,给定Xi时ui的条件分布的方差Var(ui|Xi=x)是常数且不依赖于x时，误差项ui是同方差，否则，误差项为异方差（1）OLS估计量仍然是无偏、一致的和近似正态分布的（不管是同方差还是异方差）（2）最小二乘假设成立且误差同方差，则在X1，X2，…,Xn下，OLS估计量β0̂和β1̂在Y1,Y2,…,Yn的所有线性估计量中是有效并且无偏的（3）同方差适用方差公式,同方差是异方差的一种，因此不论是同方差还是异方差，都可应用异方差估计量相关公式5.5普通最小二乘理论基础若三个最小二乘假设成立且误差同方差，则OLS估计量是最佳线性条件无偏估计量（β1的Gauss-Markov定理），不同于OLS的回归估计量：（1）加权最小二乘估计量（2）最小绝对变差估计量1.β1的双边假设：H0:β1=β1.0H1:β1≠β1.0（1）计算β1̂的标准误SE(β1̂):SE(β1̂)=√β12̂=1n×1n−2∑(Xi−X̅)2uî2ni=1[1n∑(Xi−X̅)2ni=12(2)计算t统计量t=β1̂−β1.0SE(β1̂)(3)计算P值：P=PrH0[β1̂−β1.0|||β1̂act-β1.0|]=Pr(|Z||tact|)=2Φ(−|tact|)2.β1的单边假设：H0:β1=β1.0H1:β1𝛽1.0P值=Pr(Ztact)=2Φ(tact)在5%显著水平下，是|tact|-1.645时拒绝原假设5.6样本容量较小时，t统计量在回归中的运用同方差正态回归假设：三个最小二乘假设，误差同方差以及误差服从正态分布，在同方差正态回归假设条件下，OLS估计量服从正态分布且同方差运用t统计量服从学生t分布6.1遗漏变量偏差六、多元线性回归6.2多元回归模型总体回归线:E(Yi|X1i=x1,X2i=x2)=β0+β1X1+β2X2总体多元回归模型：Yi=β0+β1X1i+β2X2i+⋯+βkXki+μi6.3多元回归的OLS估计量OLS估计量β1̂β2̂…βk̂是使预测误差平方和∑(Yi−β0−X1i−β2X2i−⋯−ni=