第一章1、金融数据特征:观测频率高,数据量大;质量高(很少有测量误差和修正问题);包含很多噪音(更难以从随机的和无关的变动中分辨出趋势和规律);通常不满足正态分布;经常包含人民不感兴趣的其他模式(由市场运行和价格记录方式造成,建模需考虑)。2、数据类型:截面数据(不同实体在一个时期内收集的数据,数据排列不重要,分析技术困难少);时间序列数据(同一实体在多个时期内收集的数据,时间顺序重要,间隔、频率相同,存在趋势性、季节性);面板/综列/平行数据(多个实体多个时点,有助于全面分析经济变量关系);混合截面数据(常用于分析一项新政策的影响)。3、收益率计算:(P7公式)第二章1、OLS估计思想:使残差平方和尽可能的小,最小化条件即对参数求偏导,得(P33)β=cov(xt,yt)/var(xt)。性质:(高斯马尔科夫定理)无偏性(估计值的期望等于真实值);有效性(最小方差,偏离真实值的概率最小);一致性。假设条件:E(ut)=0,var(ut)=σ2,cov(ui,uj)=0,cov(ut,xt)=0,ut服从正态分布。2、假设检验:(大家都会,不写了)3、一类错误:原假设为真时拒绝原假设的概率(弃真错误)。二类错误:原假设为伪而没有拒绝原假设的概率(取伪错误)。显著性水平5%变成1%,减低弃真错误,增加取伪错误,检验功效减小。第三章1、F检验:原理(原假设:约束条件成立,比较有约束和无约束回归的残差平方和);公式:m是约束条件的个数,k是参数个数2、拟合优度R2:时间序列R2过高可能是伪回归,且与截面数据R2不合适比较,调整R2可用于决定某一变量是否应包括在模型中。第四章1、异方差检验方法:G-Q检验(分成2个子样本,原假设:2个子样本方差相等,GQ=S12/S22服从F(T1-k,T2-k),对于截面数据,数据需排序,适用于样本容量大异方差单调变化的情况);white检验/LM检验(对残差平方和做辅助回归,得到R2,大于临界值则拒绝同方差假设)。异方差后果:不是最优线性无偏估计,t,F检验不准确,对截距项估计偏大,对斜率估计偏小,如果扰动项与自变量正相关,标准差通常变小。处理:GLSorWLS(方差已知);做对数变换,white异方差检验,white修正标准差估计(方差未知)。2、自相关检验:DW检验(,只能判断是否存在一阶自相关);B-G检验,也叫LM检验(将残差对所有X变量和残差滞后值做回归,得到R2,,大于临界值则拒绝原假设,存在序列相关)。后果:低估误差项方差,降低对标准差的估计,导致犯一类错误概率增加,高估变量显著性。处理:广义差分;HAC(可以同时处理自相关和异方差),动态模型(自回归分布之后模型)。3、正态性检验:BJ检验(利用偏度和峰度,服从卡方分布)。虚拟变量:可以剔除特异值,认为改善模型后果,增加R2,可用于去除突发事件,季节性建模。4、多重共线性:解释变量相关程度高(判断:R2很高,显著性低;参数估计经济意义不合理;增加或减少一个变量,系数变化较灵敏)。后果:影响参数估计得精确性。5、模型设定检验:可以增添拟合变量的高次幂,采用F检验或者LR检验(大于临界值则存在设定误差)6、参数稳定性检验:chow检验(断点检验,分成两个阶段回归+全部回归,得3个RSS,再进行F检验,统计量=服从F(k,T-2k),RSS有约束,原假设:参数稳定,RSS1、RSS2无约束,k为约束个数,大于临界值,拒绝原假设)。预测失效检验(全样本和大的子样本回归,服从F(T2,T1-k),T2为小样本个数)。7、模型稳定性检验:递归最小二乘法(样本一点点增加,CUSUM,CUSUMSQ,判断参数稳定性)。第五章1、平稳性概念:严平稳(每个时间点分布相同),宽平稳(均值、方差、协方差保持不变,不随时间变化而变化,仅依赖于时间间隔或滞后)。2、反应平稳性的工具:自相关函数acf(τs=rs/ro=s阶滞后的协方差/方差),偏自相关函数。3、怎么检验白噪声序列(纯随机序列):Q统计量(τs服从近似N(0,1/T),原假设:没有自相关,为白噪声序列,服从卡方分布;Q统计量变形,即LB统计量)。4、MA模型(可逆性)性质:E(yt)=µ;;协方差;任何有限阶的移动平均过程都是平稳过程;自相关函数为有限记忆模型。可逆性条件:特征方程根在单位圆外。5、AR自回归(平稳性):AR(p)平稳的必要条件;AR(p)平稳的充分条件。根=1时,不平稳,为随机游走过程。一阶自回归yt=µ+ф1yt-1+µt计算:期望:设m=E(yt),则m=E(yt)=E(µ+ф1yt-1+µt)=µ+ф1E(yt-1)=µ+ф1m,所以,m=µ/1-ф1。方差:ro=var=E(yt2)=E((µ+ф1yt-1+µt)2)=ф12y0+σ2。协方差r1=ф1ro。6、拖尾截尾判断:AR模型(自相关拖尾系数小,衰减快,偏自相关截尾),MA模型(自相关截尾,偏自相关拖尾),ARMA模型(都拖尾)。7、ARMA平稳性判断:8、ARMA建立步骤:(识别,估计,检验)一、识别:就是利用自相关函数、偏自相关函数和相关图找出适当的p、q,确定模型阶数。二、估计:估计模型中所含自回归和移动平均项的参数,根据不同的模型可以选择用OLS或者最大似然估计计算。三、检验:看所选模型对数据拟合是否够好,过度拟合(多余参数不显著),残差检验(是否存在自相关,用Q统计量,只能针对欠拟合模型)。9、信息准则:AIC,大模型,不符合一致性,对总体内的不同样本,模型阶数的平均变动较小;SBIC,小模型,具有一致性但无有效性,渐近给出正确的模型阶数;HQIC,中等模型。10、预测:平均平方误差;;平均绝对误差;以上三个可以用于在相同数据和预测区间上比较不同模型,具有最小误差的模型是最精确的模型。相对误差。(计算例子见P252)第六章1、联立方程:(联立模型具有内生性,OLS估计具有非一致性;有多少个内生变量就需要有多少个方程,所以用二阶段最小二乘法估计过度识别方程)***2OLS估计:利用OLS估计简化方程式(Y1对全部前定变量的回归),得到非随机的Y1估计值和随机的残差估计值;将估计值代入结构方程式中(过度识别的方程,此时不再包含内生变量)进行OLS估计,估计量有偏但一致。目的就是清除随机解释变量Y的随机干扰识别的阶条件:在一个含有M个联立方程的模型中,为了使一个方程能被识别,它必须排除至少M-1个在模型中出现的变量(内生或前定)。如果恰好排除M-1刚刚,则该方程是恰好识别的,如果排除对于M-1个变量,则它是过度识别的。(该方程所排除的前定变量的个数必须不少于它所含有的内生变量的个数-1,即K-k=m-1)2、VAR(向量自回归模型):同时考虑几个内生变量,类似联立方程模型,但是在VAR中,每一个内生变量都是由它的滞后或过去值以及模型中所以的其他内生变量的滞后或过去值来解释;通常模型中没有外生变量。3、VAR优势:方法简单,无需决定哪些变量是内生的,哪些变量是外生的(都是内生的);变量依赖于其滞后项,比ARMA模型更一般化,提供丰富的结构,以捕捉数据的更多特征;因为方程右边的变量都是前定的,所以可以使用OLS逐一估计各个方程;预测通常优于传统的结构模型。VAR不足:难以进行理论分析并给出相应的政策建议;滞后长度不好确定;估计出的VAR模型难以解释,很难说清某个变量的给定变化对其他变量的未来值有何影响;参数增加时会大幅减少自由度,产生较大的标准差;要求所有变量都是平稳的。4、结构型VAR模型:是不可识别的,因为两个方程的等号右边有相同的前定变量。5、分析:分块显著性检验(格兰杰因果检验);如果y1是y2的格兰杰原因,那么y1的滞后项在y2的方程是显著的。脉冲响应;方差分解。第七章1、非平稳与平稳的本质差异:平稳时间序列的均值、方差都保持不变;而非平稳序列要么均值随时间变化,要么方差随时间变化,或者二者同时变化。2、随机游走过程(单位根过程/具有随机趋势的平稳过程/差分平稳过程):随时间的增加,方差变为无穷大,因而具有永久记忆性。方程xt=xt-1+ut。趋势平稳过程:yt=α+βt+ut;带有漂移的随机游走过程:yt=µ+yt-1+ut。3、单位根检验:DF检验(原假设:Ψ=0,序列包含单位根,回归方程,,不服从t分布,DF分布临界值小于t分布);ADF检验(回归方程,对△yt滞后项个数p的选择要(1)尽量小,以保证更大的自由度,(2)充分大以消除随机扰动项内的自相关);DF一个重要假设是误差项独立同分布,ADF则通过增加滞后项考虑了误差项可能存在的序列相关;在序列中存在特异值或结构变动时,PP方法的检验功效教ADF高,从而更可靠;DP方法可以检验更高阶、多个单位根的情况。KPSS检验原假设序列是平稳的,与以上相反。4、协整:两个变量都具有随机趋势(例如都是一阶单整的),则他们的线性组合可以抵消两个时间序列中的随机趋势,此时这两个变量就是协整的。5、ECM误差修正模型:,为误差修正项,是I(0)的;此时误差项不是白噪声,而是MA(1);β1描述短期关系,β2描述调整速度,即均衡误差的修正比例。6、ECM优点:避免伪回归;可以使用OLS回归,做有效的假设检验;可以同时描述变量静态特征和动态特征;反应出协整变量间存在偏离长期关系的修正过程。7、E-G两步法步骤:第一步:保证每个变量都是I(1);用OLS做回归估计;检验残差,确保残差是I(0),如果不是平稳的,就只估计一阶差分模型;第二步:建立误差修正模型,使用第一步得到的残差做变量,8、Johansen检验步骤:(1)检验各变量的单整阶数,通常要求阶数相同(2)确定模型的适当滞后长度(3)选择包含确定性成分(常数and/or趋势)的适当模型(5个模型)(4)利用λtrace和λmax确定协整向量的个数(5)参数的假设检验。第八章1、非线性特征:均值非线性or方差非线性(GARCH均值线性而方差非线性)。2、计算波动性的方法:历史波动性(计算过去一段时间的收益方差,并用于未来的波动性预测;可作为其他方法的比较基准);隐含的波动性模型(在给定期权价格的条件下,可以计算出基础资产收益波动性的市场预测值);指数加权移动平均模型EWMA(近期数据对波动性的预测有更大的影响);自回归波动模型(对代表波动性的指标序列建立ARMA模型并用于预测);GARCH模型(专门刻画波动性的模型)。3、ARCH模型:条件异方差自回归模型是ARCH(1)波动方程,是均值方程;ARCH效应检验:(LM检验)回归方程,得到R2,统计量为TR2,服从卡方分布,原假设参数=0;可以对残差平方做序列相关检验,采用Q统计量。4、GARCH模型:,是误差平方的ARMA模型形式,GARCH(1,1)模型可以写成无限阶ARCH模型。EGARCH模型和GJR(TGARCH)模型都考虑了杠杆效应。最大似然估计思想:5、残差标准化:尖峰,6、建立波动性模型步骤:(1)定义均值方程(常数,ARMA),(2)检验残差的ARCH效应(Q统计量,F检验,LM检验),(3)定义波动性方程(ARCH,GARCH,EGARCH,GJR),(4)联合估计两个方程(条件ML估计),(5)模型检验与改进(如果均值模型设定适当,则标准化残差独立同分布且正态;如果波动性模型设定适当,则标准化残差的平方是独立同分布的)。7、GARCH模型回归预测:预测公式:8、似然比检验LR:检验涉及对受约束和无约束回归方程的估计,GARCH模型中,检验β是否等于0,,m为受约束个数,大于临界值,拒绝原假设。