1参数稳定性检验和虚拟变量模型在本章余下的四节中,我们将讨论虚拟变量在回归分析中的应用。虚拟变量既可以作为解释变量出现在模型中,也可以作为因变量出现在模型中,我们统称这类含虚拟变量的经济计量模型为虚拟变量模型。2虚拟变量的性质在金融计量学中,所考虑的变量除了可以直接度量的数量变量(如价格、收益、收入等)之外,还有实质上是定性性质的变量,如性别、国家、战争及政府经济政策的变动等。这类定性变量常指某一性质、属性出现或不出现,例如男性或女性,中国人或外国人,战争期间或非战争期间等。由于其不能直接度量,为研究方便,可构造一个变量,令其取值为1或为0,取值为0时表示某一性质出现(不出现),取值为1时表示某性质不出现(出现),该变量即为虚拟变量(dummyvariables)。3一般的,在虚拟变量的设置中,基础类型、否定类型取值为“0”,称为基底(base)类、基准(benchmark)类或参考(reference)类;而比较类型、肯定类型取值“1”。虚拟变量和定量变量在回归模型中的应用是一样的。若一个模型中的解释变量全部都是虚拟变量,则此模型被称为方差分析模型(AnalysisofVarianceModel);若解释变量中既有定量变量,又有虚拟变量,则该线性回归模型可称为协方差分析模型(AnalysisofCovarianceModel)。4例子在我国上市公司中,个人做第一大股东的现象还非常少,主要是国家或法人作为公司的第一大股东。而国家作为第一大股东与法人相比,除了公司业绩,还有其它考虑,例如就业、形象工程、负责人升迁、上缴利税等,这些目标都或多或少有悖于公司利润最大化的目标。另外,国家控股的公司由国家选择代理人,而这些代理人往往是行政人员或官僚出身,没有经营管理的特长,进一步制约上市公司绩效的发挥。因此,总体而言,国家作为第一大股东的上市公司的绩效要低于法人做第一大股东的上市公司的绩效。为验证上述结论,我们建立如下的模型:iiiR=+D+u5其中为每股收益,用以代表公司绩效。的定义方式如下:1,国家是公司i的第一大股东=0,法人是公司i的第一大股东由模型可以得到:国家为第一大股东平均每股收益:︱=法人为第一大股东平均每股收益:︱=0)=iRiDiDiE(RiD=1)+iE(RiD6虚拟变量的设置原则许多金融现象表明,金融数据特别是时间序列数据常因某些非正常因素(如战争、自然灾害等)而产生较大的波动,这种波动使得被解释变量与解释变量之间的数量依存关系在某一期或暑期内同其它各期相比具有显著的差异。这种差异表现为描述变量之间关系的回归线(面)在不同时期内或截距项移动,或斜率移动,或截距项和斜率同时移动。7相应的,为表述这种移动,虚拟变量的引入方式也有如下的三种:(1)加法方式:(2)乘法方式:(3)同时以加法方式及乘法方式引入:在同一个模型中,可以引入多个虚拟变量,但其设置必须遵循如下的原则:如果一个定性变量有m个类别,则仅要引入m-1个虚拟变量。t0111tttY(+D)X+t01111tt22ttY(+D)X+D+t01t2ttYX+D+8虚拟变量模型的运用1、虚拟变量模型在调整季节波动中的运用许多按月度或季度数据表示的金融时间序列,常呈现出季节变化的规律性,如公司销售额、通货膨胀率、节假日储蓄额等。在研究中,有时需要消除季节性因素的影响,即需要进行季节调整(seasonaladjustment)。进行季节调整有多种方法,而利用虚拟变量进行季节调整是较为简单的一种。原模型:引入虚拟变量:t011t22tppttR=XX...Xut011223311t22tppttR=DDDXX...Xu92、虚拟变量模型在分段线性回归中的应用在金融理论中,常常会出现一种情况:当某影响因素越过某一临界值,或时间过了某一临界点之后,因变量对影响因素的变化率将发生变化,在图形中就表现为斜率不同的两段连续折线。对构成折线的数据的回归即为分段线性回归。例如:利用虚拟变量,我们可以建立如下的回归模型:t01t2ttttY=+X+(X-XD)+10图4-6有两个转折点的联系折线113、利用虚拟变量模型对平行数据进行混合回归假定要研究某一类型上市公司资本结构与影响因素之间的关系,我们以总负债率(以Y表示)代表资本结构,其影响因素假设只有股权结构(以表示)、公司治理结构(以表示)、成长性(以表示)三个因素;遗憾的是,假设这一类型的上市公司只有两家,而每家也只有从1991-2004年共14年的年度数据。很明显,对每一年利用横截面数据回归是不能的(观测值个数小于待估参数的个数)。12而对每家公司利用时间序列数据回归,尽管可以得到系数估计值,但实际上由于两家公司类型相同,可能受某些相同因素的影响,所以两方程的随机误差项可能是同期相关的,对每个方程分别应用普通最小二乘回归是不合适的。在此情况下,我们可以利用虚拟变量模型对时间序列和横截面数据的混合数据做出回归:t011t22t33t0t1t1t2t2t3t3ttY=XXXDDXDXDXu13回归模型的结构稳定性检验—邹氏检验一、邹氏检验的过程:邹氏检验所依据的理论前提包括:在可能发生的结构变化前后,随机误差项具有相同的方差;随机误差项满足独立正态分布。在这些假定下,可按如下的步骤进行邹氏检验:1、将数据以可能发生结构变化的点为界分为两部分。分别利用全部数据、两分样本对模型进行回归,并获得三次回归的残差平方和。142、此时,对全部数据进行回归得到的模型是一个受约束的模型(假定模型在整段数据中不发生结构性变化,即假定系数估计值在整个样本期间是稳定的),而对两分段数据的回归则是不受约束的模型(利用两个分样本分别得到的系数估计值可以是不同的),因此对整段数据回归得到的残差平方和大于对两分样本进行回归得到的残差平方和之和,可建立如下的F检验:它服从F(k,T-2k)分布1212RSS-(RSS+RSS)kF=RSS+RSST-2k153、查表求得在一定显著性水平下的F临界值。如果第二步计算出的F值大于临界F值,则拒绝模型结构稳定的假设;如果小于临界F值,则不能拒绝模型结构稳定性假设。应用邹氏检验的过程中应注意以下几点:⑴必须满足前提假设条件。⑵邹氏检验仅仅告诉我们模型结构是否稳定,而不能告诉我们如果结构不稳定,到底是截距还是斜率抑或两者都发生了变化,在下一节中我们将引入虚拟变量来解决这个问题。⑶邹氏检验需要知道结构可能发生的时间点,如果不知道,则需要使用其它方法。16在Eviews软件中如何做邹氏检验货币政策往往根据宏观经济形势的变化而发生变化,这就会导致货币供应量等货币政策的中间目标可能在某个时间点发生结构性变化。例如,以我国为例,1995-1997货币政策的主要目标是抑制通货膨胀,而1998年后由于亚洲金融危机的冲击等我国反而出现了通货紧缩,这时的货币政策也转变为“稳健的货币政策”,主要目标变为防止通货紧缩,刺激经济增长,因此货币供应量的增长在1998年可能会发生结构性的变化。为检验上述猜想,我们利用1995年第一季度到2004年第二季度的季度数据,以M2代表货币供应量,通过对GDP进行回归(因GDP增长相对稳定),并选定1998年第二季度为可能发生结构变化的转折点,来进行邹氏检验。17在Eviews中对下面模型进行回归其中、分别表示广义货币供应量M2和GDP.图4-7回归方程设定XtttYau,tYtX18图4-8回归结果19图4-9选择邹氏检验20图4-10确定邹氏检验转折点图4-11邹氏检验结果21回归模型的结构稳定性检验——虚拟变量法邹氏检验只能告诉我们结构是否发生变化,而不能告诉我们到底是截距还是斜率发生了变化,虚拟变量法则能有效地解决这一问题。下面我们将通过一个例子来说明如何运用虚拟变量法对模型进行结构稳定性检验。对于一元线形模型,假定在时刻,由于外部事件的冲击,我们怀疑模型的结构可能发生了变化。为验证这一观点,我们可以建立如下的虚拟变量模型t01ttYXut00t1t1tttYDX(DX)+u221其中=0可见,︱=0,)=,表示的是发生结构变化前的关系;︱=1,)=表示的是可能的结构变化发生后的关系。利用全部数据对上述虚拟变量模型进行最小二乘回归,并对参数估计值进行显著性检验。tDtttttE(YtDtX01tXtE(YtDtX0011t()+()X23可见,与邹氏检验相比,在检验模型结构稳定性方面虚拟变量法具有如下的优点:(1)较之邹氏检验的三次回归,虚拟变量法只需作一次总的回归,因而显得简单。(2)能够清楚表明是截距或斜率抑或两者都发生了变化。(3)由于合并两个回归而减少了虚拟变量的个数,增加了自由度,从而参数估计的准确性也有所改进。24实例—虚拟变量在金融数据处理中的作用根据Fama的有效市场理论,在有效市场中,由于股票价格能够及时地反映所有的信息,因此股价将会呈现出随机波动的特征。并且,在有效市场中,由于投资者能够随时获取所需要的信息,因此将不存在套利的机会,股票的价格将反映价值。按照有效市场理论,一周内每天的收益率将是随机波动、没有规律的。因为如果假设某天的收益率比其他各天的收益率高或者低,由于投资者可随时掌握所需要的信息,并且做出理性的选择,因此他们将充分利用这个套利机会来获取超额收益率。而随着套利过程的进行,超额收益率也会逐渐减少直至消失,从而每天的收益率又将会呈现出无规律的波动。25下面我们将利用虚拟变量模型对这一现象进行实证检验:数据描述:我们利用的是上海股票市场上证指数1997年1月1日到2004年12月31日的日收盘价数据,共1926个观测值。收益率的计算我们采用的是连续收益率法,计算公式如下我们建立如下的虚拟变量模型:ttt-1R=lnP-lnPt011t22t34t45ttR=+D+D+D+D+26图4-12上证指数日收益线性图27使用Eviews3.1软件对上述模型进行OLS回归,得到如下结果(括号内为相应的t值):对模型各系数估计值进行联合F检验,看各系数值是否同时为零,结果的到F值为1.03,其概率值为0.39,因此不能拒绝各系数值同时为零的假设,则可以得出结论,上海股票市场不存在周内效应。t1t2t4t5tR=0.001107-0.001495D-0.000793D-0.001982D-0.000445D(1.41)(-1.35)(-0.72)(-1.78)(-0.40)28本章小结本章主要分为两部分,在第一部分中我们主要讨论了金融数据中存在的多重共线性现象。第二部分我们主要介绍了虚拟变量的应用。在接下来的部分中,我们主要介绍了如何进行模型的结构稳定性检验的两种方法:邹氏检验和虚拟变量法。