13.61985年,弗罗里达和佐治亚州都没有禁止车上有打开的酒精饮料。1990年,福罗里达州通过了这样的立法,但佐治亚州却没有。(1)假设你可以搜集到1985年和1990年两个州驾龄人口的随机样本。令arrest表示一个二值变量,如果一个人在当年曾因酒后驾车而被捕,它就等于1。在不控制任何其他因素的情况下,写下一个线性概率模型,以检验开瓶酒精饮料法是否降低了因酒后驾车而被捕的概率。在你的模型中,哪个系数度量了这项法律的影响?解为了建立此线性概率模型,根据题意,我们定义两个二值变量FLLD和90y,FLLD的值为1表示观测值来自弗罗里达州,0则表示观测值来自佐治亚州;90y的值为1表示观测值来自1990年,为0则表示观测值来自1985年。由此可以建立线性概率模型:.90901100uFLLDyFLLDyarrest截距0代表1985年佐治亚州的人曾因酒后驾车而被捕的平均概率。1990年的截距是00,其中0度量了佐治亚州的人曾因酒后驾车而被捕的概率从1985年到1990年的变化。1度量的是1985年弗罗里达州的人因酒后驾车而被捕的概率与基组佐治亚州的人因酒后驾车而被捕的概率之差。1度量的是1990年因弗罗里达州颁布检验开瓶酒精饮料法而导致的弗罗里达州与佐治亚州的人因酒后驾车而被捕的概率的差别,1正好度量了这项法律的影响,通过1可以检验该项法律是否降低了因酒后驾车而被捕的概率。(2)你为什么还想在模型中控制一些其他因素?这些因素有哪些?解要在模型中控制一些其他变量,是因为1985年到1990年是一个比较大的时间跨度,这期间影响arrest的很多其他因素都会发生变化,比如两地出租车司机的的种族、性别和年龄、驾龄分布情况,两地出租车司机的数量、收入、受教育情况,两地的治安环境等等。其中有部分因素是影响两地司机是否会酒后驾车的重要因素,比如正常逻辑推理下受教育程度上升会减少司机酒后驾车事件的发生,随着年龄增加司机酒后驾车次数越少,治安环境变好也会减少酒后驾车事件的发生等等。如果在模型中漏掉了影响arrest的重要变量,就会出现模型设定误差,导致回归结果有偏误。(3)现在假设你只能搜集到这两个州在1985年和1990年县一级水平上的数据。因变量是有驾驶人员在本年度因酒后驾驶而被捕的比例。这个数据结构与第(1)部分中描述的个人水平上的数据结构有何不同?你将使用哪种计量经济方法?解独立混合横截面数据是在不同时点从一个总体里进行随机抽样的结果,它们都是由独立抽取的观测所构成,比如每隔一年就对某大城市市区出售的住房抽取一个关于售价、平方公尺面积、卫生间数的随机样本。面板数据是在不同时间跟踪相同一些个人、家庭、企业、城市、州或者是其他单位得到的样本数据集,比如在一个时点上我们从总体中随机收集了一些人的工资、工作小时数、受教育程度和其他因素的一个面板数据集,那么,在以后若干个时点上,要对同样的人群反复采访。在(1)中我们能够搜集到1985年和1990年两个州驾龄人口的随机样本,所以(1)中数据是独立混合横截面数据。在(3)中我们只能搜集到这两个州在1985年和1990年县一级水平上的数据,所以(3)中的数据是在两个不同的年份跟踪相同一些州得到的,即(3)中数据是面板数据。对于(3)中面板数据,我将采用差分法对其进行计量经济分析。C13.3本题使用RAWKIELMC.中的数据。(1)变量dist是从每个房间到焚烧炉位置的英尺距离。考虑模型udistydistypricelog81log81log1100如果建造焚烧炉会减少其附近的房屋价值,那么1的符号将是什么?若01,则意味着什么?解建造焚烧炉会减少其附近的房屋价值,就是说在其他条件不变的情况下,远离焚化炉的房屋价值更高,所以01,也就是说1的符号为正。1度量的是与焚化炉的出现无关的区位效应,01意味在没有新建焚化炉的情况下,远离焚化炉的房屋价值本来就比靠近焚化炉的房屋的价值要高。(2)估计(1)部分中的模型并按通常的方式报告结果。解释distylog81的系数。你得到什么结论?解使用RAWKIELMC.中的数据,得到(1)中模型的估计方程为390.0,396.0,321082.0052.0805.0508.0log81048.0log317.081113.0058.8log22RRndistydistyprice变量distylog81的系数048.01,它的符号符合我们在(1)中预期,表示新建焚化炉后房屋与焚化炉之间的距离每增加1%将使得房屋价格上升0.048%。但是1的t值为0.589,p值为0.5562,所以1在统计上是不显著的。炉之间的距离每增加1%将使得房屋价格上升0.048%。但是1的t值为0.589,p值为0.5562,所以1在统计上是不显著的。(3)在方程中增加arealandlistbathsroomsageagelog,log,log,,,,2。现在你对焚烧炉对房屋价值的影响会作出什么结论?解在方程中增加arealandlistbathsroomsageagelog,log,log,,,,2后得到的新的估计方程为780.0,787.0,3210520.0025.0log351.0log095.0032.0028.0017.000000871.0intlog060.0101.0046.00000357.0001.0050.0045.0495.0502.0008.0log81062.0log0009.081225.0674.7log222RRnarealandstbathsroomsageagedistydistyprice在此新模型中062.01,相对于(2)而言弹性增大了,估计效应变大了。但是1的t值和p值分别等于1.242、0.2150,统计上仍然没有很强的显著性。对于单侧检验0:10H的p值等于0.1075,刚好在10%的水平上统计显著。(4)为什么(2)中distlog的系数为正并且统计显著,而在(3)中却不是这样?这说明了(3)中控制变量的什么?解(2)中的模型只包括变量distlog、81y及其交互项,但还有很多其他能够影响房价的因素,比如住房的各种特征等。(3)则把这些住房特征包括到模型中,这样做有很多好处。首先,1981年出售的住房种类可能与1978年有系统差别,这样则控制那些可能有所不同的特征就很重要。其次,即使有两个年份的住房特征值大致相同,但是包含它们能大大降低误差方差,降低1的标准误。正是模型(3)中包含了这些住房特征变量,导致了(2)和(3)中distlog的系数在数值、显著性等方面的不同。而(3)中distlog的系数比(2)小很多而且不显著,表明(3)中所包含的特征基本上概括了决定房价的最重要的住房特征。14.3在随机效应模型中,定义复合误差为itiitua,其中ia与itu无关,而且itu有常方差2u,并且是序列无关的。定义iitite,其中由式(14.10)给出。(1)证明0iteE。证iitite,iitiititEEEeE又因为0ituE且我们已经假定了模型ia有零均值,所以0iitEE所以000iititEEeE(2)证明TteVaruit,,2,1,2证0iteE222222222iiititiiititititEEEEeEeVar0itiuEaE且ia与itu无关,222222uaititiiituuaaEE。又因为TEETsisitiit1,而stuauaEstEEaisiitiuaitisit,,2222,所以TTEuaaauaaaiit22222222。同理可得TEuai222。把2itE、iitE、2iE带入iteVar中可得:TTEEEeVaruauauaiiititit222222222222又因为212221auuT,代入上式可得2222222222222222222222222222222211122uauauauauuauauauuauuauauauauauaitTTTTTTTTeVar结论得证,即有TteVaruit,,2,1,2。(3)证明对st,有0,isiteeCov证222,,,,,,,iisiiitisitiiisiiitisitiisiitisitEEECovCovCovCovCovCoveeCov而当st时,有2,aisitisitECov,所以222,iisiiitaisitEEEeeCov带入(1)、(2)已经得到的计算结果可得TTTTEEEeeCovuaauauauaaiisiiitaisit222222222222222,再在上式代入212221auuT,可得012,22222222222aauauauauaaisitTTTeeCov结论得证,即对st都有0,isiteeCov。C14.10本题使用RAWAIRFARE.中的数据。我们的兴趣在于估计模型4,3,2,1,logloglog2321tuadistdistconcenfareitiiiittit其中t意味着,我们容许每年的截距有所不同。(1)用混合OLS估计上述方程,注意包含年度虚拟变量。若10.0concen,估计fare提高多少个百分点?解在包含年度虚拟变量的情况下,用混合OLS估计上述方程,得到的回归结果为405.0,406.0,4596010.0128.0030.0421.0log103.0log902.0360.0209.6log222RRndistdistconcenfare变量concen的系数1的值为0.360,所以若10.0concen,估计fare将提高0.036个百分点,也就是说fare大约会提高3.6%。(2)1的通常OLS的95%置信区间是什么?它为什么可能不太可靠?如果你有能计算充分稳健标准误的统计软件,求出1的充分稳健的95%置信区间。与通常的置信区间相比较,并评论。解由(1)可得,通常的OLS下360.01,030.01se,临界值96.