第八章虚拟变量回归思考题8.1什么是虚拟变量?它在模型中有什么作用?8.2虚拟变量为何只选0、1,选2、3、4行吗?为什么?8.3对(8.10)式的模型,如果选择一个虚拟变量1,01D大专及大专以上,高中,高中以下这样的设置方式隐含了什么假定?这一假定合理吗?8.4引入虚拟解释变量的两种基本方式是什么?它们各适用于什么情况?8.5四种加法方式引入虚拟变量会产生什么效应?8.6引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些?8.7设服装消费函数为12233tiiiiYDDXu其中,iX=收入水平;Y=年服装消费支出;1,30D大专及大学以上,其他;1,20D女性,其他试写出不同人群组的服装消费函数模型。8.8利用月度数据资料,为了检验下面的假设,应引入多少个虚拟解释变量?1)一年里的12个月全部表现出季节模式;2)只有2月、6月、8月、10月和12月表现出季节模式。练习题8.11971年,Sen和Sztvastava在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下回归模型ˆ2.409.39ln3.36(ln7)iiiiYXDX(4.37)(0.857)(2.42)R2=0.752其中,X是以美元计的人均收入;Y是以年计的期望寿命;Sen和Srimstava认为人均收入的临界值为1097美元(ln1097=7),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。括号内的数值为对应参数估计值的t值。1)解释这些计算结果。2)回归方程中引入(ln7)iiDX的原因是什么?如何解释这个回归解释变量?3)如何对贫穷国进行回归?又如何对富国进行回归?4)这个回归结果中可得到的一般结论是什么?年份国民总收入城乡居民人民币储蓄存款年底余额(Y)城乡居民人民币储蓄存款增加额(YY)年份国民总收入城乡居民人民币储蓄存款年底余额(Y)城乡居民人民币储蓄存款增加额(YY)(GNI)(GNI)19783624.1210.6NA199121662.59241.62121.819794038.228170.4199226651.911759.42517.819804517.8399.5118.5199334560.515203.53444.119814860.3532.7124.219944667021518.86315.319825301.8675.4151.7199557494.929662.38143.519835957.4892.5217.1199666850.538520.88858.519847206.71214.7322.2199773142.746279.8775919858989.11622.6407.9199876967.253407.57615.4198610201.42237.6615199980579.459621.86253198711954.53073.3835.720008825464332.44976.7198814922.33801.5728.2200195727.973762.49457.6198916917.85146.91374.22002103935.386910.613233.2199018598.47119.81923.42003116603.2103617.716631.98.2表8.4给出1965-1970年美国制造业利润和销售额的季度数据。假定利润不仅与销售额有关,而且和季度因素有关。1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量?2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量?3)如果认为上述两种情况都存在,又应当如何引入虚拟变量?的对上述三种情况分别估计利润模型,进行对比分析。表8.41965-1970年美国制造业利润和销售额的季度数据(单位:美元)年份季度利润(Y)销售额(X)年份季度利润(Y)销售额(X)Jan-6510503114862Jan-6812539148862212092123968214849153913310834123545313203155727412201131917414947168409Jan-6612245129911Jan-6914151162781214001140976215949176057312213137828314024172419412820145465414315183327Jan-6711349136989Jan-70123811704152126151451262139911813133110141415363121741767124127301517764109851803708.3在统计学教材中,采用了方差分析方法分析了不同班次对劳动效率的影响,其样本数据为早班中班晚班344939374740355142334839335041355142365140试采用虚拟解释变量回归的方法对上述数据进行方差分析。8.4JosephCamelld基于1961斗1966年的200只Aa级和Baa级债券的数据(截面数据和时间序列数据的合并数据),分别建立了LPM和IAgit模型1)LPM2122334455iiiiiiYXXXXu2)IAgit模型2122334455ln1iiiiiiiipLXXXXup其中,iY=1[债券信用等级为aA(穆迪信用等级)];iL=[债券信用等级为aaB(穆迪信用等级)];2iX长期债券的市值债券的资本化率(作为杠杆的测度=100)总资本的市值3iX税后收入利润率(100)总资产净值4iX=利润率的标准差(测度利润率的变异性):5iX=总资产净值(测度规模)。上述模型中,2和4事先期望为负值,而3和5期望为正值。对于LPM,Cappelleri经过异方差和一阶自相关校正,得到以下结果272345ˆ0.68600.01790.04860.05720.37810iiiiiYXXXXse=(0.1775)(0.0024)(0.0486)(0.0178)(0.039810)20.6933R对于LDgit模型,Cappelleri在没有对异方差进行弥补的情形下用ML得以下结果:262345ln1.66220.31850.62480.90410.92101iiiiiipXXXXp试解下列问题:1)为什么要事先期望2和4为负值?2)在LPM中,当40是否合理?3)对LPM的估计结果应做什么样的解释?的已知22X=9.67%,3X=7.77%,4X=0.5933%,5X=3429000(元),问债券晋升Aa信用等级的概率有多大?8.5Greene在分析讲授某门经济学课程采用新的教学方法效应时,搜集了如表8.5所示的数据,其中,GRADE是学生在接受新教学方法(PSI,PSI=1,0接受新教学方法,没有采用新方法)后学习成绩是否有所提高的虚拟变量,GRADE=1,0有所提高,没有提高;其他变量分别为平均级点GPA、非期末考试成绩分数TUCE。试用对数单位模型对此进行估计,并分析相应的边际效应。表8.5采用新的教学方法讲授某门经济学课程的数据obsGRADEGPATUCEPSIobsGRADEGPATUCE102.662001702.7525202.892201802.8319303.282401903.1223402.921202013.16255142102102.0622602.861702213.6228702.761702302.8914802.872102403.5126903.032502513.54241013.922902612.83271102.632002713.39171203.322302802.67241303.572302913.65211413.262503014231503.532603103.1211602.741903212.39198.6依据某大型超市的调查数据表8.6,分析股份制因素是否对销售规模产生影响。表8.6某大型超市的调查数据销售规模性质销售规模性质销售规模性质销售规模性质销售规模性质1345非股份制1566非股份制2533股份制1144非股份制1461非股份制2435股份制1187非股份制1602非股份制1566股份制1433股份制1715股份制1345非股份制1839非股份制1496股份制2115非股份制1461股份制1345非股份制2218股份制1234非股份制1839股份制1639股份制2167股份制1529非股份制1345非股份制1288股份制1345非股份制1402股份制1461股份制1345非股份制1288非股份制1602非股份制2115股份制3307股份制3389股份制1345非股份制1839股份制2218股份制3833股份制981股份制1839非股份制2365非股份制3575股份制1839股份制1345非股份制2613股份制1234非股份制1972股份制1926股份制2165非股份制