期中测试题一、填空题1.变量之间的关系有函数关系、____________.2.所有子集回归中自变量选择的准则有:、、.3.回归方程xyE10)(的参数0、1的最小二乘估计与最大似然估计等价的条件是.4.逐步回归方法中当时,容易出现“死循环”.5.一元线性回归的残差满足性质(1))(ieE;(2))var(ie.6.对线性回归系数显著性检验的t检验来说,P值越小,t值.7.在条件下,回归系数显著性的t检验、回归方程显著性的F检验及相关系数的显著性检验是等价的.8.样本容量n不变而自变量个数p增加时平方和SSTSSRSSE、、分别如何变化?.9.回归分析的主要应用有:经济结构分析、、.10.多元线性回归的基本假设有、、.11.处理多重共线性问题时,对自变量作线性变换使之两两正交,然后再对其作回归的方法称为.12.0ˆ是线性回归方程xyE10)(中0的最小二乘估计,则有)ˆ(0E=,)ˆvar(0.13.多元线性回归方程的显著性F检验通过表明对因变量y的线性影响显著.14.判断某样本是否是异常数据时,我们常常要借助于图.15.普通最小二乘估计法的缺点是二、判断题0()1.简单相关系数8.0r时,显著性检验可能没有通过;而简单相关系数2.0r时,显著性检验可能通过.()2.由标准化残差知,当3iZRE时相应的观测值一般是异常值.()3.简单相关系数0r表明变量间没有任何关系.()4.作预测时一般外推的效果要优于内插.()5.多重共线性问题在任何情况下都必须处理.()6.经典线性回归中残差序列12,,,neee是均值为0且等方差的.()7.矩阵XX有多少个特征根近似为0,设计矩阵X就有多少个多重共线性关系.()8.对回归系数显著性的t检验和对回归方程显著性的F检验是等价的.()9.强影响点一定是异常点.()10.前进法的缺点是“一棍子打死”.()11.多重共线性可导致回归系数的符号与实际不符.()12.10jVIF时,说明自变量jx与其余自变量间存在多重共线性问题.三、选择题1.自变量选择的一般准则是().A)少而精B)多而全C)尽可能使用全模型D)尽可能使用选模型2.等级相关系数可用于检验样本的()问题.A)异方差性B)自相关性C)多重共线性D)回归参数与现实不符3.线性回归中普通最小二乘估计的缺点是().A)回归直线被拉向方差大的项;B)回归直线被拉向方差小的项;C)方差大的项在平方和中所起的作用小;D)是有偏估计.4.下列关于相关系数的说法中不正确的有().A)复相关系数反映了整体与共性指标;B)简单相关系数反映了局部和个性指标;C)等级相关系数能够反映变量间的曲线关系;D)简单相关系数反映变量间线性关系而等级相关系数不能.5.下列关于相关分析与回归分析的说法中不正确的是().A)变量在回归分析中地位不等,而在相关分析中地位相等;B)在相关分析中两变量都是随机变量;C)相关分析不仅对变量间线性关系密切程度进行刻画还可以进行预测及控制;D)回归分析不仅揭示变量间的关系还可以用回归方程进行预测及控制.6.用y表示北京市各开发区的销售收入(百万元),1x表示招商项目数,2x表示招商企业注册资本(百万元),作线性回归后得到回归方程为21468.0036.2039.327ˆxxy,标准化回归方程为*2*1*485.0594.0ˆxxy,下面的说法不正确的是().A)招商项目每增加1个,销售收入增加2.036百万元;B)招商企业注册资本每增加1百万元,销售收入增加0.468万元;C)招商项目数比招商企业注册资本对销售收入的影响大;D)招商项目数比招商企业注册资本对销售收入的影响小.7.在所有子集回归中,如果建立方程的目的是为了预测,应使用()准则.A)2aR达到最大B)AIC达到最小C)pC统计量达到最小D)2R达到最大8.下列关于逐步回归法的说法中正确的是().A)逐步回归法的思想是“逐个引入”;B)逐步回归法一定优于所有子集回归;C)逐步回归法要求出进;D)出进时容易出现“死循环”.9.样本容量n与自变量个数p接近时,下列最不可能发生的是().A)2R接近于零;B)2R接近于1,但是显著性检验无法通过;C)设计矩阵X的多重共线性问题严重;D)参数的最小二乘估计的方差很大.四、证明题1.0ˆ是回归方程xyE10)(中参数0的最小二乘估计,证明:220)(1)ˆvar(xxLxn.2.证明标准化回归系数与普通回归系数之间的关系:jyyjjjLLˆˆ*,pj,,2,1.3.帽子矩阵XXXXH1)(,证明:(1)HH2;(2)1)(pHtr.4.证明:在一元线性回归中,t统计量ˆˆ1xxLt与F统计量)2/(1/nSSESSRF之间满足:2tF.5.证明:SSEpn11ˆ2是2的无偏估计.6.是矩阵XX的一个近似为0的特征根,),,,(10pcccc是对应于特征根的单位特征向量,矩阵X按列分块后为),,,(10pXXXX,证明:矩阵X存在多重共线性关系.五、解答题1.考虑过原点的线性回归方程iiixy1,ni,,2,1,误差n,,,21仍满足基本假设,求1的最小二乘估计1ˆ,并计算1ˆ的期望及方差.2.对某地区的居民收入x(万元)与储蓄额y(万元)的历史统计数据作回归,部分结果如下:xy085.0124.648,000.0,737.300sigF残差图如下:试分析:(1)给定显著性水平05.0,回归方程的显著性检验结果如何?(2)从残差图上分析,这组样本数据存在什么问题?除了残差图外,还有什么方法可以诊断这种问题?(3)样本数据中的问题如何解决?该方法的思想是什么?3.根据某地区1995年-2004年食品需求量y、可支配收入1x、食品类价格指数2x、物价总指数3x和流动资产拥有量4x的数据资料作线性回归得到的方差分析表和回归系数表如下:ANOVAbModelSumofSquaresdfMeanSquareFSig.Regression16616.84444154.211626.463.000aResidual33.15656.631Total16650.0009CoefficientsaModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1(Constant)-135.33575.132-1.801.132可支配收入.097.026.8213.660.015.008126.280食品类价格指数-1.991.902-.376-2.209.078.01472.827物价总指数3.4011.497.5072.271.072.008125.123流动资产拥有量.015.049.045.305.772.01855.440试分析:(1)回归方程和标准化回归方程是什么?(2)在05.0时,回归方程的显著性检验和回归系数的显著性检验结果如何?(3)判断数据有无问题,该问题将带来怎样的后果?详述本课程涉及的解决这一问题所有方法及其思想.4.考察第三产业对我国国际旅游外汇收入的影响,考察旅游外汇收入y(百万美元)与12个影响因素:1x——农林牧渔服务业;2x——地质勘察水质管理业;3x——交通运输仓储和邮电通信业;4x——餐饮业;5x——金融保险业;6x——房地产业;7x——社会服务业;8x——卫生服务业;9x——教育文化艺术;10x——科学研究和综合艺术;11x——党政机关;12x——其他行业.根据变量的设置情况试分析:(1)直接进行线性回归分析的结果可能会出现什么问题?(2)详述你所知道的所有自变量选择的方法.5.根据1983年-2000年中国粮食产量与相关投入数据进行回归分析得到的相关结果如下:54321028.0098.0166.0421.0213.644.12816ˆxxxxxy,9828.02R,11.137F,其中:y表示粮食产量(万吨);1x表示农业化肥施用量(万公斤);2x表示粮食播种面积(千公顷);3x表示受灾面积(公顷);4x表示农业机械总动力(万千瓦);5x表示农业劳动力(万人).试分析:(1)给定05.0,回归方程的显著性检验结果如何?(11.3)12,5(05.0F)(2)自变量1x和5x的偏回归系数的经济含义是什么?(3)方程中的偏回归系数合理吗?如果不合理,导致的可能原因是什么?请给出几种解决该问题的方法并阐述各方法的思想.