中央财经大学2008-2009学年第二学期《统计学》试题注意事项:1、考试中可以使用计算器。2、本试卷共有五道大题,请不要漏答。3、考试时间为110分钟,请注意合理分配考试时间。4、答题中可能用到的部分公式已经附在试卷末尾供参考。5、请将选择题的答案(用字母A、B、C、D、E)分别填在表1对应题号后的空格内。表1选择题答案表11121212223132341424515256167178189191020一、单项选择题(选出最为恰当的一项。每题1分,共20分)。1、以下关于参数和统计量的说法正确的是(d)。A、总体参数是随机变量B、样本统计量都是总体参数的无偏估计量C、对一个总体参数进行估计时,统计量的表达式是唯一的D、样本统计量是随机变量2、2009年6月新浪网进行的一项网络调查中,把调查问卷刊登在网站上,然后由感兴趣的网民自行填写。在回答问题的人员中有47.5%的人认为高考会改变个人一生的命运。对于此项调查,以下说法正确的是(b)。A、这是简单随机抽样B、这是方便抽样C、这是雪球抽样D、这是全面调查3、根据第2题中的调查,有媒体得出结论认为“全国居民中有47.5%的人认为高考会改变个人一生的命运”。这一结论(c)。A、完全正确B、不准确,因为没有给出置信区间C、不准确,因为样本缺乏对目标总体的代表性D、不准确,因为不知道调查的样本量,只有样本量足够大才可靠4、一名研究人员希望用图形说明5月份以来我国每天新增甲型流感确诊病例数的变化趋势,你认为适合的图形是(c)。A、饼图B、箱线图C、线图D、茎叶图5、在第4题中,如果要描述5月份以来我国每天新增甲型流感确诊病例数的统计分布情况,则最不适当的图形是(c)。A、直方图B、散点图C、箱线图D、茎叶图6、和开放式问题相比,封闭式问题的特点是(b)。A、问题的答案将会被严格保密B、所有可能的答案都被列在问卷上C、不属于目标总体的人员不得填写问卷D、调查结果不利于计算机处理7、在抽样调查中以下哪一项会造成非抽样误差?(d)。A、数据录入错误B、被调查者拒答C、调查员编造数据D、以上都对8、在对总体均值进行区间估计时,有限总体校正系数的使用(c)。A.增大了样本均值的标准误B.不会影响样本均值的标准误C.缩小了样本均值的标准误D.缩小了样本标准差9、调查了一个企业10名员工上个月的缺勤天数,有3人缺勤0天,2人缺勤2天,4人缺勤3天,1人缺勤4天。则缺勤天数的(b)A.中位数为2B中位数为2.5C中位数为4D众数为410、2009年6月19日,国务院决定在境内股市实施国有股转持,股改新老划断后,凡在境内首发上市的公司须按首发时实际发行股份数的10%将部分国有股转社保基金持有。某媒体希望在短时间内了解社会公众对这项政策的态度,最恰当的数据搜集方式是(c)。A.面访B.深度访谈C.计算机辅助电话调查D.邮寄调查11、对数据实行标准化之后得到的z分数(a)。A.没有计量单位B.服从正态分布C.取值在0-1之间D.取值在-1到1之间。12、一个对称分布的峰度系数等于2.0,则该数据的统计分布(a)。A、为尖峰分布B、为扁平分布C、为左偏分布D、为右偏分布13、在回归分析中可能存在异方差问题。异方差指的是(a)。A、各个自变量的方差不相等B、各个自变量的方差不等于因变量的方差C、总体回归模型中随机误差项的方差不相等D、各个因变量的方差不相等14、关于回归方程修正后的判定系数,以下说法正确的是(c)。A、进行修正的目的是为了消除多重共线性B、目的是为了修正自变量个数对判定系数的影响C、修正的判定系数取值在0-1之间。D、以上都不对15、下列指数中属于质量指数的有(a)。A.消费者价格指数B.总成本指数C.GDP增长率D.销售额指数16、我国的居民消费价格指数是采用(c)计算的。A、拉氏价格指数公式B、帕氏价格指数公式C、固定加权指数公式D、简单指数公式17、在问卷设计中,以下哪个问题设计的最为合理?(c)。A、国家认为H1N1病毒是可防可治的,你认为呢?B、你喜欢足球和篮球运动吗?C、你经常上网吗?D、你上个月的总支出是多少?18、一元线性回归方程的表达式为=100+6.8x,判定系数等于0.81,则x与y之间的相关系数为(b)。A、0.81B、0.9C、-0.9D、0.9或者-0.919、帕氏价格指数的计算公式为(d)。A、B、C、D、20、某商场2008年12月的商品销售额为100万元,该月的季节指数等于125%(乘法模型),在消除季节因素后该月的销售额为(a)。A、80万元B、100万元C、125万元D、以上都不对二、多项选择题(至少有一个选项是正确,多选、少选均不得分。每题2分,共10分)。21、在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法正确的有(abcde)。A、民族是定性变量B、邮政编码是定量变量C、年龄的计量尺度是定比尺度D、婚姻状况的计量尺度是定类尺度E、收入数据是定量数据22、1000名在校学生分为30个自然班。从总共30个自然班中随机抽取4个班共96名学生,发现有32名学生近视。则以下说法正确的有:(bde)。A、调查属于分层抽样B、样本中近视的学生比例为C、每个班是一个抽样单位D、每个学生是一个抽样单位E、1000名学生的名单是抽样框23、5个数1,3,8,9,10被分为两类:(1,3),(8,9,10)。则按照欧式距离计算:()。A、按照最短距离法两类之间的距离为5B、按照最长距离法两类之间的距离为5C、按照最短距离法两类之间的距离为9D、按照最长距离法两类之间的距离为9E、按照最短距离法两类之间的距离为724、用SPSS检验两个独立样本的均值是否相等,软件的部分输出结果如下,则(ad)。Levene检验均值是否相等的t检验FSig.tdfSig.(双侧)假设方差相等.731.395-2.01398.047假设方差不相等-1.99488.863.049A.如果a=0.05,则没有证据表明两个总体的方差不相等B.如果a=0.05,则可以认为两个总体的方差不相等C.如果a=0.05,则可以认为两个总体的均值相等D.如果a=0.05,则可以认为两个总体的均值不相等E.如果a=0.05,则可以认为两个总体的中位数不相等25、对于包含长期趋势、不包含季节成分的时间序列进行预测,适合用(bd)。A单参数一次指数平滑B双参数指数平滑C三参数指数平滑D直接拟合趋势方程进行预测EARMA模型三、简答题(每题5分,共10分)。1、试比较分层抽样和配额抽样的组织方式和特点。2、试述系统聚类方法的步骤。四、计算分析题(共30分)。1、(4分)在一次抽样调查中,采用不重复抽样方式,从500名毕业班的学生中按简单随机抽样方法抽选一部分学生推断总体中拟考研学生的比例。根据历史数据总体的比例估计为70%左右。已知最大允许误差为±5%,置信度为95%(Z0.025=1.96),计算必要样本容量。2、(6分)某地区的现价社会消费总额和CPI数据如下表。年份社会消费总额(万元)CPI20061340-2007145010520081670110(1)计算以2006年价格表示的2007和2008年社会消费总额(4分)。(2)以2006年为基期,计算2007-2008年实际社会消费总额的年平均增长率(2分)。3、(共8分)对一个零均值平稳时间序列建立AR(2)模型。由SPSS可以得到参数估计如下。(1)写出模型表达式(3分);xt=0.42xt-1+0.387xt-2+at(2)自回归参数是否显著非零(a=0.05)?为什么?(2分)(3)残差序列的自相关函数如下图所示,试判断该模型的适应性。(3分)4、(共12分)在一次调查中调查了消费者对一种玩具熊6个方面的评价:COLOUR(颜色)、SOFTNESS(柔软度)、STYLE(外观)、VALUE(价值)、ROBUST(耐用性)、SAFETY(安全性)。对数据进行因子分析的部分结果如下,因子分析中采用了主成分方法,因子系数矩阵采用方差最大旋转。根据结果回答下列问题:(1)变量之间的相关系数表如下。根据表中的数据分析因子分析方法的适用性(2分)。(2)因子分析中为什么要进行因子旋转?(3分)(3)旋转后的因子载荷矩阵如下,分析各个因子的含义。用F1、F2表示两个因子,写出用公共因子表示的COLOUR变量的表达式。(4分)(4)什么是因子得分?因子得分有何作用?(3分)五、案例分析题(共30分)。某项调查中随机收集了100名职工的相关数据,这些职工分别来自3家不同的公司。各变量的含义如下:性别:0=女性,1=男性;公司:1=公司12=公司23=公司3;收入:上个月的收入(元);支出:上个月的支出(元)。1、(共5分)下表是对收入做描述统计的结果。(1)根据表中的内容写出收入的均值、中位数,以及均值95%的置信区间(3分)(2)分析数据分布的对称性。(2分)统计量标准误收入均值2840.02150.721均值95%的置信区间下限2540.96上限3139.085%修整均值2838.71中位值2944.5方差2271681.7标准差1507.21偏度-0.1050.241峰度-1.2150.4782、(5分)研究人员希望检验能否认为总体的平均收入大于2500元。SPSS软件t检验的结果如下表。写出检验中的原假设、备择假设和检验的结论(显著性水平a=0.05)。单个样本检验检验值=2500统计量dfSig.(双侧)均值差值均值差的95%置信区间下限上限收入2.25699.026340.02040.96639.083、(10分)研究人员希望比较3家公司的平均收入是否相等。(1)可以采用哪种统计方法?(2分)(2)这种分析中需要哪些假设条件?(3分)(3)根据下面的结果分析数据是否满足其中的一个假设条件(2分);(4)得出检验的结论,写出决策的依据。(显著性水平a=0.05)(3分)。N均值标准差1242746.631704.9812362623.311500.4003403091.101385.110总数1002840.021507.210平方和df均方F显著性组间4421735.09622210867.548.973.382组内2.205E8972272935.617总数2.249E8994、(10分)研究人员估计了两个回归模型,相关结果如下。(1)根据表中的数据比较两个模型的拟合效果,并对t检验的结果进行分析。(4分)(2)在以上两个模型中,你会选择哪一个模型进行预测?为什么?(2分)(3)写出你选定的回归方程,并分析回归系数的含义。(2分)(4)一名男性职工的上月收入为3000元,预测其上月的支出。(2分)模型1:模型RR方调整的R方估计标准误1.977a.954.953206.712预测变量:(常量),性别,收入。模型非标准化系数tSig.B标准误差1(常量)628.05647.15713.318.000收入.619.01444.107.000性别31.06242.400.733.466模型2:模型RR方调整R方估计标准误1.977a.954.954206.223预测变量:(常量),收入。模型非标准化系数tSig.B标准误差1(常量)639.96144.16414.490.000收入.621.01445.155.00011