[9062]《统计学原理》

冬日阳光2
2 ℃
2020-05-12

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

37、为什么要对回归模型进行检验？参考答案：我们建立回归模型的目的是为了应用它来研究经济问题，但如果马上就用这个模型去预测，控制，分析，显然是不够慎重的，所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。38、简述相关分析和回归分析的关系参考答案：相关分析不必区分自变量（解释变量）和因变量（被解释变量），变量之间是平行关系，而回归分析要根据研究目的确定自变量和因变量，变量之间是因果关系；相关分析中两个变量都是随机的，而回归分析中，因变量是随机变量，而自变量是非随机的；回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系，而相关分析只能确定变量之间关系的方向和程度；回归分析实在相关分析的基础之上，进一步研究现象之间的数量变化规律。39、回归模型中随机误差项ε的意义是什么？参考答案：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。40、简述抽样估计的优良标准？参考答案：1）无偏性：指样本指标的平均数等于被估计的总体指标。（2）有效性：用样本指标估计总体指标时，若某样本指标的方差比其他估计量的方差小，则称该样本指标是总体指标的最有效的估计量。（3）一致性：以样本指标估计总体指标，要求当样本单位数相当大时，样本指标充分靠近总体指标，则称这个估计量为一致的估计量。41、一个完整的统计调查方案应包括哪些主要内容？参考答案：确定调查目的；确定调查对象和调查单位；确定调查项目，拟定调查表；确定调查时间和时限；确定调查的组织和实施计划。42、统计数据收集过程中，可能有哪些误差？参考答案：数据收集过程中可能存在两种误差：观测性误差和代表性误差。（1）观测性误差（登记性误差或调查性误差），是在调查观测的各个环节因工作粗心，或被观测者不愿很好配合，而造成的所收集数据与实际情况不符的误差。观测性误差在全面调查和非全面调查中都会产生。（2）代表性误差实在抽样调查中，由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。代表性误差又分为系统性代表性误差和偶然性代表性误差，系统代表性误差是指由于抽样框不完善，抽样违反随机原则，被调查者回答等因素引起的误差；系统性代表性误差通常难以计算和控制。偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符，从而产生的估计结果与总体真值不一致的误差；偶然性代表性误差不可避免，但是可以计算和控制。抽样调查中的观测性误差和系统性误差统称为非抽样误差，而偶然性代表性误差称为抽样误差。43、1.算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征？2.参考答案：（1）在变量分布完全对称（正态分布）时，中位数、众数和算术平均数三者完全相等。（2）在变量分布不对称（偏态分布）时，中位数、众数和算术平均数三者之间存在着差异。当算术平均数受极大标志值一端的影响较大的时，变量分布向右偏，三者之间的关系为：MoMeX--。当算术平均数受极小标志值一端的影响较大的时，变量分布向左偏，三者之间的关系为：44、为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合？参考答案：在回归模型的运用中，我们还强调定性分析和定量分析相结合。这是因为数理统计方法只是从事物外在的数量表面上去研究问题，不涉及事物质的规定性，单纯的表面上的数量关系是否反映事物的本质？这本质究竟如何？必须依靠专门的学科研究才能下定论，所以，在经济问题的研究中，我们不能仅凭样本数据估计的结果就不加分析地说长道短，必须把参数估计的结果和具体经济问题以及现实情况紧密结合，这样才能保证回归模型在经济问题研究中的正确应用。45、变量间统计关系和函数关系的区别是什么参考答案：变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系，而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。46、什么是统计指标体系，有哪些表现形式？参考答案：反映同一总体多方面数量特征的，一系列相互联系的统计指标所形成的体系，就称为统计指标体系。表现形式有，数学等式关系，相互补充关系，相关关系，原因、条件和结果关系。47、序时平均数与静态平均数有何异同？参考答案：共同是：两者均为平均数，都是反映现象数量的一般水平或代表性水平。区别是：静态平均数是把同质总体某一数量标志在某一时间的数量指标抽象化，从静态反映现象的一般水平或代表性水平，而序时平均数则把同一现象在不同时间上的差异抽象化，从动态上反映现象的一般水平或代表性水平。序时平均数是根据时间数列来计算的，而一般平均数则通常由变量数列计算。48、如何理解统计分组的含义与性质参考答案：统计分组就是根据统计研究的目的和事物本身的特点，选择一定的标志（一个或多个），将研究现象总体划分为若干性质不同的组或类的一种统计研究方法。统计分组具有以下性质：首先，统计分组兼有分与合的双重功能，是分与合的对立统一。其次，统计分组必须遵循“穷尽原则”和“互斥原则”，即现象总体中的任何一个个体都必须而且只能归属于某一组，不能出现遗漏或重复出现的情况。第三，统计分组的目的是要在同质性的基础上研究总体的内在差异性，即尽量体现出分组标志的组间差异而缩小其组内差异。第四，统计分组在体现分组标志的组间差异的同时，却可能掩盖了其他标志的组间差异，因此，任何统计分组的意义都有一定的限定性。第五，统计分组的关键是分组标志的选择和分组界限的确定。49、统计的含义与本质是什么参考答案：统计一词可以有三种含义，统计活动、统计数据和统计学。统计的本质就是关于为何统计，统计什么和如何统计的思想。50、环比发展速度和定基发展速度之间有什么关系？参考答案：1.定期发展速度等于各期环比发展速度的连乘积2.相邻两定基发展速度的商等于相应的环比发展速度。51、某市调查400户居民家庭收入资料如下表：人均月收入（元）组中值家庭户数月收入100—200200—300300—400400—500500—600150250350450550401201408020600030000490003600011000合计-400132000试求全距,平均值参考答案：全距=600-100=500（元）；平均值=132000/400=330（元）52、六、某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内，他随机地抽取100名驾车人士调查，得到如下结果：平均加油量等于13.5加仑，样本标准差是3.2加仑，有19人购买无铅汽油。试问：(1)以0.05的显著性水平来说，是否有证据说明少于20%的驾车者购买无铅汽油？(2)计算(1)的p-值。参考答案：假设检验为。采用成数检验统计量。查出＝0.05水平下的临界值为1.64和1.65之间。计算统计量值，因此z＝－2.5-1.65(-1.64)，所以拒绝原假设。p值为0.00062（因为本题为单侧检验，p值＝(1-F(|z|))/2）。显然p值0.05，所以拒绝原假设。53、六、某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内，他随机地抽取100名驾车人士调查，得到如下结果：平均加油量等于13.5加仑，样本标准差是3.2加仑，有19人购买无铅汽油。试问：(1)以0.05的显著性水平，是否有证据说明平均加油量并非12加仑？(2)计算(1)的p-值。参考答案：假设检验为。采用正态分布的检验统计量。查出＝0.05水平下的临界值为1.96。计算统计量值。因为z=4.68751.96，所以拒绝原假设。对应p值＝2(1-F(z))，查表得到F(z)在0.999994和0.999999之间，所以p值在0.000006和0.000001之间（因为表中给出了双侧检验的接受域概率，因此本题中双侧检验的p值＝1-F(|z|)，直接查表即得F(|z|)）。p值0.05，拒绝原假设。都说明平均加油量并非12加仑。54、某牌号彩电规定无故障时间为10000小时，厂家采取改进措施，现在从新批量彩电中抽取100台，测得平均无故障时间为10150小时，标准差为500小时，能否据此判断该彩电无故障时间有显著增加(a=0.01)？参考答案：假设检验为（使用寿命有无显著增加，应该使用右侧检验）。n=100可近似采用正态分布的检验统计量。查出＝0.01水平下的反查正态概率表得到临界值2.32到2.34之间（因为表中给出的是双侧检验的接受域临界值，因此本题的单侧检验显著性水平应先乘以2，再查到对应的临界值）。计算统计量值。因为z=32.34(2.32)，所以拒绝原假设，无故障时间有显著增加。55、对某地区120家企业按利润额进行分组，结果如表所示。按利润额分组（万元）企业数（个）向上累计200—300300—400400—500500—600600以上1930421811194991109120合计120计算120家企业利润的众数、中位数和均值；参考答案：众数=（万元）中位数=（万元）均值=426.67（万元）,标准差=116（万元）56、某汽油站有两种商标的汽油A和B，某天售出的50桶汽油可按商标A和B排成这样的顺序：AABAABABBAAABBABBABBABBABAABBBBAABABABAAABAAAAABB试问：在显著性水平a=0.05条件下，这一序列是否有随机性？参考答案：因为A(8个)，AA(4个)，AAA(2个)，AAAAA(1个)，B(7个)，BB(6个)，BBBB(1个)。n1=27，n2=23。假设检验H0:样本为随机样本，H1:样本为非随机样本。求出游程总和。R1=15，R2=14，R=29。因为，构造统计量。由于=0.05的临界值为1.96，z=0.9091.96，所以接受原假设，序列是随机的。57、某市全部职工中，平常订阅某种报纸的占40%，最近从订阅率来看似乎出现减少的现象，随机抽200户职工家庭进行调查，有76户职工订阅该报纸，问报纸的订阅率是否显著降低(a=0.05)？参考答案：假设检验为。采用成数检验统计量。查出＝0.05水平下的临界值为1.64和1.65之间。计算统计量值，z＝-0.577-1.64，所以接受原假设。p值为0.48和0.476之间（因为本题为单侧检验，p值＝(1-F(|z|))/2）。显然p值0.05，所以接受原假设，抽样没有表明报纸订阅率显著下降。58、某市调查400户居民家庭收入资料如下表：人均月收入（元）组中值家庭户数月收入100—200200—30015025040120600030000300—400400—500500—6003504505501408020490003600011000合计-400132000试求标准差，标准差系数参考答案：标准差=102.96（元）标准差系数=102.96/330=0.31259、对某地区120家企业按利润额进行分组，结果如表所示。按利润额分组（万元）企业数（个）向上累计200—300300—400400—500500—600600以上1930421811194991109120合计120计算分布的偏态系数和峰度系数。参考答案：分布的偏态系数SKp=峰度系数=60、计算分析题（要写出主要的计算步骤，否则不得分。）1.从一群成年人和一群幼儿中各随机抽取10名，对他们的身高（cm）进行调查，这10名儿童的身高分别是（cm）：68、69、68、72、71、78、72、72、74、80。要求：(1)确定这组儿童身高的中位数和众数;(2)计算这组儿童身高的算术平均数；(3)计算这组儿童身高的标准差；(4)若成年组的平均身高为174cm，标准差为3.87cm。请计算恰当的指标，并比较分析哪一组人群的身高差异大。2.某市随机抽取100名职工，对其月收入进行了调查，经整理资料如下：月收入（元）人数(人)2000以下182000-30