一、填空题1、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是(100所中学的高中学生)。2、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为(65)。3、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为(88,88)。4、对连续大量生产的某种小件产品进行质量检验,最恰当的调查方式是(抽样调查)。5、按连续变量分为4组,各组为55-65,65-75,75-85,85以上,则数据65、85分别在(2,4)组。6、评价估计量优劣的标准有无偏性、(一致性或相合性、有效性)。7、根据季节时间数列资料计算的各季节比率之和应等于(4)。8、已知一个总体均值95%的置信区间为(122,130),如果样本均值和标准差分别为126和16.07,则研究时应抽取的样本容量为(64)。9、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5,标准差为3.7,比较两数列均值的代表性,结果是(甲好于乙)。10、已知总体标志值的平均数为13,各标志值平方和的平均数为174,则标准差系数为(17.2)。11、用水平法求平均发展速度本质上是求(序时)平均数。12、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。则全年平均库存额为(41)。14、构成时间数列的两个基本要素是(所属时间、指标数值)。15、在假设检验中,如果检验统计量的P值大于给定的显著性水平则在做决策时,需要在显著性水平的情况下,(不能拒绝)原假设。16、一组数据的最大值是85,最小值是33,中位数是55,众数是42,则该组数据的极差是(52)。17、样本统计量的概率分布称为(抽样分布)。18、利用样本统计量的值来估计总体参数的过程称为(参数估计)。19、统计分组中,同一组的上组限与下组限之差称为(组距)。20、两个变量之间的简单线性相关系数的取值范围为([-1,1])。21、样本或总体中各不同类别数值之间的比值称为(比率)。22、在互联网上主动参与某项调查的网民所构成的样本,称为(自愿样本)。23、一元线性回归中,使得残差平方和最小的估计回归系数的方法称为(最小二乘法)。二、不定项选择题1、统计学的核心内容是(C)。A数据的收集B数据的整理C数据的分析D数据的分组E以上都不对2、下列变量中属于连续变量的有(ABD)。A职工人数B机器设备台数C人的身高与体重D汽车、船舶数E工业增加值3、在下列叙述中,正确的是(ABCD)。A如果抽样分布的均值不等于总体参数时,则该统计量被称为参数的有偏估计。B样本方差可以估计总体方差C样本均值可以估计总体均值D样本比率可以估计总体比率E以上都不正确4、一元线形回归方程中的回归系数(AC)。A能说明两变量间的变动方向B不能说明两变量间的变动方向C能表明两变量间的变动程度D不能表明两变量间的变动程度E其数值大小受计量单位的影响5、随机抽取400人的一个样本,发现有26%的上网者为女性。则女性上网者比率95%的置信区间为(A)。A(0.217,0.303)B(0.117,0.403)C(0.217,0.403)D(0.117,0.503)6、从一个总体中抽取16个样本,其标准差为6.2022,则总体方差的置信度为95%的置信区间为(A)。A(4.58,9.60)B(5.20,9.78)C(4.72,9.20)D(4.90,9.77)(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)7、某公司1,2,3,4月职工平均人数分别为190人,215人,220人和230人,该公司一季度月职工平均人数为(C)A208B215C214D222E2128、某企业1996年产量为125,1997年比上年增长20%,1998年比1997年增长20%,则1998年比1996年增长(D)A20%B40%C60%D44%E40%9、应用移动平均法分析长期趋势,采用多少项计算移动平均数,一般考虑下列问题(ABC)A现象的变化是否有周期性B原数列的项数C原数列波动大小D是否需要移动平均数列的首尾数值E是时期数列还是时点数列10、抽样调查遵循随机原则的原因是(BE)A样本容量有限B保证总体中每个单位有同等机会被抽中C能确定抽样方法D能确定推断的可靠程度E能计算抽样误差三、简答题1、什么叫统计分组?简述对数据进行组距分组的步骤。是根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。步骤为:第一步,从小到大排序;第二步:确定组数,组数2loglog11010NK,其中N为数据的个数;第三步:确定各组的组距。组距是一个组的上限和下限的差,即组距=(最大值-最小值)/组数;第四步:根据组数整理成频数分布表;第五步,根据频数分布表绘制直方图和折线图。2、什么叫相关分析、回归分析?简述相关分析与回归分析的关系。二者是研究现象相关关系的基本方法。(1)相关分析(狭义)指用一个指标表明现象间相互依存关系的密切程度。(2)回归分析:根据相关关系的具体形态,选择一个合适的数学模型来近似表达变量间的平均变化关系。二者有着密切的联系,它们具有共同的研究对象,在具体运用时需要互相补充。具体:(1)相关分析需要依靠回归分析表明现象数量相关的具体形式;(2)回归分析需要依靠相关分析来表明现象数量变化的相关程度,只有变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。因此,回归分析和相关分析也合并称为相关关系分析或广义的相关分析。在研究目的和具体的研究方法上是有明显区别的,两者的主要区别在于:(1)相关分析研究变量间相关方向、程度,不能指出变量间相互关系的具体形式,也无法从一个变量的变化推测另一个变量的变化情况;而回归分析能确切地指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(2)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(3)相关分析所涉及的变量一般都是随机变量;而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量3、概率抽样与非概率抽样有何关系?联系:二者都属抽样调查、非全面调查。区别:概率抽样是按照随机原则抽取样本,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,可以计算和控制抽样误差,能说明估计结果的可靠程度。非概率抽样是从研究目的出发,根据调查者的经验和判断,从总体中有意识地抽取若干单位构成样本。在及时了解总体大致情况、总结经验教训、进行大规模调查前的试点等方面,非概率抽样具有概率抽样无法取代的优越性。4、标志与指标的区别与联系?区别:标志说明总体单位的特征,指标是说明总体的特征;指标都能用数值表示,而标志中的品质标志不能;指标数值是经过一定汇总得来的,而标志中的数量标志不一定经过汇总;标志一般不具备时间、地点等条件,但作为一个完整的指标,一定要受到时间、地点、范围等条件的限制。联系:许多统计指标的数值都是由总体各单位的数量标志汇总得来的;指标与数量标志在一定条件下可以转化。6、什么是均值、众数、中位数?三者的关系是什么?均值即算术平均数;众数是一组数据中出现次数最多的变量值;中位数是一组数据按从小到大排列后,处于正中间位置上的变量值。三者的关系是:对于同一组数据资料计算众数、中位数和均值,如果数据具有单一众数,且分布是对称的,则三者相等。若数据为左偏分布,则有0MMXe,若数据右偏分布,则有0MMXe。从数值关系上看,三者的关系可表述为XMMe230。7、什么是估计量?评价估计量的标准有哪些?(1)无偏性,指估计量抽样分布的数学期望等于被估计的总体参数。(2)有效性,指对同一总体参数的两个无偏估计量,标准差越小的越有效。(3)一致性(相合型),指随着样本容量的增大,点估计量的值越接近被估计总体参数的真实值。8、简述测定季节变动的原始资料平均法的基本步骤和原理。又称按月(或季)平均法,这种方法不考虑长期趋势影响,根据原始数据直接计算季节指数,测定季节变动。(1)计算各年同月(季)的平均数(i=1~12月或i=1~4季),目的消除各年同一季度(月份)数据上的不规则变动;(2)计算全部数据的总平均数,找出整个数列的水平趋势;(3)计算季节指数Si,即(i=1~12月或i=1~4季)10、何谓第II类错误与第Ⅰ类错误?第II类错误也称为取伪错误,指在假设检验操作过程中,当原假设实际上为假,但由于随机性,从总体中抽得的样本所构建的检验统计量值却落在了接受域之内,以致做出不能推翻(可以认为接受)原假设的判断,这样就称为犯了第II类错误;(2.5分)第Ⅰ类错误是指原假设实际上为真,但作出了拒绝原假设的判断,这样就称为犯了第Ⅰ类错误。(2.5分)11、请解释总体和样本。总体就是所研究的全部元素的集合(2.5分)样本就是从总体中抽取的一部分元素的集合(2.5分)四、计算题1、若已知甲、乙两个企业1980年的产值分别为300万元和500万元,1994年的产值分别为800万元和1500万元。要求:(1)分别计算甲、乙两个企业产值的平均发展速度;(2)若按各自的速度发展,甲企业从现在起还需几年才能达到乙企业1994年的产值水平?(3)若要求甲企业在五年内达到乙企业1994年的产值水平,则每年应递增多少?解:(1)甲企业=107.26%乙企业=108.16%(2)8.97(年)(3)113.40%-1=13.4%应递增13.4%2、有两个工厂生产三种产品的成本资料如下表,要求比较两个厂的总平均成本的高低并说明原因。(5分)yiiiyysiy品种单位成本(元)总成本(元)A厂B厂甲乙丙152030210030001500322515001500解:HA=19.41,HB=18.31A高于B,A厂价低的产品比重小,B市场价低的产品比重大。3、某公司下属三个部门报告期的流通费用率(=流通费/销售额)分别为12%、8%、10%,流通费用额分别为96万元、120万元、100万元。试计算三个部门的平均流通费用率。(5分)解:H==9.58%4、已知某袋装糖果的重量近似服从正态分布,现从一批糖果中随机抽取16袋,检测结果,样本平均重量为503.75克,标准差为6.022克。试求这批袋装糖果的平均重量的置信度为95%的置信区间。(请选择合适的临界值:Z0.025=1.96、Z0.05=1.645,t0.025(15)=2.1315、t0.05(15)=1.7531,X20.025(15)=27.488、X20.975(15)=6.262、X20.05(15)=24.996、X20.95(15)=7.261)解:样本平均重量为)(75.503克x,样本标准差)(2022.6s克,,,0.025/20.95-1,1315.215t15,1-n0.025则允许误差为305.3162022.61315.212/nsnt即这批袋装糖果平均重量的置信度为95%的置信区间为:503.75±3.305克,即在(500.45,507.06)之间。5、某地区8个同类企业的月产量与生产费用的资料如下:企业编号月产量(千吨)生产费用(万元)11.26222.086100015008003161mxm33.18043.811055.011566.113277.213588.0160要求:(1)计算相关系数,并说明相关程度。(2)并拟合一元线性回归方程,并对方程中回归系数的经济意义做出解释。(10)解:36