1题库1一、选择题(每题2分,共20分)1.B2.C3.D4.D5.A6.D7A8.B9.D10.C二、多项选择题(每题2分,共10分)1.ABCE2.ACE3.ADE4.AB5.ADE三、填空题(每空2分,共20分)1.分组标志、组矩2.4元、0.013.参数估计、假设检验4.弃真错误、纳伪错误5.-1,1四、简答题(每题5分,共20分)1.答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性。(1分)(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。(1分)(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。(1分)应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。(2分)2.答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。00HHppp值检验:若,不能拒绝;若,拒绝(3分)。3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。(2分)。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数(3分)。4、答:方差分析的步骤:首先,计算出总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)。SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小,三者之间的关系:SST=SSA+SSE。第二,计算SSE的均方MSE,SSA的均方MSA。将MSA和MSE进行对比,即得到所需要的F检验统计量。第三,将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出对原假设H0的决策。五、计算题(每题10分,共30分)21.解:(全对,给10分,错一空扣1分)2.解:根据题意:提出假设:01:4,:4HuHu(2分)检验统计量04.542/1/16xuZn(3分)由=0.05,查表临界值0.051.645ZZ由于Z=2Z=1.645,所以应拒绝0H而接受H1,即北京市家庭每天上网的时间确有显著提高。(5分)3.解:2222100310202()1001.510nXYXYnXX(4分)12220210//0100100YnXnYX(4分)样本回归方程:2YX(2分)题库2一、选择题(每题2分,共20分)2.C2.D3.D4.A5.D6.B7B8.B9.B10.A二、多项选择题(每题2分,共10分)1.ABCD2.ABD3.ADE4.AB5.ADE三、填空题(每空2分,共20分)6.统计设计、统计调查、统计整理、统计分析7.右偏、左偏8.无偏性、有效性、一致性9.线性相关四、简答题(每题5分,共20分)1.答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数(2分)。(1)全距:计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差(2分)。(2)平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算(2分)。(3)标准差:不易受极端数值的影响,能综合反映全部考分人数比率向上累计向下累计人数(人)比率(%)人数(人)比率(%)60以下25.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090以上820.040100.0820.0合计40100.0————3单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2分)。(4)离散系数:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小(2分)。2.答:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差越大(4分);样本单位数的多少,样本单位数越大,抽样误差越小(2分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(2分);抽样组织方式:简单随机抽样的误差最大(2分)。3.答:相关分析,就是用一个指标来表明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系(2分)。(1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度(4分)。(2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估算和预测提供了一个重要的方法(4分)。4、答:基本步骤:1.提出原假设和备择假设(2分)2.确定适当的检验统计量(2分)3.规定显著性水平α,确定临界值(2分)4.计算检验统计量的值(2分)5.作出统计决策(2分)五、计算题(每题10分,共30分)1.解:(1)乙班的平均分数:75503750fxfx乙(5分)乙班平均分数的标准差:79.9504800)(2ffxx乙乙班平均分数的标准差系数:%13.057579.9乙(3分)(2)比较哪个班的平均分数更有代表性:因为%22.12819.9甲小于%13.057579.9乙所以甲班的平均分数更有代表性(2分)。2.解:已知:2(1)0.020.98PP,4%p。(5分)1-=95.45%即/22Z。4必要的抽样数目:22/222(1)20.020.98490.04pZPPn(件)(5分)3.解::2222100310202()1001.510nXYXYnXX12220210//0100100YnXnYX样本回归方程:2YX(6分)将有关数据代入回归方程,得:220.51YX(亿元)置信度为95.45%的利润额的预测区间为:120.05120.05Y,即0.9(元)Y1.1(元)(4分)。题库3一、选择题(每题2分,共20分)1.B2.A3.D4.A5.A6.A7.D8.B9.B10.A二、多项选择题(每题2分,共10分)1.ABC2.BDE3.CE4.ACDE5.ACD三、填空题(每空2分,共20分)10.描述统计学、推断统计学11.等距式分组、异距式分组12.矩形13.标准差、均值14.总体均值、总体比例、总体方差四、简答题(每题5分,共20分)1.答:完整的统计调查方案包括:(1)确定调查目的,即为什么调查(2分);(2)确定调查对象和调查单位,即向谁调查(2分);(3)确定调查项目和调查表,即调查什么(2分);(4)其他内容,包括调查的时间与组织安排等(4分)。2.答:数据的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。定类尺度,是最粗略、计量层次最低的计量尺度,它是按照事物的某种属性对其进行平行的分类或分组。各类别之间是平等的并列关系,无法区分优劣或大小。(1分)定序尺度,它是对事物之间等级差或顺序差别的一种测度。该尺度不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。该尺度的计量结果只能比较大小,不能进行加、减、乘、除数学运算。(1分)定距尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。该尺度的计量结果表现为数值,并可以计算差值,因而,其结果可以进行加减运算。定距尺度没有一个绝对零点,不能进行乘、除运算。(1分)定比尺度,与定距尺度属于同一层次,其计量的结果也表示为数值。由于有绝对的零点,可以进行加、减、乘、除运算。(1分)5上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。(1分)3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。变量值绝对水平越高,离散程度的测度值自然也就大,绝对水平越低,离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。(2分)标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(1分)因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(2分)4、答:必要抽样数目受以下因素影响:(1)总体方差2。其他条件不变的条件下,总体单位的差异程度大,则应多抽,反之可少抽一些(1分)。(2)允许误差范围px或。允许误差增大,意味着推断的精度要求降低,在其他条件不变的情况下,必要的抽样数目可减少;反之,缩小允许误差,就要增加必要的抽样数目(1分)。(3)置信度(1-)。在其他条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目(1分)。(4)抽样方法。相同条件下,采用重复抽样应比不重复抽样多抽一些样本单位(1分)。(5)抽样组织方式。由于不同抽样组织方式有不同的抽样误差,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同(1分)。五、计算题(每题10分,共30分)1.解:1.解:品种价格(元/斤)甲市场乙市场成交额(m)成交量(m/x)成交量(f)成交额(xf)甲1.21.2122.4乙1.42.8211.4丙1.51.5111.5合计-5.5445.3甲市场平均价格5.51.3754mxmx(元)(3分)6乙市场平均价格5.31.3254xfxf(元)(3分)说明:两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销售价格较高的乙产品最多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用(4分)。2.解:根据题意:提出假设:01:50,:50HuHu检验统计量050.2500.9733/0.65/10xutSn由=0.05,查表临界值/20.0252.2622tt由于t=0.9733/2t=2.2622,所以不应拒绝0H,即每袋重量符合要求。3.解:195.04732495910122473627510222xxnyxxynb(4分)9765.23.47915.02.12xbya(4分)xbxayc195.09756.12当95.35195.09756.25bxayx时元(2分)题库4一、选择题(每题2分,共20分)1.B2.B3.D4.C5.A6.D7.A8.C9.C10.B二、多项选择题(