1第一章数据与统计学一、填空题:1.统计学的发展史有三个起源,即政治算术学派、及数理统计学派。2.在现实生活中,“统计”一词有三种涵义,即、及统计学。3.同一变量往往有许多变量值,变量按变量值是否连续可分为和。4.凡是客观存在的,并在某一相同性质基础上结合起来的许多个别事物组成的整体,我们称之为。5.按数据的来源渠道划分,数据可分为和。6.统计调查按调查对象所包括被研究总体的范围可分为和。7.抽样误差只存在于调查中。8.从总体中抽取的部分基本单位构成的整体称为。二、单项选择题:1.要了解某市工业企业的生产装备情况,则统计总体是()。A、该市全部工业企业B、该市每一个工业企业C、该市全部工业企业的某个设备D、该市工业企业的全部设备2.对黄冈师院学生学习成绩进行调查,则总体单位是()。A、黄冈师院所有的学生B、黄冈师院每一位学生C、黄冈师院所有的学生成绩D、黄冈师院每一位学生成绩3.对全国城市职工家庭生活进行调查,则总体单位是()。A、所有的全国城市职工家庭B、所有的全国城市职工家庭生活C、每一户城市职工家庭D、每一户城市职工家庭生活4.在全国人口普查中,总体单位是()A、每一户B、每个人C、每个地区的人D、全国总人口5.下列属于数量变量的是()A、性别B、年龄C、职称D、健康状况6.下列属于品质变量的是()。A、工人年龄B、工人性别C、工人体重D、工人工资7.人口普查规定统一的标准时间是为了()。A、避免登记的重复与遗漏B、确定调查的范围C、确定调查的单位D、登记的方便8.全国人口普查中,调查单位是()。A、全国人口B、每一个人C、每一户D、工人工资9.抽样调查的主要目的是()A、随机抽取样本单位B、对调查单位作深入研究C、计算和控制抽样误差D、用样本指标来推算和估计总体指标10.要了解上海市居民家庭的收支情况,最适合的调查方式是()A、抽样调查B、重点调查C、典型调查D、普查三、多项选择题:1.下列属于数量变量的有()。2A、性别B、工种C、工资D、民族E、年龄2.下列属于品质变量的有()。A、性别B、工种C、工资D、民族E、年龄3.统计一词的含义有()A、统计工作B、统计经验C、统计资料D、统计管理E、统计科学4.普查一般属于()A、全面调查B、非全面调查C、经常性调查D、一次性调查E、专门组织的调查第1章习题答案一、填空题:1.人口统计学派2.统计工作统计资料3.连续型变量离散型变量4.总体5.直接数据间接数据6.普查抽样调查7.抽样调查8.样本二、单项选择题:1.D2.D3.D4.B5.B6.B7.A8.B9.D10.A三、多项选择题:1.CE2.ABD3.ACE4.ADE第二章统计数据的描述一、填空题:1.统计分组有等距分组与两大类。2.频率是每组数据出现的与全部次数之和的比值。3.统计分组的关键在于确定和组距。4.统计表从形式上看,主要由、横行标题、纵栏标题和四部分组成。5.是测度集中趋势最主要的测度指标,是测度离散趋势最主要的测度指标。6.当平均水平和计量单位不同时,需要用来测度数据之间的离散程度。7.是一组数据中出现次数最多的变量值。8.对于一组数据来说,四分位数有个。二、单项选择题:1.次数是分配数列组成的基本要素之一,它是指()。A、各组单位占总体单位的比重B、分布在各组的个体单位数C、数量标志在各组的划分D、以上都不对2.某连续变量数列,其末组为600以上。又如其邻近组的组中值为560,则末组的组中值为()。A、620B、610C、630D、64033.变量数列中各组频率的总和应该是()。A、小于1B、等于1C、大于1D、不等于14.某连续变量数列,其首组为500以下。又如其邻近组的组中值为520,则首组的组中值为()。A、460B、470C、480D、4905.在下列两两组合的指标中,哪一组的两个指标完全不受极端数值的影响()A、算术平均数和调和平均数B、几何平均数和众数C、调和平均数和众数D、众数和中位数6.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距应取()A、9.3B、9C、6D、107.一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤.据此数据可以推断()A、男生体重的差异较大B、女生体重的差异较大C、男生和女生的体重差异相同D、无法确定8.某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12.据此数据计算的结果是()A、均值=中位数=众数B、众数中位数均值C、中位数均值众数D、均值中位数众数9.按连续型变量分组,最后一组为开口组,下限值为2000。已知相邻组的组距为500,则最后一组组中值为()A、2500B、2250C、2100D、220010.下列数据是某班所有学生的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69,77,66,87,85,95,86,78,86,45,87,92,73,82。这些成绩的极差是()A、78B、50C、45D、4011.下列关于众数的叙述中,不正确的是()A、一组数据可能存在多个众数B、一组数据可能没有众数C、一组数据的众数是唯一的D、众数不受极端数值的影响三、多项选择题:1.下列分组哪些是按品质标志分组?()A、职工按工龄分组B、科技人员按职称分组C、人口按民族分组D、企业按所有制分组E、人口按地区分组F、职工按收入水平分组2.下列分组哪些是按数量标志分组()。A、职工按工龄分组B、科技人员按职称分组C、人口按民族分组D、企业按所有志分组E、人口按地区分组F、职工按收入水平分组3.下列哪些属于离散程度的测度指标()。A、几何平均数B、极差C、中位数D、方差E、离散系数4.下列哪些属于集中趋势的测度指标()。A、几何平均数B、极差C、中位数D、方差E、离散系数四、计算题:41.从某大学一年级学生中随机抽取36人,对公共理论课的考试成绩进行调查,结果如下:679066806765747087858375586754657986899578977678829456609388768479767776要求:(1)根据以上数据将考试成绩等距分为5组,组距为10,并编制成次数分布表,绘制次数分布直方图;(2)根据分组后的数据计算考试成绩的算术平均数。(写出公式、计算过程,结果保留1位小数)2.某企业1982年12月工人工资的资料如下:按工资金额分组(元)工人数40~5050~6060~7070~8080~9090~100100~11030401001702209050合计要求:(1)计算平均工资;(2)计算工资的众数、中位数、标准差。3.某车间有两个小组,每组都是7个工人,各人日产的件数如下:第一组:2040607080100120第二组:67686970717273这两个组每人平均日产件数都是70件,试计算工人日产量的变异指标:(1)全距(2)标准差,并比较哪一组的平均数代表性大?第2章习题答案一、填空题:1.不等距分组2.频数3.组数4.总标题数据资料5.均值标准差6.离散系数7.众数8.3二、单项选择题:1.B2.D3.B4.C5.D6.D7.B8.A9.B10.B11.C三、多项选择题:1.BCDE2.AF3.BDE4.AC四、计算题:1、解:(1)组距频数频率(%)向下累计(%)20~3024.004.0030~4012.006.0040~5024.0010.00550~6024.0014.0060~701326.0040.0070~80816.0056.0080~901224.0080.0090~100918.0098.0010012.00100.00合计5012、解ΣXiFi250×15+350×30+450×20+550×20+650×15X===440(万元)ΣFi100M0=300+(30-15)/(30-15+30-20)×100=360(万元)ME=400+(50-45)/20×100=425(万元)第三章抽样分布一、填空题:1.是对样本数量特征的描述。2.简单随机抽样分为和。3.样本均值的均值等于。4.样本均值的方差等于。5.不重复抽样的修正系数的表达式为。6..抽样调查是用的指标数值去推断和估计的指标数值。7.抽样调查的组织方式有:简单随机抽样、、、整群抽样。68.在抽样之前先将总体的单位划分为若干层(类),然后从各个层(类)中抽取一定数量的单位组成一个样本,这样的抽样方式称为,也叫分类抽样。二、单项选择题:1.已知总体X服从均值为40,方差为64的正态分布,现从中随机抽取容量为16的样本,则样本均值的均值是(),样本均值的标准差是()A、40,4B、40,2C、20,4D、20,22.总体均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的均值和标准差分别是():A、50,8B、50,1,C、50,4,D、8,83.大样本情况下,样本比率的抽样分布服从()A、正态分布B、t分布C、F分布D、8,不能确定4.已知总体比率为0.5,现从总体中随机抽取容量为100的样本,则样本比率的均值和标准差分别是():A:0.5,0.05,B:0.5,0.5,C:0.4,0.05,D:0.5,0.045.抽样分布是指():A:一个样本各观测值的分布,B:总体中各观测值的分布,C:样本统计量的概率分布,D:样本数量的分布。6.已知人类智商的得分X服从均值为100,方差为256的正态分布,从总体中抽取一个容量为n的样本,样本均值的标准差为2,则样本容量为()A:16B:64C:8D:不确定7.总体参数通常是未知的,需要用()进行估计A:总体均值B:总体方差C:总体的分布D:样本统计量8.已知总体比率为0.6,现从该总体中抽取一个容量为100的样本,则样本比率的均值和标准差分别是():A:0.6,0.05B:0.4,0.049C:0.6,0.049D:0.4,0.059.某地区有1000户居民,欲抽取5%进行调查,了解居民户对消费者权益的认知状况,先将居民户按顺序排队并分成50个组,每组20户,第一组随机抽出编号为6号居民户,其它各组抽中的居民户编号依次为26号、46号、……、986号,这种抽样方式是()。A、简单随机抽样B、类型抽样C、对称等距抽样D、随机起点等距抽样三、多项选择题:1.重复抽样和不重复抽样两种抽样方法的差别有()。A、抽样的样本数目不同B、抽样误差的计算公式不同C、抽样误差的大小不同D、标准差不同2.抽样估计的特点是()。7A、无偏性B、在逻辑上运用归纳推理C、在方法上运用不确定的概率估计法D、抽样估计存在抽样误差3.计算抽样平均误差,经常采用()来代替总体标准差。A、凭抽样调查者经验估计B、用样本的标准差C、用总体方差D、先组织试验性抽样,用试验样本的标准差E、用过去同类问题的全面调查或抽样调查的经验数据第3章习题答案一、填空题:1.样本统计量2.重复抽样不重复抽样3.总体均值4.总体方差的1/n4.5..样本总体6.分层抽样系统抽样7.分层抽样二、单项选择题:1.B2.B3.A4.A5.C6.B7.D8.C9.D三、多项选择题:1.ABCD2.BCD3.BD第四章参数估计一、填空题:1.参数估计方法有两种,即和。2.是根据样本资料以一定可靠程度推断总体参数所在的区间范围。3.评价估计量优劣的标准有三个,分别是、和。4.是为了使抽样误差,不超过所给定的最大允许误差,至少应抽取的样本单位数目。5.样本量越大,抽样误差越,但调查工作量大,成本越。6.在参数估计中,用来估计总体参数的统计量,称为。二、单项选择题:1.在抽样调查中,要提高推断的可靠程度即提高概率,必须()。A、缩小误差范围B、确定总体指标所在的范围C、扩大误差范围D、是绝对可靠的范围2.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差()。8A、前者小于后者B、前者大于后者C、两者相等D、无法确定哪一个大3.在其他条件同等的情况下,抽选5%和10%的单位样本,那么重置抽样平均误