1统计学原理简答题和计算题综合练习及参考答案一、简答题:1、举例说明统计标志与标志表现有何不同?答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。标志是所要调查的项目,标志表现是调查所得到的结果。例如:学生的“成绩”是标志,而成绩为“90”分则是标志表现。2、简述品质标志与数量标志的区别并举例说明。答:品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现;数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。例如某人的“职业”是品质标志;而“工资水平”就是数量标志。3、变量分组的种类及应用条件。答:变量分组是指按数量标志分组,分组的种类有单项式分组和组距式分组。由于变量有离散型和连续型之分,所以变量分组要根据变量的类型。如果离散型变量的变量值变动幅度比较小,则采用单项式分组,如果离散型变量的变量值变动幅度很大,项数又很多,就要采用组距式分组。而连续变量由于不能一一列举变量值,所以不能作单项式分组,只能进行组距式分组。4、简述结构相对指标和比例相对指标有什么不同并举例说明。2答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况。如:各工种的工人占全部工人的比重是结构相对指标。而某地区工业企业中轻重工业比例就是比例相对指标。5、简述调查对象、调查单位与填报单位的关系、区别并举例说明。答:调查对象是应搜集其资料的许多单位的总体;调查对象由调查目的所决定。调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者,是调查单位的组成要素;报告单位也叫填报单位,也是调查单位的组成要素,它是提交调查资料的单位,一般是基层企事业组织。调查单位与填报单位有时一致,有时不一致。例如人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人;人口普查的调查单位是每一个人;报告单位是每一户。6、抽样误差的概念及影响其大小的因素。答:抽样误差指由于抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素有:总体各单位标志值的差异程度、样本的单位数、抽样方法和抽样调查的组织形式。7、平均指数与综合指数的关系(用公式表示)3算数平均数指数=00010000pqpqpqpqkq=数量指标指数调和平均数指数=011111111pqpqpqkpqp=质量指标指数8、举例说明时期数列和时点数列的特点。答:时期数列是指由反映现象在一段时期内发展过程总量的时期指标构成的动态数列。时期数列的特点:(1)时期数列的各指标值具有连续统计的特点,(2)时期数列各指标值具有可加性的特点,(3)时期数列的各指标值的大小与所包括的时期长短有直接的关系。例如工业生产总产值、新增人口数是时期指标。时点数列是指由反映现象在某一瞬间总量的时点指标构成的动态数列。时点指标的特点:(1)时点数列的各指标值不具有连续统计的特点。(2)时点数列的各指标值不能相加。(3)时点数列各指标值的大小与时间间隔长短无直接的关系。例如居民年底储蓄存款余额、全国人口总数等是时点指标。二、计算题(要求写出计算公式、计算过程,结果保留两位小数)1、某班40名学生统计学考试成绩分别为:68898884868775737268758297588154797695767160906576727685899264578381787772617081学校规定:60分以下为不及格,60—70分为及格,70—80分为中,80—90分为良,90—100分为优。要求:4(1)将该班学生分为不及格、及格、中、良、优五组并编制一张次数分配表。(2)指出分组标志、类型及分组方法;分析学生考试情况。(3)计算该班学生平均成绩解:(1)40名学生考试成绩次数分配表:成绩学生人数(人)频率(%)60分以下37.560——7061570——801537.580——90123090——100410合计40100(2)分组标志为“成绩”,其类型为“数量标志”。分组方法为:变量分组中的组距式分组,而且是开口式分组。该班学生的统计学考试成绩分布呈两头小、中间大的“正态分布”的形态。(3)该班学生的平均成绩为:774030804049512851575665355fxfx(分)2、某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为9.6件;乙组工人日产量资料如下:5日产量(件)工人数(人)1525354515383413要求:⑴计算乙组平均每个工人的日产量;⑵比较甲、乙两生产小组哪个组的日产量更有代表性?解:(1)根据所给资料列计算表如下:序号日产量x工人数fxfx2f1151522533752253895023750335341190416504451358526325合计120100295095100乙组平均每个工人的日产量为50.291001345343538251515fxfx(件)(2)因为乙组平均每个工人的日产量的标准差为:99.8)1002950(10095100)(222fxfffx(件)6甲、乙组平均每个工人的日产量的标准差系数为:267.0366.9xV甲305.05.2999.8xV乙甲V乙V所以甲组工人的平均日产量更有代表性。3、甲、乙两农贸市场某农产品价格及成交量的资料如下:品种价格(元/公斤)甲市场成交额(万元)乙市场成交量(万公斤)甲乙丙合计1.21.41.5——1.22.81.55.52114试问该农产品市场哪一个市场的平均价格比较高?为什么?解:(1)甲市场平均价格:公斤)元/(375.145.51.51.51.42.81.21.25.5xmmx乙市场平均价格:公斤)元/(325.143.511211.511.421.2fxfx7通过计算说明,两个市场销售价格是相同的,成交量也是相同的,但甲市场的平均价格比乙市场的平均价格高。影响到两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交额不同。4、某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,资料如下:月平均工资(元)524534540550560580600660工人数(人)469108643要求:(1)计算样本平均数和抽样平均误差;(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。解:(1)计算样本平均数和抽样平均误差,列表计算如下:月平均工资x工人数fxfX2f5244209610983045346320417109365409486026244005501055003025000560844802508800580634802018400600424001440000660319801306800合计5028000157326408样本平均数)(5605028000元fxfx样本方差45.325605015732640)(222fxfffx重复抽样:59.45045.32nx(2)抽样极限误差xxt=2×4.59=9(元)月平均产量的区间:下限:x△x=560-9=551(元)上限:x△x=560+9=569(元)(2)总产量的区间:(551×1500;569×1500)即(826500元,853500元)以95.45%的概率保证,估计该厂工人的月平均工资在551元至569元之间,该厂的工资总额在82.65万元至85.35万元之间.5、采用简单随机重复抽样的方法,在2000件产品中抽查200件,其中合格品190件.要求:(1)计算合格品率及其抽样平均误差(2)以95.45%的概率保证程度(t=2)对合格品率和合格品数量进行区间估计。(3)如果极限误差为2.31%,则其概率保证程度是多少?解:已知:N=2000,n=200,n1=190z=2(1)样本合格率%952001901nnp9%54.1200)95.01(95.0)1(nppp抽样平均误差(2)按95.45%的可靠程度(t=2)对合格品和合格品数量进行区间估计%.08.98~%92.91%08.3%95:%08.3%54.12:即总体合格品率区间为抽样极限误差ppppz总体合格品数量区间为:下限=2000×91.92%=1838(件)上限=2000×98.08%=1962(件)按95.45%的可靠程度估计,合格品率在91.92%---98.08%之间,合格品数量在1838件---1962件之间。(3)当极限误差为2.32%时,则概率度5.1%54.1%31.2ppz查表可得概率保证程度F(z)=86.64%6、在4000件成品中按不重复方法抽取200件进行检查,结果有废品8件,当概率为0.9545时,试估计这批成品废品量的范围。解:这批产品的废品率为:%42008p,废品率的平均误差为:%35.1)1()1(Nnnppp废品率的极限误差为:%7.2%35.12Ppz这批成品的废品率为:4%±2.7%,即1.3%~6.7%。成品废品量的范围为:52~268件107、检查五位学生统计学原理的学习时间与成绩如下表所示:学习时数(小时)学习成绩(分)44066075010701390根据资料:(1)建立学习成绩y倚学习时间x的直线回归方程,解释回归系数的含义。(2)计算学习时数与学习成绩之间的相关系数。解:(1)设学习成绩y倚学习时间x的直线回归方程为:bxayC∵n=5,401310764x,3109070506040y274090137010507606404xy,3701310764222222x207009070506040222222y2.54037053104027405)(222xxnyxxynb4.205402.531051xbya11∴学习成绩y倚学习时间x的直线回归方程为:xyC2.520.4回归系数的含义为:学习时间每增加1小时,学习成绩将平均提高5.2分。(2)学习时数与学习成绩之间的相关系数为:2222)()(yynxxnyxxynr223102070054037053104027405=96.015.1360130074002501300分析相关关系:学习时数x和成绩y之间是高度正相关。8、根据某企业产品销售额(万元)和销售利润率(%)资料计算出如下数据:n=7,∑x=1890,∑y=31.1,∑x2=535500,∑y2=174.15,∑xy=9318要求:(1)确定以利润率为因变量的直线回归方程;(2)解释回归方程中回归系数的经济含义;(3)当销售额为500万元时,利润率为多少?解:(1)设直线回归方程为yc=a+bx22)(xxnyxxynb0365.0189053550071.311890931872xbya41.51890710365.01.3171则直线回归方程为yc=-5.41+0.0365x12(2)回归系数b的经济含义:当销售额每增加1万元,销售利润率增加0.0365%。(3)当x=500万元时,利润率为:yC=-5.41+0.0365×500=12.84%9、有三种产品单位成本及产量资料如下:产品名称单位单位成本(元/件)产量基期报告期基期报告期甲件3503205060乙台1801765050丙吨20201502