1统计学总复习2010-5:一、知识串讲统计学描述统计基础知识1)统计学一词的基本含义;2)统计学的研究对象;3)统计学的六个基本概念——总体和总体单位、标志和指标、变量和变异;4)统计学的基本研究方法——大量观察法、统计分组法、综合指标法、归纳推断法、统计指数法;5)统计数据的计量尺度——定类尺度、定序尺度、定距尺度、定比尺度的数据1)数据资料的收集:①范围——全面和非全面调查;②时间——经常性和一次性调查;③组织形式——统计报表和专门调查:重点调查、典型调查和抽样普查2)数据资料的整理:①统计分组——简单分组、复合分组;品质标志分组和数量标志分组;②次数分布——品质数列和变量数列——单项数列和组距数列——组中值的计算(尤其是开口组的组中值计算)3)描述现象状况——指标:①总量指标——单位总量和标志总量、时期指标和时点指标;②相对指标:表示形式、六个相对数;③平均指标:算术、调和、几何平均数、中位数、众数;④标志变异指标:标准差、标准差系数;⑤是非标志的均值和方差4)现象的动态对比:①时间序列——水平指标、速度指标、长期趋势的测定方法;②统计指数——综合指数、平均(数)指数、平均指标指数推断统计抽样推断:①抽样推断的特点、理论基础、估计的优良标准;②抽样误差及其影响因素;③抽样平均误差和抽样极限误差;④均值和成数置信区间的确定;⑤抽样方案——纯随机抽样、类型抽样、机械抽样、整群抽样、阶段抽样2二、简述题1.时期指标与时点指标的异同点2.举例说明品质标志与数量标志的异同点3.标志与指标的主要区别4.抽样误差及其主要影响因素5.举例说明相对指标的主要类型6.重点调查中的重点单位指什么7.统计误差的含义,其主要类型有哪些8.什么是相关关系9.估计标准误差的主要作用有哪些10.平均指数与平均指标指数的区别?综合指数的编制原则现象之间的关系及密切程度分析:相关及回归分析——相关关系、单相关系数、估计标准误差的作用、一元线性回归方程的确定3三、主要计算题所涉及到的相关章节(一)统计指数简单现象总体与复杂现象总体的某现象动态对比及其因素分析(主要是两因素分析):1.复杂现象总体的因素分析:总指数——综合指数和平均(数)指数的计算;2.平均指标的变动分析;3.总量指标与平均指标的变动分析(二)相对指标的计算结构、比例、比较、动态、计划完成程度、强度相对指标(三)平均数的计算1.某系200名学生统计考试成绩分组如下:按考试成绩分组(分)人数(人)各组人数比重%50分以下63.050~60126.060~705025.070~808040.080~904020.090~100126.0合计200100.0试用权数和频率权数计算该系学生的考试平均成绩;计算考4试成绩的标准差、标准差系数(四)时间序列1.水平指标的计算:逐期增长量和累计增长量、平均增长量、时点数列求平均发展水平(尤其是间隔相等的间断时点数列求平均发展水平的方法)2.环比发展(增长)速度、定基发展(增长)速度、平均增长速度、增长1%的绝对量3.长期趋势的测定方法:时距扩大法、简单移动平均法、最小平方法的计算4.某公司1~7月商品库存资料如下表:(单位:万元)1月2月3月4月5月6月7月月初库存500510514526月平均库存533549564577试计算:1)1~3月各月平均库存;2)5~7月各月月初库存;3)第一季度、第二季度以及上半年月平均库存。5.p121/6:某企业销售额资料如下表(单位:万元):200420052006200720082009销售额300360370450500520逐期增长额累计增长额环比发展速度%定基增长速度%5增长1%的绝对值要求:(1)计算空格内数据并填入表内;(2)计算04年至09年该企业的年均销售额;(3)年均增长额和年均增长速度;(4)计算销售额的三项移动序时平均数6.P122/8:根据下表中已知资料,运用时间序列指标的相互关系,推算空格内指标值.年份塑料产量(万吨)累计增长量(万吨)定基发展速度%定基增长速度%20004.1———20010.520020.9121.92003131.731.72004131.731.72005136.6(五)抽样推断:1.已知某厂在一定时期内生产了100000个单位的纱,按简单抽样方式抽取了2000个单位来检查,合格率为95%,试求抽样平均误差。2.某工厂从生产的一批零件中随机抽取1%检验其质量,调查资料如下表:6使用寿命(小时)零件数(件)700小时以下10700~800600800~900230900~10004501000~12001901200以上60合计1000根据质量标准,使用寿命在800小时以上为合格品。试以90%(t=1.64)的概率保证程度对这批零件的平均使用寿命以及合格率做出区间估计。3.对某鱼塘的鱼进行抽样调查,从鱼塘的不同部位同时撒网捕到鱼150条,其中草鱼123条,草鱼平均每条重2千克,标准差0.7千克。试按99.73%(t=3)的保证程度:(1)对该鱼塘草鱼平均每条重量做出区间估计;(2)对该鱼塘草鱼所占比重做出区间估计。4、某工厂有1500名工人,用简单随机重复抽样方式抽取50名工人作为样本,调查后资料如下(单位:元):月工资(元)工人数(人)1000~20002000~30003000~40004122674000以上8合计50要求:1)计算样本平均数和抽样平均误差;2)以95.45%(t=2)概率来估计该厂工人的月平均工资和工资总额的区间。5.某地区对已成熟即将收获的玉米做了一次类型比例(5%)抽样调查,获得资料如下表(单位:千克):按自然条件分组抽样面积(公顷)平均单产ix单产标准差iS合计in其中:受灾面积山地81.2210064丘陵122.4270050平原60.6300042合计264.2要求:(1)试按95%(t=1.96)的保证程度对该地区玉米平均单产和总产量做出区间估计;(2)试以95.45%(t=2)的保证程度对该地区玉米受灾面积比重做出区间估计。6、美国汽车协会进行的一项调查表明,度假时一个4口之家平均每天的花费为215.6美元。现选取去尼亚加拉大瀑布度假的64个4口之家为样本,样本均值为252.45美元,样本标准差为74.5美元。要求:81)计算去尼亚加拉大瀑布度假的4口之家平均每天的花费的95%(t=1.96)的置信区间;2)确定去尼亚加拉大瀑布度假的4口之家每天花费的均值与美国汽车协会所报告的均值是否有差别?(五)相关关系分析习题:1、设销售收入x为自变量,销售成本y为因变量。现已根据某商场12个月的有关资料计算出以下数据:(单位:万元)09.334229))((;8.549;25.262855)(;88.647;73.425053)(22yyxxyyyxxxtttt要求:1)拟合简单线性回归方程,并对方程中回归系数的经济意义做出解释;2)计算可决系数和回归估计的标准误差;2.某企业对车间9名学徒工进行调查,得到学徒期限与每天产量情况,资料如下所示,要求建立以日产量为因变量的回归方程。29,1320,15,25502xyxxy3、已知某班学生的英语学习时数(x)与成绩分数(y)的回归方程为xyc2.55.20。试解释式中回归系数的含义。若学生所用的学习时数每周最低为6小时,最高为14小时,问该班学生英语成绩分数范围是多少?4、已知相关系数r=0.6,估计标准误差Sg=8,样本容量n=62,试计算:(1)剩余变差与回归变差;(2)总变差5、对50个企业的横截面样本数据进行一元线性回归分析,9因变量与其平均数的离差平方和为8000,而回归直线拟合的剩余变差为1500。试求:(1)相关系数;(2)该方程的估计标准误差。