统计学原理段雪妍肖智明主编上海财经大学出版社高职高专系列教材第1章总论第2章统计调查第3章统计整理第4章综合指标第5章时间数列第6章统计指数第7章抽样推断第8章相关分析第9章Excel在统计中的应用结束目录1.1统计的三种含义统计包含三种含义,两重关系1.统计工作:调查研究。资料收集、整理和分析。2.统计资料:工作成果。包括统计数据和分析报告。3.统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。统计工作统计资料统计学工作与工作成果关系实践与理论关系4.统计学的内容(1)描述统计指搜集、整理、分析并提供统计资料的理论和方法。使反映客观事物的统计数据可以一目了然,条理清晰,使用方便,可以说明现象的数量特征和数量关系。(2)推断统计指依据样本资料推断总体特征的技术和方法,包括参数估计和假设检验的方法。描述统计是推断统计的前提,推断统计是描述统计的发展。1.2.1统计学的特点1.2统计学的特点和研究方法(1)数量性(2)总体性(3)具体性(4)应用性2.统计分组法:就是根据研究目的和任务,将调查所获得的原始资料按照一定的标志区分为不同类型或者不同性质的组。3.综合指标法:就是运用各种综合指标对现象的数量特征、数量关系进行对比分析的方法。它是统计分析的基本方法。统计指标在统计分析中广泛应用。1.大量观察法:是指对所研究的事物的全部或足够数量进行观察的方法。1.2.2统计学的研究方法1.3统计学中的基本概念无限总体:含无限多个单位范围有限总体:含有限个单位。同质性:总体中各个单位具有某种共同的性质。大量性:总体总是包含大量的单位。特点同质性:总体中各个单位具有某种共同的性质。同质性:总体中各个单位具有某种共同的性质。同质性:总体中各个单位具有某种共同的性质。同质性:总体中各个单位具有某种共同的性质。范围同质性:总体中各个单位具有某种共同的性质。无限总体:含无限多个单位范围同质性:总体中各个单位具有某种共同的性质。特点无限总体:含无限多个单位范围同质性:总体中各个单位具有某种共同的性质。大量性:总体总是包含大量的单位。特点无限总体:含无限多个单位。范围总体1.统计总体和总体单位具有共同性质的许多单位组成的整体。总体单位:组成总体的最小单位(或元素)。同质性:总体中各个单位具有某种共同的性质。特点:具体性;综合性。构成:指标名+指标数值。指标:综合反映总体数量特征的概念和数值。3.指标和指标体系可变标志:各单位具体表现不同。不变标志:各单位具体表现相同。数量标志:用数值表示特征。品质标志:用文字表示属性。分类概念:说明总体单位的属性特征的名称。2.标志指标体系:具有内在联系的一系指标构成的整体。标志与指标的联系与区别:联系:(1)一些数量标志汇总可以得到指标的数值。区别:(1)标志是说明总体单位特征的,而指标是说明统计总体数量特征的。(2)数量标志与指标之间存在变换关系。(2)标志的具体表现,有的用数值有的用文字表示,而指标都是用数值表示的。指标体系:具有内在联系的一系指标构成的整体。在推断统计中:说明总体的指标也称参数。说明样本的指标称统计量。绝对数指标;相对数指标;平均数指标。分类:数量指标;质量指标。4.变量和变量值确定性变量分类随机性变量离散性变量连续性变量变量值:即变量的具体数值,包括标志值和指标数值。社会经济现象中许多变量,既受确定性因素影响,又受随机性因素影响。要根据具体情况加以认定。可变的数量标志和统计指标。变量2.1统计调查的意义和组织形式一、调查组织方式统计调查二、调查方案设计报表制度普查重点调查典型调查抽样调查方案内容调查表、问卷设计制度化的经常性调查专门组织调查全面调查非全面调查统计报表制度由政府部门组织,采用统一的表格,自上而下布置,自下而上报告。任务:搜集国民经济和社会发展基本情况的资料,为制订国民经济和社会发展计划和检查计划执行情况服务。优点:1.精心周密设计、高度统一、规范。2.回收率高,内容相对稳定,便于资料积累、对比。3.层层上报、逐级汇总,可以满足各部门需要。特点:普查特点:工作量大,时间性强,需要大量人力和财力。任务:搜集重要的国情国力和资源状况的全面资料,为政府制定规划、方针政策提供依据。方式:建立专门机构,配备专门人员调查。利用基层单位原始记录和核算资料发表调查。原则:规定统一的标准时点。规定统一的普查期限。规定调查的项目和指标。重点调查特点:在总体中选择个别或部分重点单位进行调查。任务:及时了解总体基本情况,为主管部门指导工作服务。方式:一次性调查:专门设计和配备人员现场调查。重点单位指在总体中有举足轻重地位的单位,其标志值在总体标志总量中占有绝大比重。经常性调查:同报表制度结合,用统计报表调查。典型调查特点:在全面分析的基础上,有意识地选择代表性的典型单位进行现场调查。任务:为研究某种特殊的社会经济问题,搜集详细的第一手资料,借以认识事物的本质特征、因果关系、变化趋势。为理论和政策性问题研究提供依据。作用:适宜于研究处于萌芽状态事物和倾向性问题;适宜于分析事物的类型,它们之间的差别和关系。方法:解剖麻雀;划类选典;抓两头。抽样调查特点:1.按随机原则从总体中抽取样本;2.以样本指标(统计量)为依据推断总体参数或检验总体的某种假设;3.抽样误差可以事先计算并加以控制。调查误差登记性误差代表性误差编差随机误差抽样平均误差实际误差统计推断中的抽样误差就是抽样平均误差。它是统计调查所固有的,是对抽样推断精确度的量度。2.2统计调查方案调查方案的主要内容1.确定调查目的2.确定调查对象和调查单位3.拟订调查提纲4.确定调查时间5.编制调查的组织计划2.3调查问卷设计调查表单一表一览表例:《工业企业统计报表》问卷结构:说明词+主题词句+作业记录例:《人口普查登记表》问卷设计基本要求:主题明确,形式简明,文字通俗,容易理解,便于回答。词句编排,层次分明,先易后难。问卷形式:①自由回答式词句②两项选择式词句③多项选择式词句④赋值评价式词句尊敬的先生、女士:我们是上海××学院的学生。为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则,在老师指导下我们组织了这次千户居民的社会调查。请您给予支持。调查不记名,全部资料用计算机处理,绝对保密和安全,您只需在符合您的情况的答案上打个勾,化费几分钟时间。谢谢!返回下页上海市城市居民消费与投资倾向调查问卷(1)您家是否已经拥有下列耐用家电设备:1.□彩电2.□组合音箱3.□VCD(DVD)4.□冰箱5.□空调6.□电脑(2)您家的住房是:1.□租赁公房2.□有产权公房3.□新商品房4.□其他(请注明)(3)您家今明两年是否准备以下项目支出:1.□购买家电设备2.□购买成套家具3.□购买汽车4.□购买(或置换)房屋5.□现有住房装修6.□支付子女教育费7.□国内或国际旅游返回下页上页(4)您今明两年不准备上列大项目支出的主要原因是:(选填3项)1.□没有必要2.□经济不宽裕3.□品牌不中意4.□质量信不过5.□售后服务差6.□价格不合理7.□其他(请注明)(5)您购买商品考虑的主要因素是:1.□实用价值2.□商品质量3.□价格4.□品牌5.□售后服务(请按您认为的重要性在□中写上位序)返回下页上页(6)您家平均每月总收入是:1.□500元以下2.□500~1000元3.□1000~1500元4.□1500~2000元5.□2000~3000元6.□3000~5000元7.□5000~8000元8.□8000元以上(7)您家平均每月日常生活费开支是元,其中用于吃(食品)支出大约是元。(8)您认为您家近几年生活水平是:1.□提高很多2.□略有提高3.□没有变化4.□略有下降5.□下降很多返回下页上页(9)您收入节余用于以下哪些项目?各项约占多大比重?1.银行储蓄()%3.国债(国库卷)()%3.基金()%4.其他债券()%5.股票()%6.保险()%7.其他()%(10)您存钱的主要目的是:1.□购买设备2.□购买住房3.□结婚4.□子女教育5.□养老防病6.□旅游(请按你认为的重要性在□中写位序)返回下页上页(11)您是否了解现在推行的信贷消费1.□不了解2.□了解一点3.□了解4.□很了解(12)您是否打算参加信贷消费:1.□是2.□不(跳过第13题)(13)您信贷消费的项目是()1.□购买家电设备2.□购买成套家具3.□购买汽车4.□购买(或置换)房屋5.□现有住房装修6.□支付子女教育费7.□国内或国际旅游返回下页上页(14)您是否同意下列看法:很同无不很同意所同不意谓意同意1.信贷消费不合中国国情2.信贷消费是资本主义国家的做法3.信贷消费是先甜后苦4.借债享受有风险5.借债消费不光彩6.信贷消费是现代通行的做法7.只要量力借贷,有利无害8.发展信贷消费能促进经济增长返回下页上页(15)最后,了解一下您的基本情况:A.您的性别:1.□男2.□女B.您的年龄:周岁C.您的文化程度:1.□不识字或识字不多2.□小学3.□初中4.□高中或中专5.□大专或大学以上D.您家庭人口数人其中:1.在业人;2.离退休人;3.失业、下岗人4.在校学生人。E.您的职业(见卡片)F.职务返回上页主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图3.1统计整理的意义和方法3.2统计分组分组前分组后25%33%42%1.划分现象类型作用:例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济;联营经济;股份制经济;外商投资经济;港澳台投资经济2.研究总体结构例:上海市按GDP计算的三次产业结构(%)1980年1990年1996年1997年GDP100100100100第一产业3.24.32.52.3第二产业75.763.854.552.2第三产业21.131.943.045.53.研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)2003004005006008001000恩格尔系数(%)64.960.256.754.450.549.943.6统计分组的种类1.关键:服从研究任务需要,反映总体本质特征2.形式按分组标志性质分品质标志分组数量标志分组按分组标志个数分简单分组复合分组分组体系3.3频数分布(分布数列)分布数列是一种重要的分组资料,反映总体单位在各组的分布状态。分组单位数频率合计………100频数分布频率分布分类品质数列变量数列单项数列组距数列等距数列异距数列例例例例变量数列的编制1.计算极差2.确定形式单项数列:离散型且取值不多。组距数列:离散型且取值多或连续型。3.组距数列:组距;组数;4.计算各组频数,频率,累计频数,累计频率等。5.组中值的计算:闭口组;开口组。某厂职工人数统计表按性别分组男职工女职工合计人数(人)(频数)比率(%)(频率)25311536868.7531.25100.00返回某厂职工家庭人口分组统计按家庭人口分组1合计职工户数(频数)比率(%)(频率)7返回23456381055431202.915.241.320.512.18.0255100某厂职工人数统计表按人数分组5~1011~16合计人数(人)(频数)比率(%)(频率)512325.051.04.0返回17~22201003.4统计表构成总表题横行标题:统计研究的对象,也称主词。纵栏标题:说明主词的指标名称,也称宾词。数字资料分类主词简单表分组表复合表宾词平行形式交叉形式上海市总人口数(1980~1991)年份1980年末总人口1146.52返回年份年末总人口198119821983198419851986198719881989199119901162.841180.511194.011204.781216.691232.331249.511262.421276.451283.351287.203.5统计图直方图等距数列:(变量,频数)异距数列:(变量,频数密度)折线图曲线图等距数列:(组中值,频数)异距数列:(组中值,频数密度)单项数列:(变量,频