统计学原理李洁明祁新娥著主讲人肖翠仙邮箱:tracyxiao@sina.com•纪律•课程简介“没有统计,其它科学可以存在,但是很渺小”一个医生说:“医学若无统计就不是科学”关于统计的一些论断台湾辅仁大学一教授说“统计即生活,统计即人生”.外国某机构评论:“统计是20世纪对人类社会贡献最大的四大学科之一”。一位资深的海外统计学家说:统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。为什么?当今社会(时代)被称为信息社会.信息社会的主要特征:信息在各个领域的重要性;信息数量庞大;信息处理和传输迅速…统计在信息社会中的重要作用:提供搜集信息的理论方法;提供加工处理信息的理论方法.感悟统计(之一)广东投资结构呈现积极变化民间投资企稳回升广东省统计局2010-03-0510:41:532009年,广东积极落实国家扩大内需政策,加快推进重点项目建设,着力推进投资产业结构调整和区域协调发展,固定资产投资保持稳定增长的态势,并为全省经济增长目标的顺利实现做出积极贡献。一、固定资产投资基本情况2009年,广东全社会固定资产投资完成13353.15亿元,同比增长19.5%,同比增幅加快3.0个百分点。其中:城镇投资首次突破万亿,达10390.11亿元,增长18.2%;农村投资2963.04亿元,增长24.5%。感悟统计(之一)(一)投资增长稳步上升,总量居全国第4位。2009年广东固定资产投资总量稳步迈上1.3万亿的新台阶,而且各月投资增速呈现逐渐走高的趋势.年初(前2月)虽然仅增长12.3%,但在此后各月,累计投资增速均以0.4—1.0个百分点的幅度递增(见图1)。图1:2009年广东固定资产投资完成情况……感悟统计(之二)撑死的人比饿死的人多!据统计,肥胖并发脑血栓和心衰的发病率比正常体重者高一倍,患冠心病者多2~5倍,高血压发病率多2~6倍,合并糖尿病者高4倍,合并胆石症者高4~6倍。美国生命保险协会的统计调查结果显示,超重25%和35%的肥胖症者的死亡率比正常人高28%和50%,表明肥胖程度和死亡率呈正相关。美国每年因肥胖伴有冠心病、高血压、高血脂、糖尿病和脑血管意外而死亡的人数大约有30万人。众所周知,《红楼梦》一书共120回,一般认为前80回为曹雪芹所写,后40回为高鹗所续,长期以来对这个问题一直有争议。能否从数学上做出论证?1985、1986复旦大学李贤平教授带领他的学生作了这项有意义的工作,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),计算出每一回里变量出现的次数,用多元分析中的聚类分析法进行分类,果然将120回分成两类即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。NEXT后40回出自谁的手笔后40回出自谁的手笔之后,又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔。而后40回是否为高鹗写的呢?论证结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。统计学的学科性质古往今来的统计学者对统计学给予了不同的定义。根据美国统计学家DavidFreedman等著的《统计学》(魏宗舒等译,中国统计出版社,1997年版)中的定义:统计学是对令人困惑的问题作出数字设想的艺术。案例:在一个水库中养着许多鱼,管理人员希望了解鱼的大致数量,这就是一个实践中的统计学问题。由于鱼是不听从指挥,会在各处自由游动的,因此,在进行统计时,必须创造性地提出解决方案。一种解决方法是先从水库的不同位置一共捕上来1000条鱼,在每条鱼的尾部作上一个标记,应当保证标记不会影响鱼的自由游动。然后,将鱼全部放回水库。几天后,从水库中再捕上来2000条鱼,检查其中尾巴上有标记的鱼的数量。假定在第二次捕上来的2000条鱼中,有20条尾巴上做了标记,则可以推断,水库中鱼的总数大致为1000/(20/2000)=10万条统计学的研究方法从根本上说,是从数据出发去研究自然和社会经济规律,这一点与其他科学存在着显著的区别。例如经济学,是通过对各种经济主体行为的理论分析,探讨经济规律,而统计学在研究经济现象时,是从结果出发,去探寻其中的规律。上述这个案例在实践中是经常见到的,对于一个统计工作者来说,作出一个10万条鱼的估计是不够的,他还应当对这一估计的精度作出判断。但这种搜集统计数据的方法,更多地是一种艺术,是很难从书本上学到的。在实践工作中,统计的应用方面是十分复杂的,只有将统计理解为一种艺术,创造性地提出新的方法去解决新的问题,才是真正地掌握了统计的精髓。统计学科简史最古老的统计可以上溯到远古时代人们对于土地和产量的测量,但这一时期的统计方法往往是粗陋的,没有形成完整的科学体系。统计学者比较认同的现代统计学的源头大致包括三个方面。1.1676年英国经济学家威廉·配弟发表的《政治算术》。在这本书中,配弟用大量的数字分析了英、法、荷等三国的经济实力,开创了利用统计数字进行经济学分析的先河。这一统计学分枝后来发展成了国势学派,今天的国民经济核算体系,就是源于这一学派的理论。2.1662年英国学者约翰·格朗特发表的《关于死亡表的自然观察与政治观察》。在本书中,格朗特分析了英国伦敦的人口死亡情况,成为最早的人口统计学研究。目前,人口统计学是统计学中最有活力的分枝之一。3.17世纪法国数学家帕斯卡尔和费尔马创立的古典概率论。在这一时期,两位数学家以通信的方式,讨论了赌博中各种具体情况的概率计算问题,发展了概率论理论。到19世纪末,古典统计学的框架基本形成,其主要的内容主要是今天描述统计学涉及的内容。统计学科简史进入20世纪以来,随着大工业生产的发展,质量检验的统计理论迅速形成。1908年,英国酒作坊学徒工戈赛特(Gosset)以“Student”的笔名在《生物统计学》杂志上发表了一篇论文《平均数的概差》,提出了基于小样本的t统计量理论,极大地推动了推断统计理论的发展。20世纪中叶,英国统计学家RonaldAylmerFisher(1890-1962)等人分别对F统计量、极大似然估计、方差分析等理论进行了大量的探讨,从而建立起了推断统计学的庞大的学科体系。在1920年之前,由样本对总体进行估计的概念,一直是直观和模糊的,1925年,Fisher在其著名论文《研究人员用的统计方法》中,阐明和扩展了估计的概念,提出了最优估计概念,以及估计的效率和充分性等问题。在长期从事实验设计的过程中,Fisher还提出了重要的随机化原则,认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。理论界认为,在1920年之前,统计研究属于“资料整理”时期,即描述统计学时期,从Fisher开始,进行了“分析统计”时期,即推断统计学时期。理论统计学与应用统计学统计学从学科分类上看,可以分为理论统计学和应用统计学两大部分。理论统计学(TheoreticalStatistics)是指统计学的基本原理,主要研究统计学的一般理论问题,尤其是各种统计方法的数学理论问题。如统计分布,统计估计与假设检验理论、相关与回归分析、方差分析,时间序列分析等。应用统计学(AppliedStatictics)是研究如何应用统计方法去解决实际问题的,应用统计学一般都与特定的领域相联系。例如,统计学在教育领域的应用,称为教育统计学;在经济领域的应用,称为经济统计学;等等。描述统计学与推断统计学描述统计——研究如何对客观现象的数量特征进行计量、观察、概括和表述。用表和图表示,计算特征量(如平均值)等,所论不超出已有数据。推断统计(统计推断)——据数据所提供信息对数据所来自的总体(母体)的性质作推断,推断会有错误、误差,用概率论的术语和方法来描述和论证。误差的产生源于数据有误差。怎样尽可能减少推断的错误和误差,是统计推断的中心问题。目的描述数据特征找出数据的基本规律内容确定要研究的数量特征设计统计指标(说明这些数量特征的)搜集数据整理数据计算并显示指标数据描述统计目的对总体特征作出推断。内容参数估计假设检验相关回归分析样本总体推断统计描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据图1-1统计学探索现象数量规律性的过程统计学原理李洁明祁新娥著第一章绪论第二章统计调查与整理第三章综合指标第四章动态数列第五章统计指数第六章抽样调查第七章相关分析第八章国民经济核算教学目的本章对统计学的基本问题进行了介绍,如统计学的研究对象、统计学的研究方法、统计工作过程、统计的职能、统计组织以及统计学的一些基本概念等等。本章的教学目的是,通过学习对统计学科的性质有一个基本的认识。•统计学的研究对象及其特点•统计学的研究方法•统计学的几个基本概念•统计的职能和组织•统计一词的三种涵义及相互关系第一章绪论统计发展史:1、原始社会:统计萌芽时期。2、奴隶社会:有了初步的国情统计。3、封建社会:开始了初步的发展。4、资本主义社会:统计成为一个独立部门。5、社会主义社会:认识社会的有力武器。第一章绪论第一节统计学的产生和发展第一章绪论第一节统计学的产生和发展统计学派及代表人物学派特点代表人物成就政治算术学派用数字、重量、尺度来表达思想、朴素图表[英]William.Patty[英]JohnGraunt《政治算术》,Marks称Patty是统计学的发明者国势/记述学派以文字记述比较国情[德]H.Conring[德]Achenwall**第一个使用“统计学”名称图表学派用表格、几何图形表现统计资料[丹]Ancharsen[1][德]Crome[2][1]编第一个15国比较统计表[2]第一个用几何图形来表现统计资料数理学派用数理统计方法进行社会、自然研究[比]R-Quetelet第一次把概率论和数理统计方法应用于社会经济统计社会学派用大量观察法研究社会经济现象的数量表现和变化[德]Kinis[法]Geoge.P.Mayer[英]Engel**Engel法则第一章绪论第一节统计学的产生和发展我国统计学的发展情况解放前,我国统计主要照搬数理统计学的一套。统计理论与统计实践完全脱节。解放后,照搬了苏联社会经济统计学,批判了数理统计学,这对我国统计体系的建立和社会主义建设起到了一定的促进作用,但有些偏激。党的十一届三中全会后,在改革开放中,我国统计学有了较大发展,百家争鸣,百花齐放,各种观点也纷纷活跃起来。第一章绪论第二节统计学的性质和特点统计一词的三种含义统计工作对社会经济现象数量方面进行搜集、整理和分析工作的总称,它是一种社会调查研究活动。例如:要了解我国人口情况,统计部门要完成下列工作:设计调查项目——编制调查表——派调查人员逐户调查——对调查结果进行整理、分析——最后得出反映我国人口基本情况的各种统计指标。统计资料它是统计实践活动过程中所取得的各项数字资料以及与之相关的其它实际资料的总称。各商业企业某月销售额资料(单位:万元)10,60,40,80,130,7050,98,200……2009年全年国内生产总值335353亿元,比上年增长8.7%统计学是关于认识客观现象总体数量特征和数量关系的科学哪些是我们所需的资料?应当怎样搜集所需的资料?对搜集到的数字资料应当进行怎样整理才能反映资料的真实分布特征?用什么样的方法对数字资料进行深入分析才能反映现象发展变化的规律性?解决一切问题所用的方法均由统计学提供三种涵义的关系统计工作与统计资料是统计实践活动与统计成果的关系统计工作与统计学是统计实践活动与统计理论的关系统计学统计一词的三种含义第一章绪论统计学的研究对