统计学樊欢欢CPI——2017年7月CPI同比上涨1.4%继续维持“1时代”据国家统计局官网消息,2017年7月份,全国居民消费价格同比上涨1.4%。其中,城市上涨1.5%,农村上涨1.0%;食品价格下降1.1%,非食品价格上涨2.0%;消费品价格上涨0.5%,服务价格上涨2.9%。7月份,全国居民消费价格环比上涨0.1%。其中,城市上涨0.1%,农村持平;食品价格下降0.1%,非食品价格上涨0.2%;消费品价格下降0.2%,服务价格上涨0.6%。——2017年08月09日09:37中国网财经感悟统计(一)——经济发展、综合实力房屋销售价格——2018年1月份商品住宅销售价格稳中有降70个大中城市中一线城市新建商品住宅销售价格环比由上月持平转为下降,二手住宅销售价格降幅比上月扩大0.2个百分点;二线城市新建商品住宅和二手住宅销售价格环比涨幅分别比上月回落0.3和0.2个百分点;三线城市环比涨幅分别回落0.1和0.2个百分点。2017年国内生产总值增长6.9%刚刚过去的2017年,经济社会发展主要目标任务全面完成并好于预期。国内生产总值增长6.9%,居民收入增长7.3%,增速均比上年有所加快;城镇新增就业1351万人,失业率为多年来最低;工业增速回升,企业利润增长21%;财政收入增长7.4%,扭转了增速放缓态势;进出口增长14.2%,实际使用外资1363亿美元、创历史新高。今年国内生产总值增长目标6.5%左右感悟统计(二)——撑死的人比饿死的人多据统计,肥胖并发脑血栓和心衰的发病率比正常体重者高一倍,患冠心病者多2~5倍,高血压发病率多2~6倍,合并糖尿病者高4倍,合并胆石症者高4~6倍。美国生命保险协会的统计调查结果显示,超重25%和35%的肥胖症者的死亡率比正常人高28%和50%,表明肥胖程度和死亡率呈正相关。美国每年因肥胖伴有冠心病、高血压、高血脂、糖尿病和脑血管意外而死亡的人数大约有30万人。众所周知,《红楼梦》一书共120回,一般认为前80回为曹雪芹所写,后40回为高鹗所续,长期以来对这个问题一直有争议。能否从数学上论证?1985、1986复旦大学李贤平教授带领他的学生作了这项工作,他们将120回看成是120个样本,然后确定与情节无关的虚词作为变量,计算出每一回里变量出现的次数,用多元分析中的聚类分析法进行分类,将120回分成两类,前80回为一类,后40回为一类,证实了不是出自同一人的手笔。感悟统计(三)——《红楼梦》后40回出自谁的手笔?之后,又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,做了类似计算,结果证实了用词手法完全相同,断定为曹雪芹一人手笔。而后40回是否为高鹗写的呢?论证结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。举例4.啤酒和尿布的故事全球最大的零售商沃尔玛通过分析顾客购物的数据发现,很多周末购买尿布的顾客同时也购买啤酒。经过深入观察和研究发现,美国家庭买尿布的多是爸爸。年轻的父亲们下班后要到超市买尿布,同时“顺手牵羊”带走啤酒,好在周末看棒球赛的同时过把酒瘾。后来沃尔玛就把尿布和啤酒摆放得很近,从而双双促进了尿布和啤酒的销量。这个故事工人是数据挖掘datamining的经典范例。统计学的幽默有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下4个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上写:“擦眼泪11次;系鞋带15次;给每个孩子吹玩具气球各5次,每个气球的平均寿命10秒钟;警告孩子不要横穿马路26次;孩子坚持要穿过马路26次;我还想再过这样的星期六0次。”关于统计的一些论断:1、“没有统计,其它科学可以存在,但是很渺小”2、一个医生说:“医学若无统计就不是科学”3、台湾辅仁大学一教授说“统计即生活,统计即人生”4、一位资深的海外统计学家说:统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了经济学家、教育家、人口学家原北京大学校长马寅初学者不能离开统计而研究政治家不能离开统计而施政企业家不能离开统计而执业为什么?当今社会(时代)被称为信息社会.信息社会的主要特征:信息在各个领域的重要性;信息数量庞大;信息处理和传输迅速…统计在信息社会中的重要作用:提供搜集信息的理论方法;提供加工处理信息的理论方法.11月11日凌晨0点03分,阿里巴巴天猫交易额突破第一个100亿元;11月11日上午9点04秒,阿里巴巴天猫交易额冲破1000亿元,速度远远超过去年;2016年天猫达到1000亿元交易额用了接近19个小时,比今年多了10个小时。统计是以数据为食物的动物统计的本业是消化数据,并产生有营养的结果。Data——Statistics——Information第一章导论统计已经渗透到社会经济活动和科学研究的方方面面,统计无处不在。那么究竟何为统计?统计是如何开展研究的?作为一门科学的统计学与其他学科有何区别与联系?这些正是本章所要介绍的主要内容。第一节统计的产生与发展一、统计的涵义英语中的统计(statistics)源于(state,stato,statisti)历史上,是用来记载和描述一国重要政治经济事项的方法。汉语中,是对大量事物额数量进行的汇总和计数。现在,统计的不同涵义即统计工作、统计资料和统计学“我是做统计的”——统计工作;“据统计”——统计资料;“我是讲统计的”——统计学;统计工作(统计实践活动):是人们对客观事物的数据资料进行收集、整理、分析的工作活动的总称。例如:要了解我国人口情况,统计部门要完成下列工作:设计调查项目——编制调查表——派调查人员逐户调查——对调查结果进行整理、分析——最后得出反映我国人口基本情况的各种统计指标;又如:全国人口普查、农业普查、工业普查、东湖水质的调查、学生平均成绩的计算等;统计资料:是统计工作的成果,包括各种统计报表、统计图形及文字资料等。例如:统计年鉴、每月的财务报表、报纸的数字图表等;又如:2016年7月份,全国居民消费价格总水平同比上涨2.3%。其中,城市上涨2.3%,农村上涨2.1%;食品价格上涨3.6%,非食品价格上涨1.6%;消费品价格上涨2.2%,服务价格上涨2.5%。统计学:是一门调查、整理和分析统计数据的方法论科学,其目的是探索统计数据的内在数量规律性,以达到对客观事物的科学认识。二、统计实践活动的产生和发展统计作为一种社会实践活动,已有四五千年的历史:原始社会初期的氏族、部落——安排守猎、分配实物等;古埃及修建金字塔——对全国人口、劳力和财力进行调查;奴隶社会和封建社会时期,主要是为实现赋税、扩张、征兵等需要而进行的人口、土地、财产等登记、汇总工作。17世纪后,资本主义在欧洲的萌芽和迅速发展,必须辅之于统计调查、整理、计算分析等各种手段,统计工作逐步扩展到工业、贸易、运输业、保险等其他领域。(一)古典统计学时期(17世纪中后期至18世纪中后期)政治算术学派——17世纪,英国(有统计学之实,而无统计学之名)——1676年,英国经济学家,威廉·配弟——《政治算术》,用大量的数字分析了英、法、荷等国的经济实力,开创了用统计数字进行经济学分析的先河。今天的国民经济核算体系,就源于这一学派的理论;——1662年,英国学者,约翰·格朗特——《关于死亡表的自然观察与政治观察》,分析了伦敦的人口死亡情况,成为最早的人口统计学研究。三、统计学的产生和发展记述学派(国势学派)——18世纪,德国(有统计学之名而无统计学之实)——创始人,海尔曼·康令——把国势学从法学、史学、地理学等学科中独立出来,在大学讲授“实际政治家所必需的知识”;——继承者,阿哼瓦尔——首先使用“统计学”这一术语图表学派(统计图和统计表表现和保存统计资料)——丹麦的安彻逊编纂了欧洲15个国家的比较统计表;——德国的克罗姆第一个用几何图形来表现统计资料。(二)近代统计学时期(18世纪末至19世纪末)数理统计学派——随机现象的推断统计代表人物:比利时,凯特勒——在《社会物理学》中,将概率论引入统计学,在生物统计和天文学研究中成功运用了二项分布和正态分布方法;社会统计学派——统计学是一门社会科学——代表人物:梅尔、恩格尔(三)现代统计学的发展时期(20世纪初至今)主要成果:在随机抽样基础上建立了推断统计学。数理统计学的发展特点与趋势:(1)数学方法的广泛应用。(2)边缘统计学的形成。(3)借助计算机手段,统计学的应用日益广泛和深入。第二节统计学的分科本节导航:从统计方法的构成角度分从统计方法的研究和应用角度分一、从统计方法的构成角度分(一)描述统计学(descriptivestatistics)研究如何取得、整理和表现数据资料,进而通过综合、概括与分析反映客观现象的数量特征。包括数据的收集与整理、数据的显示方法、数据分布特征的描述与分析方法等。(二)推断统计学(inferentialstatistics)研究如何根据样本数据去推断总体数量特征的方法。包括抽样估计、假设检验、方差分析及相关和回归分析等。目的描述数据特征找出数据的基本规律内容确定要研究的数量特征设计统计指标(说明这些数量特征的)搜集数据整理数据计算并显示指标数据描述统计学目的对总体特征作出推断。内容参数估计假设检验相关回归分析样本总体推断统计学描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据二、从统计方法的研究和应用角度分(一)理论统计学(theoreticalstatistics)利用数学原理研究统计学的一般理论和方法的统计学。概率论与数理统计(二)应用统计学(appliedstatistics)*研究如何应用统计方法解决实际问题,大多是以数理统计为基础形成的边缘学科。如自然科学领域的生物统计学、社会科学领域的计量经济学、管理统计学等。统计的应用领域经济学管理学医学工程学社会学…统计学本教材的篇章结构第一章导论第一篇统计基础篇第二章统计数据的调查与收集第二篇描述统计篇动态数据描述法第七章抽样与抽样估计第三篇推断统计篇第八章假设检验与方差分析第九章相关与回归分析第四篇统计常识篇——第十章第三章统计数据的整理第四章数据分布特征的描述第五章时间序列分析第六章统计指数表格与图形法——静态数据描述法——常用国民经济核算指标与分析第三节统计学的几个基本概念本节导航:总体和总体单位;标志和标志表现;指标和指标体系;总体和样本;参数和统计量;存量和流量一、总体和总体单位总体——根据统计任务的要求,由客观存在、在同一性质基础上结合起来的许多个别事物的集合;例如:全班同学;全国所有的人口;武汉市所有的高等学校;总体单位——构成统计总体的个别事物,即个体;例如:每个同学;每个人;武汉市的每一所高校;总体个体个体个体个体总体的特点:(1)总体是根据统计任务的要求确定的,统计任务不同,总体也会变化;例如:全校学生返校情况的调查中,金融学专业既可能是总体,也可能是个体;什么时候?因此,科学地进行统计活动的前提就是准确地界定总体!(2)统计总体是客观存在的;(3)总体具有同质性、大量性、变异性;总体分类——根据其所含个体的数量是否可数来划分:有限总体,例如:班级学生数、企业数等;无限总体,例如:海洋里的鱼类资源、天上的繁星等;总体和个体的关系:是相对的,不是固定不变的,可能会随着研究目的和任务的不同而转变;例如:若调查文理学院各个专业的学生返校情况,则金融学专业是总体单位;若调查金融学专业的学生返校情况,则金融学专业为总体;二、标志和标志表现标志——总体单位的特征或属性的名称;例如:姓名、性别、年龄、民族、学历等;标志表现——标志名称之后总体单位的具体属性或数值;例如:对应的标志表现是张三、男、22、汉、本科等;标志的分类:按表现形式分——数量标志+品质标