感悟统计为什么要学统计?统计能够做些什么?......Whenyouanalyzeanytopic,youareinvolvedinstatistics.•撑死的人比饿死的人多!据统计,肥胖并发脑血栓和心衰的发病率比正常体重者高一倍,患冠心病者多2~5倍,高血压发病率多2~6倍,合并糖尿病者高4倍,合并胆石症者高4~6倍。美国生命保险协会的统计调查结果显示,超重25%和35%的肥胖症者的死亡率比正常人高28%和50%,表明肥胖程度和死亡率呈正相关。美国每年因肥胖伴有冠心病、高血压、高血脂、糖尿病和脑血管意外而死亡的人数大约有30万人。当你告诉别人你已经交上一个新朋友时,他们决不会问你任何有关基本事宜的问题。他们不会对你说:“他的声音像谁?最喜欢什么游戏?他收集蝴蝶吗?”,取而代之,他们会问:“他有多大年龄?有几个兄弟?体重有多少?他的父亲挣多少钱?”仅仅从这些数字,他们才认为已经了解了有关他的一切。身高?体重?钱?吸烟导致肺癌,抗生素治疗胃溃疡,锻炼有助于预防心脏病……我们怎么知道这些?因为科学家有统计数据证明。市场调查和分析人才依托自己的市场学知识,通过自己掌握的调查工具和手段,对所关注的行业进行调查,并依据调查的结果进行分析。整个工作过程涵盖了统计学、经济学等多方面的知识。案例1:起名为“波澜”恰当吗案例2:后40回出自谁的手笔感悟统计中美纯水有限公司欲为其新推出的一种纯水产品起一个合适的名字,为此专门委托了当地的策划咨询公司,取了一个名字“波澜”。一个好的名字至少应该满足两个条件:(1)会使消费者联想到正确的产品“纯水”;(2)会使消费者产生与正确产品密切相关的联想,如“纯净”、“清爽”等。后来中美纯水有限公司委托调查统计研究所,进行了一次全面的市场研究,在调查中还包括简单的名称测试。调查的代码和含义如下:代码含义代码含义代码含义Name1玉泉Product1雪糕Feel1清爽Name2雪源Product2纯水Feel2甘甜Name3春溪Product3碳酸饮料Feel3欢快Name4期望Product4果汁饮料Feel4纯净Name5波澜Product5保健食品Feel5安闲Name6天山绿Product6空调Feel6个性Name7中美纯Product7洗衣机Feel7兴奋Name8雪浪花Product8毛毯Feel8高档由直观图可以看出,“波澜”(Name5)与“洗衣机”(Product7)产品相联系,引起的感觉是“兴奋”,因此“波澜”不是合适的纯净水品牌名称。中美纯水公司的产品是“纯水”,如果想要使该名称给人们一种“纯净”的感觉,那么“中美纯”将是最好的商品名称;如果想要使该名称给人们一种“清爽”的感觉,那么“玉泉”将是最好的商品名称。中美纯水公司接受了调查统计研究所的建议,没有用“波澜”这个名称,而用了“中美纯”作为品牌的名称。实践证明,它的确是一个成功的品牌名称。众所周知,《红楼梦》一书共120回,一般认为前80回为曹雪芹所写,后40回为高鹗所续,长期以来对这个问题一直有争议。80年代中期,一位教授带领他的学生作了这项有意义的工作。后40回出自谁的手笔他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量,用统计的方法聚类,果然将120回分成两类即前80回为一类,后40回为一类。之后又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,结果证实了用词手法完全相同,断定为曹雪芹一人手笔,而后40回是否为高鹗写的呢?结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,使红学界大为赞叹。第一节数据信息和统计学第二节数据信息处理的方法第三节计算机软件在统计中的应用第一节数据信息和统计学据统计,在某市搞统计的人中,有30%的人没学过统计。一、统计的含义统计工作统计资料统计科学统计工作即统计实践活动,是人们为了说明所研究对象的某种数量特征和数量规律性,而对该现象的数据进行收集、整理与分析的活动。(统计局)统计资料即统计数据,是通过统计工作所获得的能够说明现象总体某种特征的数据,是统计实践活动的成果。(年鉴、杂志、网站)国家统计局主办的一门研究收集数据、表现数据、分析数据、解释数据,从而认识数量规律的方法论科学。统计科学即统计学Statisticisthescienceforlearningfromdata.《不列颠百科全书》的定义:统计学是:“关于收集和分析数据的科学与艺术(art)”–数据有随机性(带偶然误差)–应用时有人的判断和主动性(“艺术”),不是死套公式。二、统计学的性质及其特点1.数量性统计总是用数字作为语言来表述事实。–在质与量的辨证统一中研究;–不同于纯数量的研究。不是纯数学2.大量性研究大量个别事物构成的现象整体的数据–现象的数量规律性只有在总体层面上才能体现出来;–研究目的在于说明总体特征,但常常从观察个体数量特征入手。3.差异性•客观事物的差异是普遍存在的。例如商业职工的工龄、工资各不相同,各个商业企业的效益也有差异。正因为这些个体之间存在着差异,才需要综合大量个体的差异,以掌握全体的综合特征。•差异可以表现为数量方面(如工龄、工资、产量、销售额等),也可以表现为非数量方面(如性别、民族、所有制等)。非数量方面的差异,只有将之转化为数量方面的差异,才能成为统计研究的对象。4.具体性•统计学研究的数量方面是指客观事物的具体的数量方面。统计的数据都是具体的,反映一定研究范围的数字。这与数学不同。数学完全撇开研究对象的具体内容和质的特征而研究抽象的数量关系。统计是在一定质的规定下研究事物的数量方面,它需要在质和量的辩证统一中进行研究。因此必须对事物质的规定性有了正确的认识以后,才能统计它们的数量。应用统计学推断统计学描述统计学理论统计学统计学三、统计学的类型描述统计:研究如何对客观现象的数量特征进行计量、观察、概括和表述。用表和图表示,计算特征量(如平均值)等。推断统计(统计推断)用数据所提供信息,对数据所来自的总体的性质作推断。推断会有错误、误差,用概率论的术语和方法来描述和论证。怎样尽可能减少推断的误差,是统计推断的中心问题。推断统计•内容参数估计假设检验样本总体•目的——对总体特征作出推断描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据图1-1统计学探索现象数量规律性的过程数理统计学统计学应用技术统计学社会经济统计学三、统计学的类型本课程的性质•应用统计是一门运用统计学的原理和方法,研究区域化发展、事业管理等学科中有关数据收集、整理、分析的科学。在人类迈进21世纪知识经济时代的今天,面对日益增多的信息需求量和处理量,学习和掌握数据处理和分析技术的统计方法十分重要。该课程能解决的问题•通过本课程的学习,能够掌握统计数据的收集、整理、特征数的描述统计方法,以及公共事业管理中常用的统计分析方法,掌握定性和定量有机结合的技能,为今后的学习、科学研究和管理工作的开展奠定基础。•教学时数:40学时(其中实验4学时)教学内容•第二章数据搜集与整理•第三章数据的汇总•第四章统计比率与统计指数•第九章时间数列一、总体与总体单位(一)总体与总体单位概念总体是在一定的研究目的下,所要研究事物的全体,它是由客观存在的、具有某种共同性质的众多个别事物构成的整体。——调查对象总体单位是构成总体的个别事物。总体单位是所要研究具体问题的承担者。——调查单位。第二节数据信息处理的方法总体单位构成统计总体的个体单位称总体单位。要了解200名从业人员的劳动报酬收入情况,总体单位是?A、200名从业人员B、200名从业人员的工资C、每名从业人员D、每名从业人员的工资某市高校的科研所进行调查,总体?总体单位?A、某市所有的高校B、某一高校研究所C、某一高等学校D、某市所有高等学校研究所第一章导论同质性大量性差异性(二)总体的特点两层含义:①统计学研究的是大量现象的数量特征,总体包含了大量现象;②统计单位具有某一共同性质,但其他的性质、特征是不同的,便于在差异中寻找规律。第一章总论大学学生月可支配收入及消费支出调查列出:总体,总体单位分别列出三个你认为最重要的调查项目性别月可支配收入月消费支出月食品消费家庭年收入(三)总体的分类按构成总体的总体单位是否可以计量,总体分为:有限总体和无限总体。二、样本(一)样本的概念按随机原则从总体中抽出的部分单位构成的整体。样本总体(二)样本与总体的关系一个样本单位是一个总体单位;样本具有总体的特征(带来总体的信息);总体具有唯一性,样本具有随机性。三、标志与统计指标(一)标志标志是说明总体单位特征的概念或名称,所以也称为单位标志。在统计调查中称为调查项目或登记项目。举例•如果重庆市统计局是研究的总体,每一个职工都是一个个体,那么反映每一个职工的属性特征的性别、民族、家庭住址及反映每一个职工数量特征的年龄、身高、收入等概念就是标志。性别年龄民族宗教信仰家庭住址身高体重不变标志数量标志(一)标志1.概念:说明总体单位属性和特征的名称可变标志国籍职业受教育年限品质标志2.分类第一章导论要了解2000户养蚕专业户的生产情况,数量标志为()A、2000专业户的收入B、每一专业户的养蚕收入C、养蚕专业户的户数D、每一专业户的蚕种类型第一章导论大学毕业生薪酬调查列出:总体,总体单位分别列出三个你认为最重要的调查项目(标志)性别专业文化程度在校平均成绩家庭年收入2009年大学毕业生平均薪酬(二)变量与变异可变的数量标志和所有的统计指标称变量。1.变异概念一般将品质标志不同的具体表述,称为变异。有时也将数量标志的不同取值称为变异。常量(参数)不变的数量标志称常量或参数。变量值变量的数值表现称变量值或标志值。第一章导论2、变量概念总收入-总成本费用=企业利润总收入↓-总成本费用↓=企业利润(↑或↓)总收入↑-总成本费用↓=企业利润(↑)总收入↓-总成本费用↑=企业利润(↓)总收入↑-总成本费用↑=企业利润(↑或↓)指受确定性因素影响的变量确定性变量2.变量的种类第一章导论指受随机因素影响的变量周一上午10时~11时的股票成交量行情预期、各种消息、购买行为、资金数量、新股上市、其他…随机变量第一章导论连续型变量连续性变量的数值是连续不断的,任意两个变量值之间可以做无数种分割。人的身高、体重、产品的产量(重量、体积、面积等),产值、销售额等价值量需要使用度量工具取值身高的例子:165166●●第一章导论离散型变量离散变量的取值可以按一定次序一一列举,变量值通常用整数表示。特定范围的人口数、汽车数量、企业数量、林木株数、畜禽数量等等第一章导论.A、连续变量B、离散变量C、前者是连续变量,后者是离散变量D、前者是离散变量,后者是连续变量商业企业的职工人数、商品销售总额是()(二)统计指标1、统计指标的概念统计指标简称为指标,是反映总体数量特征的概念和具体数值,即:将标志的具体表现(变异和变量)进行登记、汇总,最后形成说明事物综合特征的各种数字资料。任何统计指标都包括指标名称、指标数值、计量单位。指标名称是总体数量特征的概念,反映指标的经济意义和包括的内容范围、时间范围和空间范围。1.统计指标概念反映社会经济现象总体数量特征的概念及其具体数值36001999年末重庆市总人口万人时间限制空间限制指标名称具体数值计量单位综合性数量性具体性构成要素:特点:第一章导论统计指标总量指标(单一计量单位)数量指标按表现形式分类按内容特征分类相对指标(无计量单位)平均指标(双重计量单位)质量指标2、统计指标的基本分类标志与指标既有区别又有联系标志是