统计基础知识及法律法规四川省统计局第一篇统计基础知识一、统计基本概念统计的涵义11、统计的涵义统计:对社会经济现象数量方面的调查研究,主要从数量方面来描述社会经济现象。曾有一位资深的海外统计学家说过:“统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”漫话统计曾有一位资深的海外统计学家说过:“统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”漫话统计曾有一位资深的海外统计学家说过:“统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”漫话统计1.统计的涵义通俗地理解,统计就是一种帮助人们正确认识事物、分析事物的工具1、统计的涵义统计调查统计整理统计分析统计设计统计活动、统计资料、统计学统计活动(统计工作):是对所研究现象的数量特征进行收集、整理和分析的调查研究活动。一次完整的统计活动包括:统计资料:是统计活动过程的成果,包括数据资料和统计分析资料。对统计资料的要求:准确、及时、全面、系统、统一。统计学:是有关数据的学科,是一门收集、整理和分析统计数据的方法论科学。72.环境统计的基本概念环境统计工作环境统计资料环境统计学是指为了取得和提供统计资料而进行的各项工作。是环境统计工作的成果,包括环境统计数字和环境统计分析报告两个方面的内容是数理统计理论与方法在环境保护实践和环境科学研究中的应用,它是研究和阐述环境统计工作规律和方法的科学。漫话统计统计与其他学科的区别如何看待热议的统计话题一、统计基本概念统计的基本概念22、统计的基本概念统计总体和总体单位(1)统计标志和标志表现(2)变异和变量(3)统计指标和指标体系(4)2、统计的基本概念(1)统计总体和总体单位统计总体:是由客观存在的某些性质上相同的许多个体所组成的整体,简称总体。总体单位:组成统计总体的各个个体。例如:以眉山市东坡区工业企业污染排放及处理利用情况环年基(环年基1_1)表为例,总体:眉山市东坡区所有工业企业,总体单位:每一个工业企业;四川省民营企业职工生活情况:总体:四川省所有民营企业的职工,总体单位:每一个民营企业的职工。总体的特征:同质性、大量性、差异性总体的类型:有限总体、无限总体(2)统计标志和标志表现2、统计的基本概念统计标志:是说明总体单位的特征或属性的名称。标志表现:是标志特征在各个单位的具体表现。例如:反映每个企业的特征:企业法人代码、企业地址、登记注册类型、所属行业、排水去向类型、受纳水体名称、排入的污水处理厂名称、工业总产值、“三废”综合利用产品产值、企业专职环保人员数、工业用水量、工业煤炭消费量、工业锅炉数、二氧化硫排放达标的工业炉窑数、产品产量、主要有毒有害原辅材料、废水污染物在线监测仪器套数、税金等。反映每个企业职工的特征:性别、年龄、政治面貌、工种、技术职称、文化程度、月工资额等。标志的种类:按标志是否能用数量表示分为:品质标志和数量标志。品质标志:说明总体单位属性特征的名称,用文字描述。数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。按标志表现是否相同分为:不变标志和可变标志。不变标志:指某个标志在所有总体单位的具体表现都相同。可变标志:指某个标志在各总体单位的具体表现不相同。2、统计的基本概念2、统计的基本概念(3)变异和变量变异:是有差别的意思,分为质的差异和量的差异。例如:民营企业职工:性别标志有男女之分;年龄标志有数量的大小之差,前者是属性变异,后者是数量变异。变量:是可变的数量标志,具体值叫变量值。例如:民营企业职工:年龄、月工资额等。变量有连续变量和离散变量。连续变量:其数值连续不断,要通过测量和计算取得数据。例如:人的身高、体重、企业产值、利润等。离散变量:其数值以整数断开,要通过计数取得数据。例如:企业个数、职工人数等。2、统计的基本概念(4)统计指标和统计指标体系统计指标:是反映总体数量特征的基本概念和具体数值。注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数例如:2005年某民营企业完成利税总额为10亿元。(指标名称)(指标数值)从实际工作讲:常常把指标名称直接叫做统计指标。2、统计的基本概念统计指标的种类:按指标反映的内容分数量指标:反映客观现象总规模、总水平的统计指标,一般用绝对数表示。例如:民营企业报表中的企业个数、职工人数、产品产量等。质量指标:是反映客观现象相对水平或工作质量好坏的统计指标,一般用相对数或平均数表示。例如:民营企业经济效益:增加值率、利润率、劳动生产率等。按指标计量单位分实物指标:是以实物计量单位计量的统计指标。计量单位有:自然单位、度量衡单位、双重单位、复合单位。价值指标:是以货币单位计量的指标。例如:民营企业统计中:增加值、利润、税金等。2、统计的基本概念按指标的表现形式分总量指标:反映总体现象规模的统计指标,一般用绝对数表示。例如:民营企业报表中的企业个数、职工人数、产品产量等。相对指标:是两个相互联系的总量指标之比,一般用相对数表示。计量单位:无名数、有名数。主要类型:结构相对数、比例相对数、比较相对数、动态相对数、强度相对数、计划完成程度相对数。例如:民营企业:职工文化结构、各部门发展的比例关系、单位能源消耗量、利润增长速度、增加值年计划完成程度等。平均指标:是说明总体一般水平的指标,一般用平均数表示。例如:民营企业报表中:从业人员年平均人数。2、统计的基本概念时点指标:是说明某一统计对象在一定时刻状态上的总量。例如:年底职工人数、企业个数、产品库存量等。按指标反映时间标准分时期指标:是说明某一统计对象在一段时期内某种标志值积累的的总量。例如:工业总产值、增加值、营业收入、利润等。观察指标按指标用途分考核指标按指标的报告次序和准确性分预计指标终期指标统计指标体系:具有内在联系的一系列统计指标所构成的整体。统计的涵义二、统计调查方法统计调查方案24统计调查概念和分类1统计的涵义统计调查的组织方式31、统计调查概念和分类概念:是按照统计设计的要求,采用最合适的方法,有计划、有组织收集真实、完整的原始资料的工作过程。作用:(1)统计调查是人们认识社会的基本方式;(2)统计调查是统计工作中的基础环节。要求:准确、及时、全面统计调查按调查对象范围分按调查的组织方式分按调查时间是否连续分按收集资料的方式分全面调查非全面调查统计报表专门调查经常性调查一次性调查直接观察法访问法报告法统计调查种类2、统计调查方案一份完整的调查方案包括:(1)确定调查任务与目的注意:抓住当前最迫切需要解决的问题;把需要与可能相结合(2)确定调查对象、调查单位、报告单位调查对象:调查研究的总体或调查范围。调查单位:所要调查的具体单位。报告单位:负责向统计调查机关提交调查资料的单位。注意:调查单位和填报单位有时一致,有时不一致。2、统计调查方案一份完整的调查方案包括:(3)调查项目和调查表调查项目:调查的具体内容。调查表:把调查项目按一定逻辑顺序排列形成的表格。调查表的种类单一表:一个调查单位一览表:两个以上调查单位调查表的构成要素表头表体表脚2、统计调查方案一份完整的调查方案包括:(4)调查时间标准和空间标准调查标准时间:调查资料所属时间。调查空间标准:调查单位应在什么地方接受调查。(5)调查组织为确保实施调查的具体工作计划。包括:调查组织领导、调查机构的设置、人员的选调和培训、经费来源、工作步骤及其善后处理等。3、统计调查的组织方式统计报表:是以原始记录为依据,按统一的表格形式、统一的报送时间和程序、自下而上地向各级领导部门提供资料的一种调查方式。统计报表按制度内容和实施范围分按报送周期分按填报单位分定期报表年报基层报表综合报表国家统计报表部门统计报表地方统计报表3、统计调查的组织方式普查:是专门组织的一次性全面调查。特点:通常是一次性的或周期性的;有统一规定的标准时点;规范化程度较高。普查方式:一是成立专门的普查机构进行调查;二是根据企、事业单位的原始资料和报表资料进行调查。注意:普查需要花费大量人、财、物力,故一般不易经常进行,只有党和国家制订重大方针政策时方可使用。重点调查:是所要调查的总体中选择一部分重点单位进行的非全面调查。3、统计调查的组织方式特点:调查单位少;调查对象的标志值比较集中于某些单位的场合。注意:重点单位的选择是客观的。只适用于客观存在着重点单位的情况。3、统计调查的组织方式典型调查:是在调查对象中有意识地选出个别或少数有代表性的典型单位,进行深入、周密的非全面调查。指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量。注意:典型单位的选择是主观的。根据研究目的可选择好、中、差单位作为典型。种类:解剖麻雀、划类选典、“抓两头”。作用:可以对现象进行深入细致的分析;可以研究新生事物;在一定条件下可以验证全面调查的正确性;在一定条件下可以推断总体的数量特征。3、统计调查的组织方式特点:一定要遵守随机原则;利用样本数据推算总体数量特征;必然产生抽样误差。注意:抽样调查是最科学、最完善的一种非全面调查方法。抽样调查:是按照随机原则,从研究总体中抽取部分单位进行观察,用其观察结果,从数量上推算总体资料的一种非全面调查。指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。304.常用统计方法分布密度函数随机变量和密度函数连续型随机变量通常用分布密度函数表示。分布密度函数的定义为:连续型随机变量X的值落在单位区间内的概率,记作f(x)31可以证明随机变量的概率密度函数f(x)有如下性质(Ⅰ)(Ⅱ)(Ⅲ))(0)(xxf1)(dxxf21)()(21xxdxxfxXxP分布密度函数4.常用统计方法32【例】分布密度函数在环境统计中的应用以煤炭开采和洗选行业COD单位去除成本(去除成本=治理费用/污染物去除量)为例,首先需要我们根据基表数据计算出各企业的COD去除成本,为保证数据可比性,最好分行业计算。然后对数据进行排序(从大到小或从小到大均可),取对数值绘图(见右图)。334.常用统计方法平均数和方差平均指标又称统计平均数,是用以反映现象的一般水平,同时也反映了现象的集中趋势。平均数有多种计算方法,分为:数值平均数(算术平均数、几何平均数和调和平均数)位置平均数(众数、中位数)34算术平均数(arithmeticmean)算术平均数简称均值,它是数据集中趋势的最主要测度值,是环境统计中最常用的一种平均值,较适用于正态分布资料统计。总体的均值用符号表示,样本均值用符号表示。x35如果数据是未经整理的原始数据,可用下面的公式直接计算:(1-1)或(1-2)NXNXXXniiN121nxnxxxxniin121算术平均数(均值)36如果数据中相同观测值较多或者是分过组的频数表资料,可用下面公式做近似计算:(1-3)式中:xk为各组观测值或组中值(组中值是本组下限与相邻较大组段的下限相加除以2;fi表示第i组观测值的个数;k表示组数。kiiniiikkkffxfffxfxfxfx11212211算术平均数(均值)37【例3】某市区大气中SO2浓度见下表,计算其平均浓度。SO2浓度分组(mg/m3)组中值()人数()0.42----0.460.46----0.500.50----0.540.54----0.580.58----0.620.440.480.520.560.60359351.322.404.681.683.00合计——2513.08iifxifkx)/(52.02508.13311212211mmgffxfffxfxfxfxkiiniiikkk解:38几何平均数(geometricmean,G)几何平均数也叫倍数均数,当观察值相差较大甚至成倍数关系时,如用算术均值表