管中窥豹——对我国统计数据质量评估的定量研究初探西南财经大学王婷婷、张媛、邓瑞目录:一、研究背景及思路.......................................................................................................................21.1研究背景与意义.................................................................................................................21.2研究思路与方法.................................................................................................................3二、统计数据质量理论概述...........................................................................................................32.1统计数据的内容质量........................................................................................................32.2统计数据的表述质量........................................................................................................42.3统计数据质量性质之间的相互关系................................................................................5三、我国统计数据质量实证分析...................................................................................................53.1基于GDP与能源消耗指标的协调性分析.......................................................................53.1.1样本变量的定义.....................................................................................................53.1.2GDP与能源消耗指标的协调性分析.....................................................................63.2GDP与能源消耗指标中异常值的检测..........................................................................123.2.1异常值检验的理论基础.......................................................................................123.2.2对GDP与能源消耗指标中异常值检测.............................................................213.3基于各省市GDP与全国GDP的数据质量分析...........................................................213.3.12009年各省市GDP与全国GDP的异常值检测...............................................213.3.1.1对2009年各省市GDP和全国GDP的描述性分析..........................213.3.1.2箱线图法检测异常数据—基于截面数据................................................213.3.1.3主成分分析法检测异常值—基于时间序列数据....................................23四、提高我国统计数据质量的政策建议.....................................................................................274.1改革统计管理体制..................................................................................................274.2完善干部考核机制..................................................................................................284.3统计数据质量实行责任追究制..............................................................................281一、研究背景及思路1.1研究背景与意义统计数据作为公共产品,其质量是统计工作的生命。随着统计信息对我国社会主义市场经济管理作用的增强,社会各界对统计数据质量给予更多的关注,提出了更高的要求。关于我国统计数据质量问题,在以前、现在乃至将来都是社会各界议论统计工作的中心话题。尤其是我国加入WTO后,经济逐步与世界接轨的今天,社会各界对统计信息的需求量越来越大。对统计信息的要求越来越高。统计信息质量的高低直接影响和决定着统计信息的有用性及统计信息价值的大小。若统计数据质量不高,不仅会影响正确的决策,更会影响国家的声誉,因此,努力提高统计数据的质量,实现统计信息的准确、有效、全面、快捷地传递,对国家、部门进行科学的决策有重大意义。温家宝总理指出,统计工作是国家实行科学决策和管理的一项重要基础工作,统计信息是认识国情、研究问题、制定政策的重要依据。各级统计部门和广大统计工作者,要按照“快、精、准”的要求,努力提高统计数据的质量,为各级领导机关提供及时准确的决策依据,为社会各方面研究分析问题提供翔实的数据信息。改革开放以来,我国创造了国内生产总值(即GDP)年均增长超过8%的世界奇迹,2007年更是达到了11.4%,甚至是受到全球金融危机冲击的2008年也仍为9%。GDP指标作为一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和提供劳务的市场价值的总值,因此是国外国家衡量我国经济增长的主要参考指标,再加上我国与世界接轨进程的逐步加快,我国GDP数据的质量问题受到了世界各国的广泛关注。然而,我国对统计数据质量的研究还比较薄弱,对统计数据总体质量的检查,主要还是采用人工审核的办法从定性的角度进行评估,缺乏能检查和审核统计数据准确性和整体优度的定量方法和依据;对统计数据中异常点的识别,也还是依据数据间的逻辑平衡关系进行检查,缺乏能对非逻辑平衡性异常点进行识别的定量方法。迄今为止,除了统计数据质量的定性研究成果比较多见外,个别学者还从数学分布角度研究数据异常点的识别。但是,关于统计数据质量的定量研究成果还是比较少见。为了更好地满足社会经济发展过程中社会各界对统计数据的需求,政府统计数据质量的定量二级检验为了使我国统计进一步与国际接轨,增强统计数据的真实性和国际可比性,有必要对我国统计数据质量的定量检验进行系统深入的研究。为了使我国GDP数据质量得到提高,我国政府部门及众多专家学者在我国GDP数据质量理论、数据质量管理及评价等方面都做出了大量的研究。在数据质量理论方面的研究及建议已经比较健全了,但与国际理论标准相比还具有一定的时滞性,且对数据质量的管理及评价方面大部分都仅停留在定性分析的角度,大都也只是考虑到数据的准确性方面,对其他影响质量的因素没有加以考虑。因此本文通过定性方面对统计数据质量特征的描述从从各个角度对我国统计数据质量进行分析,把众多的相关因素综合起来考察我国GDP数据的质量具有重大的现实意义,有利于我国政府进一步对现行理论体系进行调整,对我国统计数据质量评价标准的制定具有借鉴意义。其次,本文运用多组数据多种方法定量分析的结果对政府部门做出最后决策具有一定的参考价值,最后对于现阶段出现的问题给出了针对性的政策建议。21.2研究思路与方法本文的研究思路是:首先对现有的我国统计数据质量现状进行梳理和分析,对我国统计数据质量管理方面的成就和存在的问题进行深入剖析,试图找出其出现问题的原因并找到改进的入手之处;接下来是对我国统计数据质量的实证研究,在基于我国各年度GDP与能源消耗的数据指标的协调性进行验证,并检测其中出现的异常值。为了丰富研究内容、加强研究结论的说服性,本文又采用近30年的各省市GDP进行聚类分析与异常值检测,目的是为了发现数据是否有异常情况,以判定数据质量的高低;本文不仅从宏观的GDP来研究数据质量,也从微观方面对统计数据质量进行了分析,主要是采用与成都市房地产发展紧密相关的一组指标,划分出成都市房地产发展状况预警的范围,再与实际相联系,来判断微观经济数据的质量高低程度。本文运用理论分析与实证分析相结合、定性分析与定量分析相结合的方法对我国宏观和微观的数据质量进行评估,运用SPSS软件进行分析。所涉及的研究方法主要有:描述性统计方法、协调性检验、异常值检验、时间序列方法、聚类分析、主成分分析等。二、统计数据质量理论概述传统的统计数据质量仅仅指其准确性,通常用统计估计中的误差来衡量。但“质量”的概念被拓宽以后,“统计数据质量”的概念也有必要拓宽。从ISO关于质量的定义出发,把用户的需求作为衡量统计数据质量高低的首要因素,那么可以把统计数据质量定义为“影响统计数据满足用户需求的特征”。但由于用户多种多样,且其对统计数据的使用目标也不一样,从而对统计数据质量的要求也不一样,因此,上述定义还不是一个具有可操作性的概念。但从这个定义出发,充分考虑不同用户的需求,可以提出一个系统而全面的统计数据质量概念(不仅政府统计数据质量的定量二级检验仅指准确性)。统计数据质量是一个具有丰富内涵的综合性概念。具体来说,它包括统计数据的内容质量、表述质量及约束标准这三大方面。2.1统计数据的内容质量统计数据的内容质量是统计数据最基本的特征,它包括准确性、相关性与及时性。一旦缺少了其中任何一个,统计数据就失去了转化为信息的性质和基本作用。因此,这三个特征也可称为统计数据质量的主要特征。(1)准确性准确性指观测值或估计值与未知的真值之间的距离(接近程度),通常用统计误差来衡量。它是统计数据质量的基础和核心内容,也是传统的“统计数据质量”概念所考虑的主要问题。一般来讲,误差分为系统误差和随机误差两部分,有时也用引起不准确性的主要潜在原因(如抽样误差、无回答误差等)来分类描述。完全准确的测量经常受到成本的限制,有时甚至是不可能的。所以关键的是误差是否已降低到用户可以接受的地步。(2)相关性相关性是指统计工作所生产的统计数据是否是用户感兴趣的统计数据。统计数据的相关3性反映了它满足用户需求的程度,它与所提供的可利用数据是否关注了对用户来说最重要的主题有关。由于对相关性的评价是主观的,会随用户需求目标的改变而改变,所以统计机构所要做的是平衡不同用户的互相矛盾的需求目标,在给定的资源条件限制下,尽可能的满足大部分用户的大部分需求。(3)及时性与用户需求相关的准确的统计数据如果没有在用户做出决策之前传递给用户,那