题目政府信息公开新领域:政府数据在大数据环境下的机遇与挑战专业公共事业管理年级班级B131303学号B13130311姓名吴凌霄指导教师庄国波二O一五年十二月五日人文与社会科学学院政府信息公开新领域:开放政府数据在大数据环境下的机遇与挑战摘要:随着互联网云计算、数据挖掘等概念的兴起,当今世界已进入大数据时代。商业行为中首先得到显著应用的大数据也越来越进入普通民众的视野。行政机关在履行行政管理、公共服务职能过程中更是掌握了具有重大价值的海量信息。本文尝试研究在大数据环境下,我国政府开展大数据管理的机遇,和面临政府数据管理模式转变和政府公信力下降等挑战。关键字:大数据政府信息公开政府数据大数据催生了数据民主,大数据时代的到来改变了政府信息公开的广度、深度和速度,并为打破信息孤岛、实现信息公开的全民参与带来了机遇。政府掌握着统计、预算、就业、治安、空气质量等数据信息,成为数据和信息的主要拥有者。2007年我国颁布了《政府信息公开条例》,各级政府都按照相关要求通过政府网站、新闻发言人、行政服务中心等渠道进行了相应的政务公开,力图建设成为“阳光政府”。1.大数据1.1大数据的概念界定大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助经营决策更积极目的的资讯。1.2大数据的特点一.是数据海量化(Volume)。二.是数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。三.是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”四.是处理速度快(Velocity)。这是大数据区分于传统数据挖掘的最显著特征。在如此海量的数据面前,处理数据的效率就是主体的生命。2.政府信息公开领域中开放政府数据的概述2.1概念界定开放政府数据涉及的概念有:数据(Data)、开放(Open)、政府(Government)、政府数据(GovernmentData)、开放政府(OpenGovernment)、开放数据(OpenData)、开放政府数据(OpenGovernmentData)。这些概念之间的关系见图1[1]图1开放政府数据相关概念关系对政府数据作一个基本解释,就是指行政机关在履行职责过程中制作或者获取的,以一定形式记录、保存的数据。2.2开放政府数据意义开放政府数据是政府信息公开领域中的新发展,开放政府数据是对政府原始数据的开放,所以在政府信息公开领域的实践和制度发展完善方面提出了新的挑战开放的政府数据是一种独特的资源,是创新的重要推动力量,具有公共物品的非竞争性、非排他性,具有信息和数据的高价值并可重复利用等特性,这就决定了数据所产生的价值并不一定由资源的所有者甚至是价值的创造者所拥有,这就是为什么开放政府数据的好处远远超出其最初的目的,开放的政府数据具有广泛的用途。3.开放政府数据在大数据环境下的机遇3.1大数据丰富政府数据资源数量,改善政府数据资源质量。政府各部门利用部门职能创建海量数据库,借助数据管理解决实际问题和提供公共信息服务。历经多年并不断提升的政府数据信息化建设,使得政府领域积累的行政记录数据大规模增长。大数据首先在商业领域应用,商业领域对数据信息的高度重视,使得大规模的交易记录数据得到了妥善保留和深度挖掘。社交网络媒介的普及,使得网络媒介能够方便获取足以描述用户特征的行为数据。这些数据极大丰富了以往以统计调查为主的政府数据来源渠道。大数据所具有的规模性和多样性,从数据量的角度提升了数据分析质量。[2]当前政府统计调查方法由于时间和成本的制约,仅能获得宏观的基础数据,较少深入到企业和个人的微观层面,大数据资料来源广泛且灵活,利用全部数据进行分析,可以提升数据的针对性。与信息化和自动化相结合的大数据管理,采取自动联网记录,能够最大程度降低数据非系统误差,保证数据的准确性和真实性。大数据运用全部总体单位进行分析,能够验证调查样本数据代表性,可以运用多维度和多源头数据对同一社会管理问题的调查数据进行多角度检验,排除虚假数据。3.2催生数据民主,信息公开全民参与虽然信息公开的主体是政府,但是在大数据时代,公众和组织在互联网的网络行为将产生大量数据,人人都是数据和信息的产生者和传播者。在政府信息公开平台上,每个公民都可以得到其他公众和组织的信息申请和需求,各种类型的数据信息都可以通过大数据平台分享和传播,公民可以搜集可能与自己相关的信息并由平台进行技术处理分析,进而得到有价值的信息。在公开平台上,凡是不被保密的信息,都可以受到公众的监督,随时被提取和处理。此外,各类信息还可以被再开发再利用,创造数据信息的新价值,并实时分享。各种网络平台上依托于大数据公开的公众信息越来越多3.3依托数据技术,深化信息公开“三度”随着政府数据开放运动在全球范围内的展开,大数据将改变政府信息的公开的广度、深度和速度。[3]首先,大数据可以搜集到各行各业的信息,便于政府获取各种信息并进行分析和处理,从而扩宽了信息公开的广度,有利于实现公民的知情权;其次,大数据不仅可以分析结构化信息,还可以对诸如图表、语音、视频等非结构化信息进行分析和相关性的处理,挖掘出有价值的信息,加大了政府信息公开的深度;第三,大数据遵循“一秒定律”,可以在极短的时间里进行数据分析并产生处理结果,畅通了政府与社会公众的信息交流,加快了政府信息公开的速度。3.4打破信息孤岛,实现数据间的流动整合由于行政分割等原因,部门都将其内部信息难以外露,这种“信息孤岛”现象严重阻碍了政府信息公开的步伐。电子政务建设中数据部分的信息孤岛主要类型有:数据无法共享和交换,数据重复、信息冗余的数据孤岛;相互孤立、各自为政、信息不能共享的系统孤岛;政府业务不能通过网络系统完整、顺利的执行和处理的业务孤岛。大数据则为打破政府“信息孤岛”现象提供了机遇。首先,大数据的多级网络可以进行数据搜集和积累,政府信息在不知不觉中“流动”起来;其次,大数据的包容性理念和数据获取存储技术可以打破政府各部门间的边界,通过跨系统、跨平台、跨数据结构的数据共享平台使政府内部纵向、横向部门得以流畅协同。这提升了政府整合信息的能力,实现整合式的信息公开。3.5大数据促进政府数据管理体制机制改革,激发大数据驱动文化传统的政府数据公开模式是自上而下的,机构运作迟缓,加上数据的时效性极高,大部分人不会选择政府机构寻求所需数据。而大数据技术的广泛运用极高提高了政府数据收集分析的工作,使得数据门户网站更注重自上而下的领导和自下而上的参与相结合:只有综合利用自上而下和自下而上两种方式,才能塑造并激发最强大的大数据驱动文化。伴随日益明显的政府数据开放趋势,大数据将是政府数据透明管理的开端。大数据冲击着政府数据管理的固有体制模式[4],为政府数据管理提供了新的思路,有利于建立信息共享机制,完善信息发布职能,强化政府服务功能,实现政府数据管理体制机制改革的新飞跃。大数据的多样性与复杂性,要求政府全面开展数据管理信息化与标准化建设,以适应大数据给政府数据管理带来的冲击,促进各级政府数据管理部门全面提升其硬件与软件技术,改革统计调查方法,变革数据管理流程设计,制定数据管理标准推动大数据信息平台建设。[5]政府数据管理主要以逐级汇总的历史数据为主,数据周期长,无法即时反映经济现象的当前。3.6大数据提升政府数据资源管理技术,节约政府数据资源管理成本政府大数据不受时空限制,可重复使用,处于持续更新中,不断发展的数据资源要求数据资源管理技术升级。国际范围的政府大数据技术正不断取得突破与发展,大数据技术日趋成熟。国际上各国政府部门的大数据管理实践,能够给我国政府数据管技术提升带来启示。我国商业领域大数据应用已取得一定进展,其大数据技术可以批判性地应用于政府数据资源管理。政府大数据规模巨大,必要时可与商业交易数据和网络用户数据对接,要求政府具有与数据规模相适应的数据存储与处理能力,在硬件上提升政府数据库更新维护能力,在软件上推动相关技术创新与人才培养。大数据利用已有的行政记录、交易记录和网络信息,能够大大降低统计调查的成本,节省政府数据管理开支。同时,政府部门为掌握社会发展状况和综合管理社会资源,势必进行一定规模和频率的统计调查活动。许多数据搜集活动仅存在调查口径与统计标准的微小差别,造成统计调查的相似与重复,从而增加了被调查者的统计负担。政府整合利用大数据能够大大降被调查者的负担,使其免受重复调查影响。4.开放政府数据在大数据环境下的挑战4.1大数据冲击政府数据发布权威性电子商务和社交网络飞速发展,政府已不再是数据唯一发布者。商业领域和社交媒体积累了海量数据,对数据进行开发与挖掘,发布分析结论提供咨询服务。虽然存在一定相似性,但由于数据渠道和计算方法不同,其数据结论往往与政府存在一定差异,影响政府权威性。[6]公众对政府数据的服务需求日益旺盛,但政府数据在制度设计上的宏观性存在先天不足,没有以微观性的公众需求为导向,对数据解读不够个性化。关键性的数据资源存在壁垒,未能开放到公众个人。传统的政府信息公开制度由于政府机构种种弊端限制进入瓶颈,而大数据对政府权威性的冲击,给予了政府开放数据全新的动力和思路。如何在保障必要机密的情况下,适当开放数据资源,增加与公众需求相适应数据信息共享,是政府数据管理部门的又一难题。大数据具有噪声性和低密度性的特点,政府进行公共数据产品提供,就需要对大数据进行规范化处理,确保数据产品的质量。政府数据部门进行制定和更新数据标准同样存在困难.4.2公民隐私保护与数据公开的矛盾大数据的一个主要特点就是可以将不同领域、网络、数据库的信息进行数据化,加以分析处理进而获得有价值的信息。为了保证信息公开的广度,开放数据和信息是大数据应用于政府信息开放的必然要求,这就不可避免地涉及到公民隐私权的侵犯。“在大数据时代,想屏蔽外部数据商挖掘个人信息是不可能的。”[7]然而,从公民的角度而言,并不希望自己的信息过度公开。政府掌握的各种数据需要详细的法律来规范哪些可公开哪些不可公开,政府不可避免地公开所有的数据信息供社会组织和公民处理分析和利用。数据公开的“公共性”和公众隐私的“个人性”的矛盾将难以化解,对公民的隐私形成了威胁。4.3数据保密与数据公开的矛盾大数据时代政府信息公开要求政府数据的广泛开放,数据开放才能激发社会对数据价值的挖掘、开发利用,进而在满足公民知情权的情况下将之应用到更加广泛的领域,促进产业发展。我国《政府信息公开条例》中规定,凡是没有明确规定应该公开的内容,都被列为保密的范围内。而大数据时代对政府信息公开提出了更高的要求,“凡是不应该保密的内容都应公开”,[8]传统的对数据保密的规定与公众对政府数据开放的需求造成的矛盾是成功将大数据引入政府信息公开系统的关键问题。4.4技术落后与数据公开可行性的矛盾大数据技术虽然处于蓬勃发展的状态,但大数据应用于政府数据公开的可行性还有很长一段路要走。首先,政府数据公开需要建立起全国统一的数据库和覆盖各领域的一体化综合信息服务平台,这些都需要强大的配套技术和系统做支撑;其次,大数据价值密度低的特点使得公开时必须依靠成熟的数据挖掘技术将数据转化为有用的信息,这些又都需要成熟的数据挖掘技术和安全保密技术做支撑。4.5技术发展与数据公开理念滞后的矛盾技术的发展容易产生“文化滞后”现象。[9]随着大数据技术的应用,政府数据公开将是全民参与的外部公开、政府部门的主动公开和信息数据“流动整合”的公开。然而,政府公开大部分是依申请公开;拒绝公开的答复多为保密信息等;政府公开工作中仍然存在着部门割据思维。[10]政府部门的理念跟不上技术改变的速度。归结来看,在大数据技术发展的基础上,以主动公开、信息共享、协作等为基本原则的数据信