大数据平台构思方案一、项目背景“十三五”期间,随着我国现代信息技术的蓬勃发展,信息化建设模式发生根本性转变,一场以云计算、大数据、物联网、移动应用等技术为核心的“新IT”浪潮风起云涌,信息化应用进入一个“新常态”。为积极应对“互联网+”和大数据时代的机遇和挑战,适应全省经济社会发展与改革要求,大数据平台应运而生。大数据平台整合省社会经济发展资源,打造集数据采集、数据处理、监测管理、预测预警、应急指挥、可视化平台于一体的大数据平台,以信息化提升数据化管理与服务能力,及时准确掌握社会经济发展情况,做到“用数据说话、用数据管理、用数据决策、用数据创新”,牢牢把握社会经济发展主动权和话语权。二、建设目标大数据平台是顺应目前信息化技术水平发展、服务政府职能改革的架构平台。它的主要目标是强化经济运行监测分析,实现企业信用社会化监督,建立规范化共建共享投资项目管理体系,推进政务数据共享和业务协同,为决策提供及时、准确、可靠的信息依据,提高政务工作的前瞻性和针对性,加大宏观调控力度,促进经济持续健康发展。1、制定统一信息资源管理规范,拓宽数据获取渠道,整合业务信息系统数据、企业单位数据和互联网抓取数据,构建汇聚式一体化数据库,为平台打下坚实稳固的数据基础。2、梳理各相关系统数据资源的关联性,编制数据资源目录,建立信息资源交换管理标准体系,在业务可行性的基础上,实现数据信息共享,推进信息公开,建立跨部门跨领域经济形势分析制度。3、在大数据分析监测基础上,为政府把握经济发展趋势、预见经济发展潜在问题、辅助经济决策提供基础支撑。三、建设原则大数据平台以信息资源整合为重点,以大数据应用为核心,坚持“统筹规划、分步实施,整合资源、协同共享,突出重点、注重实效,深化应用、创新驱动”的原则,全面提升信息化建设水平,促进全省经济持续健康发展。1、统筹规划、分步实施。结合我省经济发展与改革领域实际需求,明确总体目标和阶段性任务,科学规划建设项目。先期完成大数据平台的整体架构建设,后期分步完成业务系统的整合及相互间数据共享问题。2、整合资源、协同共享。对信息资源统一梳理,建立经济发展与改革信息标准资源库和数据规范,逐步消灭“信息孤岛”,加快推进数据资源整合,建设共享共用的大数据中心,实现业务协同。3、突出重点、注重实效。以用户为中心,以需求为导向,以服务为目的,突出重点,注重实效,加强平台可用性和易用性。4、深化应用、创新驱动。深入了解用户需求,密切跟踪信息技术发展趋势,不断深化应用、拓展新技术在应用中的广度和深度,促进跨界融合,丰富管理和服务手段。四、建设方案为了保证项目的顺利进行和建设目标的可行性,我们采取如下几种建设方案。(一)、数据采集方案。我们统一信息资源标准规范,建立多维度数据库,拓宽数据来源,通过不同的方式汇聚数据,增强分析力度,提高监测预警的准确性和时效性。1、预留接口,支持其它系统各种数据的上传导入处理。将现存有关经济运行业务系统中的历史数据和时效数据,通过上传数据文件至服务器、分析提取有效数据导入服务器数据库等方式采集起来,在本平台上复用。2、支持外接数据的上传导入处理。可以将企业单位或定点监测机构的数据通过同样的方式采集起来,在本平台上复用。3、支持非结构化数据,即搜索引擎数据、社交媒体数据、地理空间数据和音视频数据等等。(二)、数据分析方案。大数据之大并不是难点所在,其真正难以对付的挑战来自于数据类型多样、要求及时响应和数据的不确定性,而我们所面临的也正是如此。我们采用批量数据处理系统,借助于深度学习、知识计算和可视化等大数据分析技术,通过对数据的批量处理挖掘其中的价值来支持决策和发现新的洞察。(三)、业务整合方案。在对社会发展相关业务子系统充分调研基础上,结合项目需求,可对其进行整合或嵌入处理(本方案整合公共信用信息服务平台、投资项目信息管理平台等)。1、整合处理。将原有数据通过上传或导入方式进行采集,原有功能模块整合到本平台中,合二为一,完美的将数据汇聚起来。缺点是耗时较长。2、嵌入处理。以单点登录的方式将原有系统链接嵌入到本平台中,作为子系统单独存在。缺点在于数据共享难以实现。五、建设内容1、宏观经济监测预测及可视化平台政府信息化的最终目标是提高政府的决策水平,其中经济决策是核心内容。为了提高宏观调控决策水平,我们必须从依靠传统统计数据向依靠互联网非统计数据转变,从监测预测宏观经济总量向监测预测宏观经济先行指标转变,从中长期监测预测向实时监测预测转变。宏观经济监测预测及可视化平台围绕网络搜索、社交媒体、电子商务、终端定位和业务交易等五个方面全面整合互联网相关数据资源,建设以“容量大、形式多、分类细、响应快”为目标的宏观经济监测预测数据库,构建基于互联网数据的宏观经济非统计指标监测预测应用平台。围绕重点产业活跃度、区域经济关联度、宏观经济走向社会预期、社会消费热点、大宗商品供求及价格走势、全国就业形势、外贸订单变化趋势等方面,构建大数据宏观经济先行指标和现时预测指标库,研究能客观、准确反映我省宏观经济运行状况的指标体系,编制“山东指数”。在健全完善监测预警数据库的基础上,充分运用大数据技术和理念,加强数据挖掘力度,强化定量分析,建立宏观经济分析系列模型,切实提高预测分析的前瞻性、准确性和可靠性。积极拓宽信息发布渠道,建立可视化平台,采用Unity3D引擎,三维界面高度仿真,所见即所得。平台针对多源易构的海量数据,通过数据处理、存储管理、可视化交互分析等技术,实现图形化数据查询、可视化关联分析、证据链和情报线索发掘等功能。利用预测信号灯系统,形象地刻画出宏观经济总体运行状况,分析经济波动原因,及时了解各地区经济发展的不平衡性,准确判断和测定经济景气循环运行状态,提高宏观经济决策水平。2、企业信用监测预警服务平台企业信用危机不仅给社会带来严重危害,也是关系到企业自身生死存亡的重大事件,它是中国企业乃至中国市场经济发展的巨大障碍。因此,建立企业信用危机的预警机制和管理机制,对企业信用危机进行有效的预警及管理是十分重要的。企业信用监测预警服务平台,全面整合社会信用监管信息和社会公众反映信息,通过整理归类与加工,将这些信用危机信息转化为可以量化的指标体系,按照失信行为的严重程度和影响范围划分三个预警级别,分别向企业自身、金融机构、其他政府部门及全社会进行通报。纳入企业信用预警体系的企业信息包括侵犯消费者权益且不履行相关义务的信息、消费者投诉未及时处理信息、行政处罚逾期未执行信息、查无下落企业信息等23种信息。可以动态配置预警信息项目和相应预警等级,增强监测预警的全面性和灵活性。企业信用监测预警服务平台以信息技术为支撑,以信用监管为手段,全面提高信用监管信息共享程度,及时预警影响社会交易安全和社会公共安全的不良信用信息,遵循“对外警示社会和企业;对内明确重点,积极采取应对措施”的原则,强化企业信用监管防范机制,有力推进“信用保税区”建设,加强企业信用监督管理的主动性、前瞻性,更好地服务经济发展,减少交易风险,促进企业信用监管到位,实现企业信用的社会化监督。3、投资项目信息管理平台建设投资项目(特别是一些大型项目)具有管理上的复杂性特点,主要是建设周期长、参建方多。投资项目信息管理平台的建立和应用,可有效解决投资建设项目管理动态过程的信息分析、信息构建,达到各参建方信息共享的目的。投资项目信息管理平台,支持重大项目推介,建立规范的项目审批流程和项目信息库,管理项目启动、计划、执行、监控和收尾的整个生命周期,覆盖进度、质量、成本、资源、风险等项目管理的各个要素,构建集成项目、流程、知识的信息化平台。逐步实现与相关部门业务系统的接入,形成全覆盖的投资项目管理统一工作平台,真正做好资源共享,为项目的后期评价、领导决策提供支持服务。围绕设计、招标、监理、质量、安全、进度、施工、资金、变更、合同管理“十大环节”,建立起对投资项目进行事前计划、事中控制、事后评估、全程管理的有效管控模式,促进投资项目管理体系发挥全方位、全过程的计划、组织、协调与控制作用。投资项目信息管理平台,以现代项目管理方法论为基础;以项目管理为主线,全面组织、全程贯穿各个业务环节;以项目计划为依据,科学协调各个部门的工作;以成本、进度、质量为最终控制目标;以完整、及时、准确的项目信息和科学的分析模型为项目管理、决策提供依据;遵循“以计划为龙头,以合同为中心,以投资控制为目的”的现代项目管理理念,构建高效、实用的项目协同管理综合平台。4、政务数据共享交换平台政务数据共享交换平台是各个平台中的基础性和综合性平台,是解决“信息孤岛”、实现数据互连互通的基础设施,有利于提高各类信息资源整合共享,以及信息资源的综合利用。建设政务数据共享交换平台的首要目标就是要创造一个信息交换、信息共享的方式和环境,按照统一标准和规范,建立信息资源整合机制,规范数据采集口径、采集方式,规范数据的服务方式,建立统一的资源信息整合与交换机制。我们按照统一、集约、高效的数据开发利用理念,通过研究建立多级交换管理体系,形成政务信息资源物理分散、逻辑集中的信息共享模式,通过以应用为抓手,进一步打通数据流,满足政府部门多方位、多层次的数据需求,为跨地域、跨部门、跨平台不同应用系统、不同数据库之间的互连互通提供包含提取、转换、传输和加密等操作的数据交换服务。通过分布式部署和集中式管理架构,有效解决各节点间数据的及时、高效上传下达,在安全、快捷、方便的进行信息交换的同时精准的保证数据的一致性和准确性。政务数据共享交换平台的全局目标是建立“一个系统”,解决“两个问题”,支持“三个应用”,面向“四个服务”。建立“一个系统”,即建立一个可扩展、可集成、有统一数据模型、可交换和安全可靠的分布式系统,对各类政务资源进行组织和管理。解决“两个问题”,即解决政务信息资源的发现与定位问题,解决政务信息资源规划与整理问题。支持“三个应用”,即支持信息集成整合应用、各业务部门办公应用和政府职能决策应用。面向“四个服务”,即面向政务协作、宏观决策、市场监管和社会管理服务。六、技术支持与平台性能1、系统架构结合该项目以大数据平台为核心,多业务子系统并存的业务需求,以及存在不同种类操作系统、应用软件、系统软件的现状,我们采用面向服务的体系结构,即SOA架构。SOA是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口和契约联系起来。接口是采用中立的方式进行定义的,它独立于实现服务的硬件平台、操作系统和编程语言。这使得构建在这样系统中的服务可以以一种统一和通用的方式进行交互。它的本质是实现服务和技术的完全分离,从而最大程度上实现服务的集成和重组。SOA实施是以业务服务为导向的,业务服务独立于技术之上,技术处于从属地位,采用SOA架构的主要优势有:1、SOA与平台无关,减少了业务应用及业务子系统整合的限制。2、SOA具有低耦合的特点,各个业务子系统对整个业务系统的影响较低,在各个系统不断变化情况下,节省的费用会越来越多。3、SOA具有可按模块分阶段进行实施的优势。可以成功一步再做下一步,将实施造成的冲击减少到最小。SOA服务交互示意图如下:2、技术支持1、技术领先的J2EE框架。Java2平台企业版(Java2PlatformEnterpriseEdition,J2EE)是一种利用Java2平台来简化且规范应用系统的开发与部署,进而提高可移植性、安全与再用价值。基核心是一组技术规范与指南,其中包含的各类组件、服务架构及技术层次,均有共同的标准及规格,让各种依循J2EE架构的不同平台之间,存在良好的兼容性,解决过去企业后端使用的信息产品彼此之间无法兼容,企业内部或外部难以互通的窘境。基主要的技术规范有JDBC、EJB、JSP、JavaServlet、XML等。JDBC为访问不同数据库提供了统一的路径,使对数据库的访问具有平台无关性。EJB提供了一个框架来开发和实施分布式商务逻辑,简化了具有可伸缩性和高度复杂的企业级应用程序的开发。JSP页面由HTML代码和嵌入其中的Java代码组成,简化了页面的输出,保留了脚本语言易