大数据下的信息资源摘要关键词1引言英特网是世界上最大的信息宝库,它已成为全球范围内传播和交流科研信息、教育信息、商业和社会信息的最主要的渠道,要想在这一浩瀚无边的信息海洋中发现和找出有利用价值并不是一件容易的事情。在以互联网为核心的电子信息环境下完成确实、有效的信息检索对于每一个检索者来说都是一项十足的挑战。而要进行有效的网络信息检索,首先就必须对互联网上的信息资源的发布和利用价值等有较全面的认识。随着信息通讯技术的不断发展和各种智能终端的应用普及,人们在日常的工作、学习和生活中都通过利用计算机、手机以及其他的各种移动设备产生了大量的数据,其规模和复杂程度超越了传统技术手段所能处理的范围。数据被认为是新时期的基础生活资料与市场要素,重要程度不亚于物质资产和人力资本。近年来,企业产生的数据量呈指数级增长,信息资源爆炸式激增,其中非结构化的数据信息达到85%左右,传统的信息资源管理技术已经无法应对大数据时代的挑战。大数据技术和其他大数据工具与设备的出现,以及云计算数据处理与应用模式的广泛运用,为企业处理日益增长的海量非结构化数据提供了高效、可扩展的低成本解决方案,弥补了传统关系型数据库或数据仓库处理非结构化数据方面的不足,深化和拓展了企业商业智能和知识服务能力,形成了数据驱动的决策机制,提高了决策水平错误!未找到引用源。。2信息资源处理信息是一个发展中的动态范畴,随着人类社会演变而相应的扩大或收缩,总的来看从过去到现在信息所涵盖的范围是不断扩大的错误!未找到引用源。。处理信息的方式也变得更加的多种多样。2.1信息管理传统的资源以纸张书籍为媒介进行存储与管理,显然效率是极差的。后来到了信息管理阶段之后,主要以计算机为工具,以自动化信息处理和信息系统建造为主要内容,着眼于信息流的控制,显然这是在计算机一级相关信息技术高度发展和广泛应用背景之下发展起来的信息管理模式。在计算机被用于图书馆和情报中心文献信息加工与管理的同时,也被广泛用于公司、企业和其他各类机构的行政记录处理、财务数据处理和经营活动数据处理。最初这种数据处理仅仅是在局部环节和操作层次上,主要目的是用机器代替手工劳动,提高数据处理速度和效率。随着数据量不断增大,内容日益复杂,不仅需要解决大量数据的处理和组织,还需要对数据进行存贮、保护并在需要时取出,这就促使人们以系统思想为指导,全面考虑组织机构各类数据的采集、加工、存贮、检索、传输和利用,以此为契机,管理信息系统(MIS)及其他各类自动化信息系统便应运而生了错误!未找到引用源。。2.2信息资源管理在以互联网为基础的全球信息高速公路建设改变人类的活动方式,高速信息网上信息资源繁多、分布面广,而且大多是非结构化。在前几年,信息的存储主要以分布式的数据库存储为主,但是随着互联网、移动互联网的规模的不断扩大,数据已经成级数倍增长,更多的数据都是以非结构化的,所以存储分析的难度进一步加大。2.3大数据下的信息资源管理大数据时代,物联网、云计算、移动互联网等新一代信息技术在企业产品研发、客户关系管理、风险管理、供应链管理、决策支持等环节的应用逐步深入,具有“大量(Volume)、多样(Variety)、快速(Velocity)、价值(Value)”特性的信息被大量创造出来。这些信息资源在统一标准规范、实时精准管控和深层价值挖掘上难度较大,企业面临信息资源管理的巨大挑战错误!未找到引用源。。结构复杂多样,统一标准规范难。大数据时代,信息资源在组织上表现为非线性化,超文本、超媒体信息逐渐成为主要的方式;同一服务器上的信息资源也可能在数据结构、字符集、处理方式等方面存在差异。大数据这一结构复杂多样的特性给信息资源统一标准和规范的建立带来麻烦,使得体量庞大的结构化和非结构化的信息资源处于无序组织状态。标准化、规范化企业信息资源是未来企业信息化建设的重点和难点之一。动态性与交互性并存,实时精准管控难。大数据时代,互联网信息是企业信息资源的重要组成部分,丰富的网络信息资源为企业数据获取提供了便利,这些资源为企业进行大规模、精准化的消费者行为研究提供了机会,而互联网信息的动态性是显而易见的,具有很大的自由度和随意性。同时,交互性是网络信息传播的最大特点,互联网形成了企业与用户沟通的桥梁,企业和用户共同参与,使得信息双向流动。企业对自由灵活的且互动性强的信息资源实时精准控制难度越来越大。数量庞大且内容多样,深层价值挖掘难。大数据时代企业信息资源包罗万象,一方面是与外部的客户、合作伙伴通过文本信息、社交网路、移动应用等形式进行互动时产生大量的数据;另一方面,企业内部生产研发、综合办公、视频监控等日常经营管理活动产生的大量信息。这些信息资源在形式上表现为文本、图像、音频、视频等,是多媒体、多语种、多类型信息的混合体。研究表明,中国捕获和产生的数字信息量有望在2015年至2020年间增至8.5ZB,实现22倍的增长,或保持50%的年复合增长率。企业在PB级甚至EB级的数据中寻找相关信息无异于大海捞针,利用信息驱动决策的成本和复杂性与日俱增。2.4企业信息资源体系2.4.1传统资源管理整合度不高企业信息资源长期处于粗放式管理状态。企业对内部产生和外部反馈的大量数据信息仅仅是存储下来,缺少信息的甄别、分类、整合和加工,很少利用信息进行管理决策,信息资源的利用率非常低。大多数企业缺乏有效的方法、手段和机制对信息资源进行管理,无法及时有效地对信息资源进行提取、集成和分析,整合度非常低。2.4.2缺乏对大数据的认知就企业而言,信息资源管理的核心目标就是确保信息资源的有效利用,做到正确决策。企业只有深度认知大数据特征以及大数据给企业信息资源管理带来的难点,才能有序组织和管理结构复杂、大量、实时且潜在价值高的数据信息,才能及时、准确地挖掘分析出海量数据信息的潜在价值,才能确保信息资源的有效利用。然而,多数企业在信息资源管理过程中,对大数据的认知还只限于表面,导致信息资源的有效利用率偏低。数据治理尚属比较新兴的、发展中的概念,随着“大(大数据)云(云计算)平(平台)移(移动互联网)”等新一代信息技术的飞速发展,对企业数据质量的要求越来越高,企业亟须数据治理(DataGovernance)来输出规则的可信度高的数据。然而,目前国内大多数企业在数据治理方面还处于初级阶段,只是做了简单的数据质量检查、数据归档、数据安全等分散性的数据处理工作,没有形成数据治理方法论,数据作为企业核心资产来运作的理念尚未形成,完整的数据治理体系建设缺失。3大数据下信息资源建设3.1数据标准化大数据时代,企业信息资源整合的关键是依托企业主数据管理(MDM,MasterDataManagement),强化数据标准化建设,实现信息资源模式的统一。企业主数据管理就是将企业的多个业务系统中整合最核心的、最需要共享的数据(主数据),集中进行数据的清洗和丰富,并且以服务的方式把统一的、完整的、准确的、具有权威性的主数据分发给企业内需要使用这些数据的应用。赛迪经略总结多年企业信息化规划经验,结合大数据时代企业信息资源管理的要求,提出了识别、诊断、规划、实施、维护5个阶段实现企业主数据管理的方法论。3.2实现半结构化和结构化数据的整合大数据时代,实现企业海量复杂数据信息的科学有效管理是保障大数据技术能够充分挖掘企业信息资源潜在价值的前提。纸质信息与数字化的视频、音频、邮件、图片等非结构化数据在企业信息资源中的比重的逐步攀升,蕴含了丰富的潜在价值。这些非结构化数据的构造方法重复率高、冗余存储明显,且不同对象之间可能存在复杂的关系。然而,传统的面向对象的数据模型无法实现对非结构化数据的组织和管理。因此,企业需推进结构化和非结构化数据的融合式发展,将超文本、超媒体数据模型和面向对象数据模型进行融合,构建适合结构化和非结构数据统一组织和管理的数据模型。4结论大数据时代,企业信息资源整合的最终目标是利用大数据分析与挖掘技术实现信息资源的高效利用。应用系统是大数据的根基,企业应加大大数据技术的应用部署力度,综合运用云计算、分布式计算、数据交换、数据仓库、数据挖掘以及非结构化的数据处理。而信息系统之间的互联是必然的,会形成一个息息相关的生态圈,在这生态圈之内,存储和管理大大量数据信息是企业市场竞争力的核心,需要对数据安全问题进行控制和管理。因此企业在信息资源整合过程中应以数据安全管理为前提,需要与上下游企业以及安全管理机构、评测机构等第三方机构开展广泛合作,从而保证该生态圈的数据信息的安全。