—技术论坛叶省栌与网络创新生活 大数据安全的现状与发展王倩,朱宏峰,刘天华(沈阳师范大学计算机应用技术辽宁沈阳110034)[摘要]蜣着大数据应用的爆发性增长,大数据衍生出独特架构,并推动存储、网络及计算机技术的发展,同时也引发了新的安全问题。国际社会已经将大数据安全列入国家信息网络安全战略,国内学术界、信息安全界、产业界也正逐步关注大数据的发展。文章从大数据的概念入手,对其特征进行了简要概括,重点归纳总结了大数据背景下面临的安全问题以及对国家信息安全发展的启示,并对大数据安全的发展趋势进行了展望。[关键词】大数据安全战略APT攻击中图分类号:TP309.2文献标识码:A文章编号:1008-1739(2013)16-66-4CurrentStatusandDevelopmentofBigDataSecurityWANGQian,ZHUHong-feng,LIUTian-hua(DepartmentofComputerApplicationTechnology,ShenyangNormalUniversity,ShenyangLiaoning110034,China)Abstract:Withtheexplosivegrowthofbigdataapplication,bigdataderivesspecialarchitecture,promptsthedevelopmentofstorage,networkandcomputertechnology.Italsobringsnewsecurityproblems.Internationalcommunityhasincludedbigdatasecurityintocountryinformationnetworksecuritystrategywhilethedevelopmentofbigdatahasattractedtheattentionofdomesticacademe,fieldofinformationsecurityandindustrialcommunity.Thispaperproposesthedefinitionofbigdataatfirstandthenbrieflysummarizesitscharacteristics,focusesonconclusionofsecurityproblemsunderthebigdatafieldandtheinspirationstothedevelopmentofcountryinformationsecurity.Finally'thispaperoutlooksthefutureandtrendofbigdatasecurity.Keywords:bigdata;securitystrategy;APTattack1弓L 代架构和技术,用于更经济、有效地从高频率、大容量、不同结构和不同类型数据中获取价值。与传统基于事务的数据仓库勝来'“大觀”频频被国外各大咨询公司视作下一个系細比'大数在智能分析的基础上进行更大容量翻條前沿'国际社会希翻用“大数据”促进全球经济发展。和非结构雌据的处理。2012年3月美国政府推出“大数据研究与发计划”,弓丨发国 最早将大数据用于IT环境的是知名咨询公司麦肯锡。麦—&肯锡在研究报告中指出:如果说衣计算为麵资产纖了保问题,与国家安全战略的关系以及发展趋势作了简要归纳阐管、访问的场所和渠道,那么如何盘活数据资产'使其为国家述与分析`1】。 治理、企业綠旭+入顿服则是大数据驗心议题,° 也転计算内在的灵柳必然的升级方向。,_从信息安全角度看,大数据是指规楱和格式前所未有而2 又相互关联的大量数据,搜集自企业的各个部分,技术人员可以舶们进行高速分析。目前,对于大数据的概念,业界尚无统一定义,根据维基百科的定义,大数据是指无法用现有的软件工具提取、存储、oJUgtfrWWjjJAjlX搜索、共享、分析和处理的海量复杂数据集合曰。同时也指新一 、,定稿日2013-07-26 大数据的4V+1C特征:V U十算机与网络》2013年第16期技术论坛?计算机与网络剑新生活①Volume,数据量大,据国际知名数据公司IDC提供的安全问题堪忧。数据,全球数据量大约毎两年翻一番,人类近两年产生的数据 4.2大数据成为高级可持续攻击的载体量相当于之前产生的全部; 提到大数据攻击,不得不提一种典型的高级持续性攻击②Variety,数据类型多,数据可分为结构化数据、半结构化[4](Advanced PersistentThreat,简称APT攻击)'它的攻击持续_和非结构化相较便于存储的文本为主的结构化数时间长,攻击过程持续复杂,且很难被发现。APT的主要特点据,曰志、音频、视频、图片等非结构化数据,对数据处理能力是攻击空间很广、持续性很强和单点隐蔽能力很强。提出了更高的要求; 传统的防护策略难以检测黑客利用大数据隐藏的攻击。③Value,价值密彳氐,价值密度的高低与数据总量成反传统的检测是基于单个时间点进行的基于威胁特征的实时匹bb。配检测,而APT攻击是一个持续的过程,不具有被实时检测两秒。如何通过强大的计算机算法更迅速地完成对有用数据到的明显特征,故无法被实时检测出来。同时,隐藏在大量数的提取,是大数据背景下亟待解决的问题; 据中的APT攻击代码也很难被发现。此外,攻击者还可以利④Vdodty,^??度快,这是*数据相较与传统数据挖掘用社交网络和系统漏洞进行攻击'在威胁特征库无法检测出最显著的特征,IDC的“数字宇宙”报告预计到20:20年,全球 来的时间段,发起攻击。以电子形式存储的数据量将达到35.2ZB,在如此海量的数据 黑客利用大数据扩大攻击效果,主要体现在三个方面:①率将成为銜i技平的关键; 黑客利用大数据发起僵尸网络攻击'可能同时控制上百万台⑤Complexity,复杂性加大,更提升了处理分析大数据的傀儡机并发起攻击,此数量级是传统单点攻击不具备的;②黑客可以通过控制关键节点放大攻击效果;③大数据的价值低密度特性,让安全分析工具很难聚焦于价值点,黑客可以将攻4大数据安全问题 击隐藏在大数据中,给安全厂商的分析带来困难。黑客设置的任何一个误导安全厂商目标信息提取和检索的攻击'都会导4.1大数据加大隐私泄露风险 ——。細赚*触看,Hadoop纖据的聚合增加了数据泄4.3大数据技术为信息安全提供新支撑 一露的风险。作为一个分布式系统架构,Hadoop可以用来应对 2012年Gartner安全和风险管理峰会上,Gartner公司副PB甚至ZB级的海量数据存储;作为一个云化的平台,总裁NeilMacDonald预测,到2016年,40%的企业(以银行、保Hadoop自身也存在着云计算面临的安全风险,企业需要实施险、医药和国防行业为主)将积极地对至少10TB数据进行分基于身份验证的安全访问机制;此外,Hadoop派生的新数据析,以找出潜在危险的活动。Gartner还认为,由于APT攻击崛集也同样面临着数据加密的问题。 起,大数据分析成为彳艮多企业信息安全部门迫切需要解决的同样,大数据依托的基础技术一nosql(非关系型数据库)与当前广泛应励SQL(关系難据库)献不同,没有经胃。过长期改进和完善,在维护数据安全方面也未设置严格的访 不过,事情总有两面性,大数据便于黑客攻击的同时,智问控制和隐私管理。NoSQL还因大中源和承apt;&击ft力式在载方式的多样性,使得企业将很难定位和保护其中的机密信中的声音越来越响。mi5,,fisnosql 既然APT攻击很难被检测出来,企业必须先确定正常、整性特质。另一方面,NoSQL对来自不同系统、不同应用程序非恶意的騎,才能尽早确定錢的网络和数据是否受到了及不同活动的数据进行关联,也加大了隐私泄露的风险。此攻击。这需要颠觀多以往关于网络和信息安全的观念,例外,NoSQL允许不断对数据记录添加属性,这也对数据库管如,搞清楚攻击是如何发起的,会造成什么影响,继而根据分理员的安预见能力提出了更高的要求。 析结果建立安全觀并非易事'要建立合理的觀进行检测从核心維角度看,大数据的技术关键在于数据分析和和记录。APT攻击建模不只是针对一个攻击包或者某一个威糊,但關分析技术的发展,势必对用户隐私产生极大威胁架构,而是针对大范围的数据;为了精准地描述威胁特征'胁。大麵时代'想屏蔽外部数据商挖掘个人信息是不可能建働过程可麟费几个月甚至几年时间,企业需要耗费大的。例如各社交网站均不同程度地开放其用户所产生的实时量人力、物力、财力成本,才能达到^的。数据,被一些数据提供商收集,还出现了一些监测分析市场的 大数据分析将作为解决各种高端攻击的有效方法,例如'机构,通过人们在注册网站时填写的信息、智能手机显示的位针对大数据潜伏时间长、难以被检测的问题,安全厂商不只进置等多棚组合,并以非常高的精度锁定挖掘个人信息,隐私行单点检测,而对一段时间内纖行关联检测。针对零?2013年第16期U十算机与网络》一技术论坛'|卩丨与网络创新生活 漏洞的攻击可能在当时无法发现,但是通过检测能力的不断重点领域数据库范围,制定完善的数据库管理和安全操作制提升,在二次检测的时候便能够检测出来。再如,弗雷斯特研度,加大对重点领—据库的日常监管。在企业层面,加强企究公司创建的零信任安全模型,基于安全访问,准入控制和全业内部管理,制定设备尤其是移动设备的安全使用规程,规范程检测记录三大原则,预先在企业部署网络分析与可见性工大数据的使用流程和使用权限。具,可以有效提高发现此类攻击的能力。 5.3加快大数据安全技术研发对大数据进行分析的数据仓库需要具备高度可扩展性、 传统信息安全技术不能完全使用于新兴的大数据领域,高性能、高度容错性、支持易购环境、较低分析延迟、成本较云计算、物联网、移动互联网等新技术的快速发展,对大数据低、易于兼容等特性,基本目标是要以低投入获得高效分析的的收集、处理和应用提出了新的安全挑战。加大对大数据安全能力、 技术研发的资金投入,将有利于提高我国大数据安全技术产大数据对于安全问题是一把双刃剑,结果取决于技术的品水平,推动基于大数据的安全技术研发,抢占大数据安全技使用者及其目的。大数据的安全问题是一种自身的对抗与博 术发展先机。弈,这也是安全问题本身固有的特点。6大数据安全的发展趋势5大数据与国家安全战略6.1大数据技术衡量未来IT安全2012年3月29日'美随巴马政府宣布投资2亿美元' 大数据时代的到来'使得信息数据不再受限于传统高度启动“大究和发展计划”。计划涉及_国国家科学基金、结构化的表示'研究大数据框架如何衡量未来IT安全,应该□家卫生研究能源方SP、JISHP方IfP获得哪讓的度□量标准;通过大数据确定具体安全问题,构造高级研究计划局、麵賴觀局6个联邦政府部门'旨在加实验测蘭决识别攻击的问题;観存錢产品中探索大数快科学、工程领域的创新步伐,推动和改善与大数据相关的收 。集、组织和分析工具及技术'提升从大量、复杂的数据集合中g2大数据玄全的甚础设施发展萃取信息纖力'歡難醜安全'转育和翔贼。 職讀驗全的重翻容,输对通驢础设施安该计划的推出,麵美国正在实施基于大数据的国家信細□力签法、Had00p、N0SQL等,这些基础设施、基本技术,都将直接有专家认为'大数据计划是美国保持信息产业强国霸主影响大数据下的信窗安全。地位的重要体现。在我国政府文件中,尚未有直接提及“大数gJ大数据隐`的实现°据”的政策,但2011年底工业和信息化部发布的《物联网“十□^?.,......, -?i-1-.jxj1- 大数据技木使之前无法聚口的大量数据聚集起来,二五”规戈ij》中,信息处理技术作为四项关键技术创新工程之引发的对敏感数据隐私保护的担忧,需要相关科研人员通过:======:=技术改进'提高大数据下的信息安全性;需要法律制定部门完工t善漏律細亂-旦隱失,如何雕、赔偿、修复项关键技木创新工程,如{目息感知技术、信息传输技术、fe息 a以提高用户的信任等都是值得考虑的问题。安全技术,