浅析大数据环境下的隐私保护问题【摘要】大数据是当前的研究热点,正影响着人们日常生活方式、工作习惯及思考模式.但目前大数据在收集、存储和使用过程中面临着诸多安全风险,大数据所导致的隐私泄露为用户带来严重困扰,本文分析了实现大数据安全与隐私保护所面临的技术挑战,给出了相应的对策。【关键词】大数据;隐私保护一、大数据时代的特点与面临的问题近年来,随着互联网、物联网、云计算等IT与通信技术的迅猛发展,信息社会已经进入了大数据时代,数据的快速增长成了许多行业共同面对的严峻挑战和宝贵机遇。大数据已被美国在内的多国政府视为重要的战略资源,我国也在抓紧研究并制定相应的大数据战略。大数据的特点多总结为“3V”,即,规模性(volume)、多样性(variety)、高速性(Velocity)[1],还有人提出真实性(Veracity)和价值性(Value)等特征[2]。由于其数据来源及应用涉及广泛,导致了以往在生产、经济活动、科学研究甚至日常生活中的很多思维方式发生巨大变化,带来了无数机遇。但由于网络大数据具有复杂性、不确定性和涌现性,导致网络数据安全方面面临巨大的挑战,制约大数据未来发展的瓶颈之一就是安全与隐私问题。二、大数据时代在个人隐私保护方面面临的挑战在大数据时代,通过对大数据分析、归纳,从中挖掘出潜在的模式,研究社会运行的规律与发展趋势,可以帮助企业、商家调整市场政策、减少风险、理性面对市场做出决策。随着新技术的不断出现,在发现规律的同时,可能会泄漏个人隐私,严重威胁到人们的个人信息安全和机构的商业秘密安全。例如,我们的位置信息,每天的行程数据,在大数据时代,通过GPS、手机定位等,可以轻易获得。1.大数据时代要求数据公开,导致隐私泄漏的风险增大。如果仅仅为了保护隐私就将所有的数据都加以隐藏,那么数据的价值无法体现。数据公开是非常有必要的,政府可以利用公开的数据了解整个国民经济的运行,以便更好地宏观指导。企业可以利用公开的数据了解客户的需求,从而推出特色服务。研究者可以利用公开的数据,从社会、经济、技术等不同的角度来进行研究。但是网络中大量的公开数据如果缺乏监管,会导致用户无法确定自己隐私的用途,增大了隐私泄漏的风险。2.大数据时代数据存在累积性和关联性,通过相关技术分析可以获取相关信息,对人们行为进行预测,导致隐性的隐私泄漏。在网络上人们为了保护个人隐私,可能采取匿名等方式将自己的行为隐藏起来。但是互联网尤其是社交网络的出现,使得人们在网络中产生越来越多的数据足迹。这种数据具有累积性和关联性,单个信息可能不会暴露用户的隐私,但是如果有办法将某个人的很多行为聚集在一起时,他的隐私就很可能会暴露,因为有关他的信息已经足够多,这种隐性的数据暴露往往是个人无法预知和控制的。从技术层面来说,可以通过数据抽取和集成来实现用户隐私的获取,因此大数据时代的隐私性主要体现在不暴露用户敏感信息的前提下进行有效的数据挖掘,这有别于传统的信息安全技术手段。文献[3]中提出保护隐私的数据挖掘这一概念,近年来逐渐成为相关领域的研究热点。主要研究新型的数据发布技术,尝试在尽可能少损失数据信息的同时最大化地隐藏用户隐私。Dwork在2006年提出了新的差分隐私方法[4]。差分隐私保护技术可能是解决大数据中隐私保护问题的一个方向,但是这项技术离实际应用还很远。大数据未被妥善处理会对用户的隐私造成极大的侵害,根据需要保护的内容不同,隐私保护又可以进一步细分为位置隐私保护、标识符匿名保护、连接关系匿名保护等[5]。根据大数据处理流程,可以分为几个阶段:(1)数据采集与预处理时的隐私保护,如数据精度处理;(2)数据共享、发布时的隐私保护,如数据的匿名处理等;(3)数据分析时的隐私保护;(4)隐私数据可信销毁等。三、大数据环境下保护个人隐私的对策保证用户个人信息安全是大数据时代可持续发展的重要需求之一,账户被盗、资料丢失、隐私被敲诈等等问题,让我们意识到隐私保护问题是一个综合性的问题,需要用户、运营商和监管部门共同协作,从国家、行业和用户等各个层面来应对大数据环境中出现的安全问题。1.从法律政策上加强信息保护和管理。“三分技术,七分管理”,大数据下的隐私保护应该是体制和法律的配套过程。数据资源是全民财产,政府在推动数据公开的基础上,需要对信息的保护范围和措施从法律角度上限定,如敏感数据的所有权和使用权界定及侵犯他人隐私的处罚问题。2013年3月1日开始实施的《信息安全技术、公共及商用服务信息系统个人信息保护指南》,作为个人信息保护方面的最高国家标准,它对大数据时代如何合理利用个人信息给予界定,以指导和规范利用信息系统处理个人信息的活动。2.从技术上保护基础设施和网络安全。大数据时代下的社交网络数据的存储和处理需要大规模基础设施的支撑,由于大量的数据汇集在一起,敏感数据集中起来会带来攻击效益的提高,极易成为黑客们攻击的目标,基础设施被攻击的风险显著提高,因而托管数据的云的安全非常重要,需要开发相应的反数据挖掘技术手段。3.从管理上加强运营公司的监控力度。社交网络运营商应该杜绝公司内部人员对用户数据的非正当访问,对外限制第三方公司对平台内数据的访问及相应的授权公司能够访问到的数据对象范围,来加强数据的可控性。4.从认识上提高用户的隐私保护意识。要让大众知道数据有价值,并能意识到数据管理不善可能带来的危害,提高自身的数据意识。大数据给人们带来极大便利的同时,也带来了新的安全挑战。本文主要阐述了大数据带来的个人隐私方面的安全问题。由于基于隐私保护的数据挖掘技术还处于起步阶段,进一步地完善基于隐私保护的大数据挖掘技术仍是将来的研究热点。参考文献[1]GrobelinkM.Big-datacomputing:CreatingrevoIutionarybreakthroughsincommerce,scienceandsociety[R/OL].20I2:10-02.[2]http://wenku.baidu.com/view/abfb3a1552d380eb62946d9d.html:刘念真.利用0racle信息模型驾驭大数据.[3]AgrawalR,SrikantR.Privacypreservingdatamining[C]//ProcofSIGMOD2000.NewYork:ACM,2000:439-450.[4]DworkC.Differentialprivacy[C]//ProcofICALP2006.Berlin:Springer,2006:1-12.[5]冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014.