1科技学院《信息检索技术》课程考核报告报告名称:大数据的个人信息安全分析姓名:袁粽鸿学号:1220040466专业:电子信息工程(民航机务维修方向)班级:2012级01班2015年12月15日2目录1.基于大数据环境下的个人信息安全分析的研究背景……………………(3)2.基于大数据环境下的个人信息安全分析的研究现状……………………(3)3.检索方案……………………………………………………………………(5)4.检索结果评价………………………………………………………………(8)31.大数据的个人信息安全分析的研究背景大数据这一概念是伴随着互联网技术发展而产生的,其数据采集手段主要是通过计算机网络。用户在上网过程中的每一次点击,录入行为都会在云端服务器上留下相应的记录,特别是在现今移动互联网智能手机大发展的背景下,我们每时每刻都与网络连通,同时我们也每时每刻都在被网络所记录,这些记录被储存就形成了庞大的数据库。从整个过程中我们不难发现,大数据的采集并没有经过用户许可而是私自的行为。很多用户并不希望自己行为所产生的数据被互联网运营服务商采集,但又无法阻止。因此,这种不经用户同意私自采集用户数据的行为本身就是对个人隐私的侵犯。互联网运营服务商往往把他们所采集的数据放到云端服务器上,并运用大量的信息技术对这些数据进行保护。但同时由于基础设施的脆弱和加密措施的失效会产生新的风险。大规模的数据存储需要严格的访问控制和身份认证的管理,但云端服务器与互联网相连使得这种管理的难度加大,账户劫持、攻击、身份伪造、认证失效、密匙丢失等都可能威胁用户数据安全。近些年来,受到大数据经济利益的驱使,众多网络黑客对准了互联网运营服务商,使得用户数据泄露事件时有发生,大量的数据被黑客通过技术手段窃取,给用户带来巨大损失,并且极大地威胁到了个人信息安全。互联网运营服务商采集用户行为数据的目的是为了其自身利益,因此基于对这些数据分析使用在一定程度上也会侵犯用户的权益。近些年来,由于网购在我国的迅速崛起,用户通过网络购物成为新时尚也成为了众多人的选择。但同时由于网络购物涉及到的很多用户隐私信息,比如真实姓名、身份证号、收货地址、联系电话,甚至用户购物的清单本身都被存储在电商云服务器中,因此电商成为大数据的最大储存者同时也是最大的受益者。电商通过对用户过往的消费记录以及有相似消费记录用户的交叉分析能够相对准确预测你的兴趣爱好,或者你下次准备购买的物品,从而把这些物品的广告推送到用户面前促成用户的购买,难怪有网友戏称“现在最了解你的不是你自己,而是电商”。当然我们不能否认大数据的使用为生4活所带来的益处,但同时也不得不承认在电商面前普通用户已经没有隐私。当用户希望保护自己的隐私,行使自己的隐私权时会发现这已经相当困难。由于数字化信息低成本易复制的特点,导致大数据一旦产生很难通过单纯的删除操作彻底销毁,它对用户隐私的侵犯将是一个长期的过程。大数据之父维克托・迈尔-舍恩伯格(ViktorMayer-Schonberger)认为“数字技术已经让社会丧失了遗忘的能力,取而代之的则是完美的记忆”[1]。当用户的行为被数字化并被存储,即便互联网运营服务商承诺在某个特定的时段之后会对这些数据进行销毁,但实际是这种销毁是不彻底的,而且为满足协助执法等要求,各国法律通常会规定大数据保存的期限,并强制要求互联网运营服务商提供其所需要的数据,公权力与隐私权的冲突也威胁到个人信息的安全。2.大数据的个人信息安全分析的研究现状一、信息安全的现状2.1、产业背景目前国际上围绕信息安全的斗争愈演愈烈。在全球信息化的同时,各种新攻击与防护技术(如对工业控制系统的攻击、无界浏览器、网络刷票、免杀等)、新攻击与防护方法(如网络身份证、云安全等。)层出不穷。这些新攻击与防护技术所带来的安全问题尤其突出,因此有必要对这些新攻击与防护技术、方法、所带来的安全问题进行系统分析,识别对国家安全和社会稳定所带来的风险和影响。信息网络安全是美国三大核心国家战略之一,如果说在工业时代是以核战争为中心,那么在网络时代是就是以网络战为中心。美国奥巴马政府把加强信息安全作为振兴美国经济繁荣和国家安全的重大战略,同时把加强信息安全教育和人才队伍培养列为保障网络空间安全战略的重点,以此来确保美国控制全球信息的绝对优势。我国十分重视信息网络安全,已经将信息安全作为优先发展的前沿技术列入了“国家中长期科学和技术发展规划纲要(2006-2020年)”。为了更好地了解国内外信息安全发展的新趋势,论文从国家安全政策,攻击技术,防护技术三个方面5全面总结分析了近两年国际国内信息安全发展的新动向。全面了解这些新政策、攻击技术和防护技术可以为我国信息网络安全的实施启到借鉴作用。由于信息安全对于国家安全的战略性意义,十二五规划纲要高度强调了网络与信息安全保护的重要性,提出要健全法律法规、完善标准体系、实施安全等级保护与风险评估等制度,构建信息安全保密防护体系,确保国家网络与信息安全。目前我国信息安全产业尚处于发展初期,国家策对于行业发展至关重要,在策推动下,信息安全市场将由府、金融、电信等传统领域向国防、能源、教育、交通、医疗卫生行业以及中小企业快速拓展,整个行业有望迎来高速发展期,年均增速有望达到20%以上。国务院发布的十二五规划纲要,描绘了未来五年我国经济会发展的宏伟蓝图,其中信息技术行业由于位列七大战略性新兴产业,并对推动经济会其他各领域的发展意义重大,从而成为十二五规划的重要内容。规划纲要提出要全面提高信息化水平,加快建设宽带、融合、安全、泛在的下一代国家信息基础设施,推动信息化和工业化深度融合,推进经济会各领域信息化。与此前的规划草案相比,正式规划高度强调了对于信息安全领域的重视,细化了对于电子务系统建设的要求,突出了对于地理信息产业的关注,并增加了鼓励高技术服务业发展以及推动数字城市建设的内容,我们认为信息安全行业将在策的鼓励和要求下获得更为明确的发展前景,今后国内各企业、政府部门、各行业将需要大量的信息安全人才。2.2、目前国内信息安全技术和发达国家之比较目前在信息安全技术处于领先的国家主要是美国、法国、以色列、英国、丹麦、瑞士等,一方面这些国家在技术上,特别是在芯片技术上有着一定的历史沉积,另一方面在这些国家信息安全技术的应用上例如电子政务、企业信息化等起步较早,应用比较广泛。他们的领先优势主要集中在防火墙、入侵检测、漏洞扫描、防杀毒、身份认证等传统的安全产品上。而在注重防内兼顾防外的信息安全综合强审计上,国内的意识理念早于国外,产品开发早于国外,目前在技术上有一定的领先优势。63.检索方案方案一3.1、检索工具中国知网中国知识基础设施工程(ChinaNationalKnowledgeInfrastructure,CNKI)是以实现全社会知识信息资源共享为目标的国家信息化重点工程,于1999年6月正式启用,现已建设《中国知识资源总库》及CNKI网络资源共享平台,实现对各类知识资源的跨库、跨平台、跨地域的检索。3.2、检索词检索词(SearchTerm或Searchword)是能概括要检索内容的相关词汇。检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有关据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。3.3、检索式指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。关键词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。3.4、检索步骤(1)检索需求分析。检索内容条件为:大数据,信息安全,安全防范。(2)选择检索模式。选择“文献”数据库、“全文”检索项,并在对应输入框中填入“校园网安全防范技术研究”检索式。(3)检索结果如下:7(4)检索结果分析:满足检索条件的核心期刊论文为796篇,数量较多,不宜逐个阅读,若要得到更合适的文献,可通过增加检索控制条件进行二次检索。通过时间的限定(2012年-2015年),检索出的命中文献有351篇。方案二1、检索工具万方数据库8“万方数据资源系统”是以中国科技信息所(万方数据集团公司)全部信息服务资源为依托建立起来的,是一个以科技信息为主,集经济、金融、社会、人文信息为一体,以Internet为网络平台的大型科技、商务信息服务系统。目前,万方数据资源系统提供学位论文全文、会议论文全文、数字化期刊、科技信息、商务信息等五大板块,并通过统一平台实现了跨库检索服务。2、检索词检索词(SearchTerm或Searchword)是能概括要检索内容的相关词汇。检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有关据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。3、检索式指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。关键词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。4、检索步骤(5)检索需求分析。检索内容条件为:大数据,信息安全,安全防范。(6)选择检索模式。选择“文献”数据库、“全文”检索项,并在对应输入框中填入“校园网安全防范技术研究”检索式。(7)检索结果如下:9检索结果评价(1)查全率:(RecallFactor)是指检出相关文献数与建设系统中相关文献的总数比率,是衡量信息检索系统检索出相关文献能力的尺度。知网:查全率(R)=检出的相关文献数/检索系统中的相关文献数x100%=99%EI:查全率(R)=检出的相关文献数/检索系统中的相关文献数x100%=98%(2)查准率(PertinencyFactor):指检出的相关文献数与检出的文献总数的比率,是衡量信息检索系统检出文献准确度的尺度。(3)检索速度(TimeFactor)是衡量检索效率的一个重要指标,影响检索速度的因素主要是检索系统本身的运行速度、用户的检索技能水平和网络通信传输速度等方面。总结:互联网、物联网、云计算等高新技术的发展,使得全球数据量猛增,这就意味着大数据时代的正式到来。这些海量数据在为人民提供更多知识与信息的同时,也由于自身的开放性日益扩大而导致了一些网络信息安全问题,一些隐私数据与敏感数据时有泄露。如果我们不能很好的处理好大数据的网络安全问题,将给与我们的大数据时代造成较大的负面影响,也会直接影响到人们对于海量数据信息的使用效率与效果。