佘堃电子科技大学大数据非对称安全---隐私云案例提纲÷大数据时代÷大数据安全问题÷大数据的非对称安全方案÷抛砖引玉---隐私云÷隐私云的优势大数据时代1 ZB = 103EB = 106PB = 109TB = 1012GB=270B大数据时代!大数据是一个“时代”5大数据是一个时代6大数据定义÷大数据:无法在一定时间内用传统软件工具对其内容进行抓取、管理和处理的数据集合÷大数据=“海量数据”(∞0)+“复杂类型的对象”(∞1、∞2,……)÷涉及各个海量数据聚合领域ü电力、电信、经贸、教育、医疗、金融、石油、民航ü天文、气象、基因、医学、物理、互联网ü与人类社会活动有关的网络数据7大数据安全问题Ve=1Gbps124Gbps△mEk(△m)△c大数据安全问题传统加密保护的问题大数据在云中云中大数据无法加密:线性加密速率(如1GBPS)满足不了指数增长的数据加密的要求加密保护,Bit级更新和维护成本高:要求解密完整的数据,然后修改,又存储,相当于多了2次加密;针对大数据的1次加解密一不可行,何况2次;需要同态加密解决硬盘(包括U盘存储介质)被偷、丢失、抢等等,硬盘上有元数据和所有碎片数据块,信息丢失单用户—云(Client/Cloud)模式,云可以跟踪单个用户数据明文存储,责任不清,Safe问题:数据都在“强大”的云中、云中能知道用户放入云端的任何数据,用户端隐私数据受到严重威胁,安全责任如何划分和保证?大数据在用户端本地大数据加密不可行:线性加密速率(如1GBPS)满足不了指数增长的数据加密的要求加密保护,Bit级更新和维护成本高:同“大数据在云中”加密后,随机访问文件系统(FS)能力弱硬盘、U盘丢失,加了密,外界读不懂,大数据不加密,有泄漏威胁检索能力,同态加密检索效率太低,对多媒体数据同态加密检索,还没有好的方法每个用户各自负担自己的流量和存储成本,社会整体成本偏高,加上加密的PKI、KMI,成本更高社会化能力:技术上的“无能“,使得加密大数据没法泛化到社会化能力大数据非对称安全方案大数据非对称安全保护思想、元数据(切碎和云位置配方)与碎片数据块分离隐藏在云数据(配方)中3、“大量”碎片数据块放入多云的海洋中:每个云要找到2张“照片”块属于同一“照片”是NP难的,属于“真正的”数据挖掘隐私非对称安全保护被保护元数据表数据碎片云存储2、元数据隐私,本地保护,全世界只有唯一的用户终端拥有云存储新浪云阿里云百度云公开但随机混淆只有用户拥有抛砖引玉——隐私云隐私特性1、不想让不是圈子里的知道,又想让特定圈子里的人知道2、几乎不加密3、隐藏真实ID后,数据更不加密,被用于统计分析4、恶意攻击者会利用此隐私信息实施人身攻击、经济勒索统计安全问题隐私云解决方案安全中间件xMi安全中间件xMi公共云隐私云安全云专有云1、SSO,多云存储2、CDN高速、低成本3、服务集群也形成云隐私云的优势隐私云与传统云的不同元数据表数据碎片金山云隐私云(CDN)云存储百度云新浪云SSO切碎保存本地阿里云隐私非对称安全:速率优势假设:1、每个碎片一样大:N比特,一个文件i大小:miN比特2、有足够的云数量,让每个碎片存到唯一的云每个云对每个终端的上下载速率都是dbps则良好线路的传递:1、mi个多云对文件i上下载时间:tcs1=N/d2、传统单云文件i上下载时间:tcs2=miN/d多云速度增加了mi倍!元数据表数据碎片金山云Amazon阿里云百度云新浪云切碎保存本地上下传隐私非对称安全:一定的自扩展性假设:一个文件i总大小增大可令切碎碎片数量mi增大,即每个碎片大小N不变可达到总体文件大小miN增大则,1、mi个多云针对文件i上下载时间:tcs1=N/d——不变2、传统单云文件i上下载时间:tcs2=miN/d——呈线性增长!tcs2tcs1文件大小(bit)上传下载时间隐私非对称安全优势:安全1、元数据与碎片数据分离:多元分离2、元数据隐私,本地保护,全世界只有唯一的用户终端拥有,可以加密、数字签名保护3、碎片数据块随机混淆放入云的海洋中:用户i在云j中拥有mi个碎片,每个碎片等大小,文件名随机取得,没有边界差异,则从j云Nj个总碎片中找到用户i的mi个碎片的概率:pij=1/𝒎𝒊𝑵𝒋所以,从n个云中的N=∑Nj𝒏𝒋)𝟏总碎片中找出所有用户i的碎片的概率为p=∏𝒑𝒊𝒋𝒊)𝒎𝒊;𝒋)𝒏.)/;0)/如果云足够多,提供的服务一样,则每个云最多只有文件的一个碎片,则mi=1,p=∏𝒑𝒊𝒋𝒊)𝒎𝒊;𝒋)𝒏.)/;0)/ =∏𝟏/N𝒋𝒋)𝒏0)/想想看Nj都是1亿以上,pà0隐私非对称安全优势:还需要更安全1、隐私在CSA的标准中也是分级的2、基于Shamir的秘密共享、基于CDMA编码、基于DHT的快存与定位等等隐私云非对称安全方案和优势传统加密保护的问题隐私云非对称安全方案非对称安全方案优势大数据在云中云中大数据无法加密:线性加密速率(如1GBPS)满足不了指数增长的数据加密的要求云深不知处:云中数据都是碎片块,不需要加密,碎片数据随机散落于多个云中,安全性依赖于“砸碎瓶子,然后用玻璃碎片恢复瓶子”数据挖掘难题访问速度快:类似P2P,多云线速利用最大化,具有一定的扩展性数据明文存储,责任不清,Safe问题每个云中碎片数据块是不同用户随机存入的,每个云“看”不到某个用户的完整数据隐私保护:云大概率将碎片块当做垃圾,不知道其物理意义,云的责任只是存储硬盘(包括U盘存储介质)被偷、丢失、抢等等,硬盘上有元数据和所有碎片数据块,信息丢失元数据与碎片数据物理分离:没有客户的元数据,云中碎片磁盘丢失,又是数据挖掘难题隐私保护:云中硬盘中数据大概率被当做0、1垃圾加密保护,Bit级更新和维护成本高只对要修改的Bit、Byte的碎片数据块(如1MB)下载、修改、上传数据块所在的云,其他块和云不受影响Bit级修改速率快单用户—云模式,云可以跟踪单个用户统计安全:只能访问多个用户、单用户多个文件等的统计信息,但不能定位单用户、单数据块具体内容确保统计安全隐私云非对称安全方案和优势传统加密保护的问题隐私云非对称安全方案非对称安全方案优势大数据在用户端本地大数据加密不可行:线性加密速率(如1GBPS)满足不了指数增长的数据加密的要求非对称安全,隐私就在元数据中:真正的大数据不加密,切成碎片,随机放入不同的云中,而全世界只有用户自己拥有自己的元数据---隐私大数据的保护转为传统小数据的保护:元数据大小=真实数据大小/20万5MB元数据管理1TB加密保护,Bit级更新成本高同“大数据在云中”同“大数据在云中”随机访问文件系统(FS)能力弱PFS(隐私文件系统),速度、操作上的透明(完全感觉就是本地操作)PFS透明,快,不改变习惯硬盘、U盘丢失,加了密,外界读不懂,大数据不加密,有泄漏威胁元数据加密,丢失,读不懂;单云中数据丢失,不损失全部数据非对称安全:云上磁盘丢失,只丢失部分数据,难以定位数据的内容和归属检索能力,同态加密检索效率太低,对多媒体数据同态加密检索,还没有好的方法1.元数据上做检索,数据量小而快2.检索表在元数据中,选择性共享3.拷贝只拷贝云数据提供粗、中、细多粒度的检索;分享检索,提供隐私保护;拷贝公证留痕每个用户各自负担自己的流量和存储成本,社会整体成本偏高,加上加密的PKI、KMI,成本更高隐私云统一负担多个用户的流量和存储成本,统一与运营商和云存储服务商谈价,存储由隐私云统一调度成本低廉:类似CDN云模式,降低了整个社会隐私存储的整体成本社会化能力:技术上的“无能“,没法泛化到社会化能力技术上的突破,帮助建立相应的社会化制度,包括条例、法律和保险Security转化为Safe:充分利用成熟社会保障资源非对称安全,隐私就在元数据中:全世界只有用户自己拥有自己的元数据---隐私数据的归属的不可抵赖,即拥有权的确立数据尊严:等同人的尊严,附在隐私数据上,SecurityàSafe隐私数据立法、数据尊严立法数据产权、数据遗产非对称加密:全世界只有用户自己唯一私钥数字签名的不可抵赖性数字签名等同于手写签名,SecurityàSafe数字签名立法电子支付、电子商务Thankyouforyourattention感谢您的关注!