超小世界移动互联网工程院2013-02-XY-001咨询项目小组李幼平2014网络科学论坛发言稿活版巨媒体的文化创意•群聚全国几万种媒体的内容,形成巨媒体,通过卫星提供给全国自由下载•如果没有数据举证,人们很难相信一个卫星转发器有能力把几万种媒体的全部内容推送全国•北大李晓明团队十年统计,除去长视频,全国平面媒体、网页媒体和广播媒体当天全部内容50GB/天•加上全国年产3万小时标清长视频,海量媒体内容的日均增量约为100GB/天。•卫星和地面无线电转发带宽大于39Mbps,即日推量大于400GB/天,可将全国海量内容推送不止一遍•做一件大事:90%web网页的D值0-3跳突破“六度分离”心里极限•平均路程长度D(averagepathlength)是复杂网络的第一参数•互联网出现前,Milgram的“六度分离”推断:若全球人数N=70亿人,D=6=2(lnlnN)•Web应用后实测,90%网页分发跳数落入23D6,没有突破6跳,6成为一种难以突破的心理极限•2009年《PHYSICALREVIEWLETTERS》发表题为《NavigatingUltrasmallWorldsinUltrashortTime》,指出贪婪路由的理论极限D=lnlnN=3•D=3迄今停留于理论模型,没有工程方案•六院士发现:引入内容计算后,可由卫星/无线移动网实施D3的超小世界网络•在CDN、P2P、PPCache、ACR之后,平均分发跳数实现小于3跳的整体突破2006年中国web距离050001000015000200002500030000350001357911131517192123252729DiameterFrequency2010年中国web距离六位院士的中国梦•咨询项目编号:2013-02-XY-001•所属学部:工程院信息与电子工程学部•项目名称:最少跳数内容分发李幼平,中国工程院信息学部院士邬江兴,中国工程院信息学部院士俞大光,中国工程院信息学部院士宋家树,中国科学院技术学部院士陈式刚,中国科学院数理学部院士张信威,中国工程院能源学部院士罗军舟,东南大学计算机学院院长•期望目标:90%web网页的D值0-3跳•预定结题日期:2014,4•协同团队:东南大学未来网研究中心如图1下半部所示,传统TCP/IP单播结构需经历6至23跳的路由转接,才能从远处网站取来网页。图1上半部的卫星播存结构事先把内容存入家庭WiFi或基站后台,获取网页的跳数将以很大的概率降至3跳以下。如下表所示,我们从物理学、计算科学、拓扑学、统计学、社会学等多种视角判断,拓展毕升的活版智慧•毕升把汉字单字看成是“灵活可聚可分的文化基元”,发明了活字印刷术•网络时代,内容用IP网页表达,网页成了大数据年代“灵活可聚可分的文化基元”•活版印刷是依托语义聚分汉字,网页呢?•人们沿着B.T.Lee有关语义网(semanticweb)的方向努力了十几年,并没有出现预想的突破•现实迫使我们另寻出路,改用语义的聚类抽象即“话题”(topic)来引领网页对网民的灵活适配•语题有可能成为未来网络新的细腰语题成为未来网络新细腰、•人们不喜欢重复的语义,却喜欢重复的话题:重复的话题可积累更多先验知识,产生更多的疑惑•信息论说:信息的收获正比于疑惑的解脱•体现“优先连接性”是无尺度网络的微观成因•一个话题吸引并组织起一个信息社区(info-community),聚类一批相同求知兴趣的网民•一个话题也是一个网页池,聚类起一批批作者源源不断地把作品投入网页池•无限网页借“有限话题”与无限网民无缝对接•不管出现什么新鲜网页,网络总会在第一时间主动把该网页送给对它有兴趣的网民•网页自寻网民(Homingpage)的社会效果•话题是内容网络(CCN)的细腰(waist)话题词典已经存在几十年•每个网站天天都通过主页向网民通报,本网站的什么话题(栏目)出现了什么新鲜的网页。•把上万种网站自定义的话题结构罗列出来,就可以得到一本“海量媒体的话题词典”•假设媒体总数少于64k种,每个网站的话题数少于256种,用一个24bit的代码就可以准确定位一种话题•基于这一发现,全国中文新闻信息标淮委员会接受东南大学提出的《UCLCODE格式》建议,正式开展“统一内容标签UCL”国家标准的起草工作新国标:统一内容标签UCL•全国中文新闻信息标委会接纳“新细腰”的创意,正式启动“统一内容标签UCL”标准的起草工作•UCL是一种1kByte的短包,内含话题信息、语义信息与管理信息,管理信息中128Byte的哈希指纹,保证内容不可篡改与责任不可抵赖•卫星转发是一种难以施加攻击的非开放物理信道,UCL的时戳又具有“时不再来”的唯一性,同时篡改指纹与内容,几乎是不可能的•在向个人提供充分自由的知情权的前提下,按国内法建立网络秩序,保证内容的安全可信•中国可以做到:自由与秩序兼得增添互联网第二结构•如上图下半部所示,传统TCP/IP单播结构需经历6至23跳的路由转接,才能从远处网站取来网页。•图1上半部的卫星播存结构事先把内容存入家庭WiFi或基站后台,获取网页的跳数将以很大的概率降至3跳以下。•如下表所示,我们从物理学、计算科学、拓扑学、统计学、社会学等多种视角判断,互联网增添“广播存储”的第二结构,已经是大势所趋•给国家三网融合的景愿,画上一个园满的句号相异相成的双结构互联网比较项目第一结构Primary第二结构Secondary物理学双向对流,有冲突分享单向辐射,无冲突共享计算科学基于地址的路由计算基于内容的匹配计算拓扑学一点对另一点一点对无限点数学模型泊松分布随机网络幂律分布无尺度网络目标分工不限作者数,各献所知不限读者数,各取所需社会价值体现全球一体:自由开放落实国家主权:依法治网服务方式读者搜寻内容内容自寻读者小世界性质6≤D≤23,小世界网络D≤3,超小世界网络主要协议TCP/IPUCL/IP(待创建)梦想有待政府、市场双重认可•政府撑握卫星与移动通信网两大资源•中国的百万2G/3G/4G基站,再加上数量更多的家庭WiFi,形成“少跳数、超扁平”国家基础施•经历境外攻击,卫星转发技术的安全性大有进步•整合卫星与移动网资源,营建双结构互联网•ICP依托卫星把它的内容第一时间传播全国•ISP依托移动网中的存储环节提高服务质量•中国移动互联网出现简约约跳数的飞跃•地不分南此、家不分贫富,人人都可以用UCL过滤下载有兴趣的话题,得到“网页自寻网民”的信息服务支持一体两翼的发展战略•习近平同志在2月27日主持召开中央网络安全和信息化领导小组第一次会议时说:“网络安全和信息化是一体之两翼、驱动之双轮,必须统一谋划、统一部署、统一推进、统一实施”•2013年学部级咨询《最少跳数内容分发》项目建议,现有IP报头添加16字节的选项代码UCLcode,整合我国有一定优势的无线移动网资源和卫星转发资源,直接形成安全的互联网第二结构提醒网络设计者:抑制对带宽消费的过度贪婪