新疆农业大学科学技术学院课程论文题目:P2P的应用与发展课程:计算机网络姓名:专业:班级:学号:座位号:指导教师:职称:2014年05月20日P2P的应用与发展作者:娄光绪指导教师:王红梅摘要:自P2P技术从1999年出现之后,现在已经发展繁荣起来。由于P2P构架灵活,适用面广阔,所以将P2P应用到新领域的现象层出不穷,P2P的软件产品也如雨后春笋一般爆炸性增长。通过本文的描述可以看出,P2P的基本原理是容易实现的,人们的研究方向向也由基础架构的构建和维护及优化算话等桎梏中摆脱出来,开始深入到P2P技术的根本性问题中去。P2P网络彻底消除了对中央服务器的需求,可以让用户彼此之间直接搜索和交换数据,为共享资源的有效实现奠定了基础。本文浅析了P2P技术应用的几个方面,其本身存在的问题。关键词:P2P交换数据共享资源中央服务器TheApplicationandDevelopmentofP2PNameLouGuangxuTeacher:WangHongmeiAbstract:SinceP2Ptechnologyfromafter1999appears,hasnowgrowntoflourish.SinceP2Parchitectureflexible,broadapplicability,sotheP2Papplicationstonewareasemergingphenomenon,P2Psoftwareproductsarealsospringingupingeneralexplosivegrowth.Ascanbeseenfromthedescriptionherein,thebasicprinciplesofP2Piseasytoachieve,peoplehavetogetouttotheresearchbytheconstructionandmaintenanceofinfrastructureandoptimizationcountwordssuchasshackles,begantogodeepintothefundamentalissuesofP2Ptechnologytogo.P2Pnetworkseliminatetheneedforacentralserver,allowinguserstoeachotherandexchangedatabetweenthedirectsearchforeffectivesharingofresourcesofthefoundation.ThispaperanalyzesthetechnicalaspectsofP2Papplications,anditsinherentproblems.Keywords:P2Pexchangeofdatacenterserverstoshareresources引言:P2P是一种分布式网络,网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共享资源需要由网络提供服务和内容,能被其它对等节点(Peer)直接访问而无需经过中间实体。在此网络中的参与者既是资源(服务和内容)提供者(Server),又是资源(服务和内容)获取;它具有非中心化、可扩展性、健壮性、高性价比、隐私保护、负载均衡的特点等。1P2P概述1.1P2P发展简史1999年,文件共享系统Napster诞生。Napster是最早的P2P实用系统,参与系统的是大量个人计算机用户,每个用户将自己愿意共享的文件提供出来,同时可以下载其他用户共享的文件。Napster需要解决的核心问题是必须知道哪些机器上有哪些文件,这样当用户提出文件搜索请求时才可以得到正确的匹配结果。Napster在初期取得了巨大成功之后,很快遇到版权问题的困扰。由于Napster上共享的文件有很多是音乐媒体文件,这些音乐媒体在未被授权时是不允许被广泛传播的。而Napster的目录服务器恰恰为这些文件的传播提供了支持,因此Napster很快受到音乐著作方为保护版权而发起的挑战,并于2001年被迫关闭。Napster第一次验证了P2P思想在广域网范围内的可行性,在Napster关闭之后,更多的P2P文件共享系统迅速崛起,成为Internet发展的一股巨大浪潮,其中最著名的是Gnutella和KaZaA。近期,P2P文件共享系统的版权问题也开始逐步得到解决,Napster在关闭之后被音乐软件生产商Roxio公司收购,Naspter网络被转而成为合法的软件发布渠道。之后,由于业绩看好,Roxio公司更名为Napster,并于2005年1月在纳斯达克上市。目前,Napster的全球注册用户已超过7000万。图一为P2P的网络构成示意图图一1.2P2P需面临问题及解决之道在P2P发展的今天,P2P需要面临着许多问题,例如版权问题国外Napster、Gnutella,国内Verycd、迅雷都遇到这样的问题。解决之道:视频播放应用领域的广告收入买版权的方案。吞噬网络带宽(从全球来看,晚上时段的网络带宽有95%被P2P占据)早期Bt应用软件遭到ISP的封堵。解决之道:P4P标准(ProactivenetworkProviderParticipationforP2P)(传统的P2P方式下数据节点和传输是随机的,也就是说这种传输方式可能占据任意一个网络节点或者出口的带宽。而P4P则是智能选取数据交换对象,更多的通过智能运算选择同一路由器或者地域性网络来进行数据交换,最大程度上解决大型节点和网络出口负载,同样通过智能选择数据交换对象也能大大提高数据传输能力。举例来看。西工大的用户就可以优先和本校的用户来实现文件片段的交换,再扩展至较远的地区,有十分的必要时,才会出国进行文件片段交换。当然,P4P的运行机制,要远远超过“同城交换”的概念,它还会根据用户的上行、下载带宽进行综合判断,以进行最有效选择,最大化整体交换的效率。值得一提的是,P4P的开山鼻祖是一位工作在耶鲁大学的中国人,谢海永博士。谢博士系美国分布式计算工业联盟(DCIA)和P4P工作组的首席研究员,提出并完成了P4P理论和系统设计。这项中国人主导的发明,在商业测试中有出色表现。根据Verizon的反馈,使用P4P技术,P2P用户平均下载速度提高60%,光纤到户用户提高205%~665%。此外,运营商内部数据传送距离减少了84%。用户有58%的数据是来自同城,较传统P2P的6.3%比例有了近10倍提升。管理困难(P2P网络的精髓在于其乌托邦式的管理方式)相对于C/S,P2P:传输内容不易控制,垃圾信息,黄色信息另外,Peer用户用户认证困难。图二为P2P与C/S图解决之道:管理的P2P应用,如Skype.协同软件图二技术标准的定制P2P技术各向发展,开发资源统一合力,标准迟迟未能确定。解决之道:Intel的P2P网络分层协议,Sun的jxta。1.3P2P的应用对于目前在internet网上的普通用户,很多应用基本都采用了P2P技术图三为P2P的应用图图三2P2P的实现原理2.1P2P的资源定位P2P资源定位技术为P2P系统提供了拓扑构造、消息路由和资源搜索等关键性基础功能。因此,P2P资源定位技术是P2P基础性关键技术。P2P系统具有的规模巨大和动态性强等特点给P2P资源定位技术带来了很多挑战。所以,P2P资源定位技术具有自己独有的要求:应采用分散式(deeentraliezd)的结构,通过有效的分布式算法来实现资源定位,尽可能不依赖于少数中心服务器;应能适应不同结点规模的P2P系统,能够支持大规模的结点和资源;应能够自适应系统中结点的动态加入或退出,提供相对稳定的资源定位服务;应能够提供一定的容错能力,在部分网络连接或结点失效时仍能保证系统的可用性。目前,针对非结构化拓扑的P2P系统采用的资源定位方法主要有:使用中央目录服务器来支持资源定位,通过受限泛洪(nooding)技术实现的资源搜索,随机搜索等技术等来实现资源的定位,但总体说来,非结构化拓扑P2P系统中资源定位技术的可扩展性和性能较差、资源定位的效率和准确率难以保证等问题仍相当突出,有待深入研究。结构化拓扑的P2P系统通常采用分布哈希表(DisrtibutdedHashTable)方法作为资源定位技术。DHT方法中同时实现了P2P系统的拓扑构造、消息路由和资源搜索三大功能。在DHT方法中,每个结点都有唯一的结点标识(如通过哈希函数根据其Pl地址得到或根据某种规则动态创建),系统根据结点标识构建PZP网络拓扑。每个结点都维护一个“路由表”,保存相关邻居结点的信息。DHT消息路由过程与PI路由过程相似,每个结点根据其“路由表”将消息转发到相应的邻居结点上,直到消息最终到达目标结点。当结点加入或退出时,各相关结点需要修改路由表,并动态调整,以维护分布哈希表的一致性。2.2Nat穿透在计算机科学中,NAT穿越(NATtraversal)涉及TCP/IP网络中的一个常见问题,即在处于使用了NAT设备的私有TCP/IP网络中的主机之间建立连接的问题。会遇到这个问题的通常是那些客户端网络交互应用程序的开发人员,尤其是在对等网络和VoIP领域中。IPsecVPN客户普遍使用NAT-T来达到使ESP包通过NAT的目的。尽管有许多穿越NAT的技术,但没有一项是完美的,这是因为NAT的行为是非标准化的。这些技术中的大多数都要求有一个公共服务器,而且这个服务器使用的是一个众所周知的、从全球任何地方都能访问得到的IP地址。一些方法仅在建立连接时需要使用这个服务器,而其它的方法则通过这个服务器中继所有的数据——这就引入了带宽开销的问题。两种常用的NAT穿越技术是:UDP打洞和STUN。除此之外,还有TURN,ICE,ALG,以及SBC。2.3数据处理数据处理是对数据的采集、存储、检索、加工、变换和传输。数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据的形式可以是数字、文字、图形或声音等。数据经过解释并赋予一定的意义之后,便成为信息。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响着人类社会发展的进程。图四为数据处理流程图四3P2P的改进和新趋势3.1P2SP就是下载不再象传统方式那样只能依赖服务器,内容的传递可以在网络上的各个终端机器中进行。P2SP除了包含P2P以外,P2SP的“S”是指服务器。P2SP有效地把原本孤立的服务器和其镜像资源以及P2P资源整合到了一起。图五为P2SP实际流程图图五3.2P4PP4P全称“ProactivenetworkProviderParticipationforP2P”,是P2P技术的升级版,意在加强服务供应商(ISP)与客户端程序的通信,降低骨干网络传输压力和运营成本,并提高改良的P2P文件传输的性能。与P2P随机挑选Peer(对等机)不同,P4P协议可以协调网络拓扑数据,能够有效选择Peer,从而提高网络路由效率。图六为P4P的示意图图六4总结P2P技术得势于其开放性,自1999年产生以来,不断的在改进和优化;同时在PC计算机存储能力大力提升,互联网带宽高速扩充的时代节奏下,P2P是一种趋势。由于P2P构架灵活,适用面广阔,所以将P2P应用到新领域的现象层出不穷,P2P的软件产品也如雨后春笋一般爆炸性增长。通过本文的描述可以看出,P2P的基本原理是容易实现的,人们的研究方向向也由基础架构的构建和维护及优化算话等桎梏中摆脱出来,开始深入到P2P技术的根本性问题中去。最新的研究成果表明,不少研究人员开始将重心转入到覆盖层网络中的节点延时时聚集研究、覆盖网之间优化研究、P2P支撑平台研究以及P2P安全的研究等方面。相信随着对P2P技术研究的不断深入,人们能够对P2P计算有一个更深入的认识并解决目前P2P安全方面的研究等方面。相信随着对