结点在线率和响应时间相关的P2P存储系统

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2010,46(28)ComputerEngineeringandApplications计算机工程与应用P2P存储系统是一种基于对等网络的数据存储系统,它可以提供高效率、鲁棒、容错和负载平衡的文件存取和共享功能。随着共享资源的应用要求越来越多,P2P存储技术得到了新的发展机遇,这种模式帮助用户实现了自由的数据交换和文件共享。P2P存储系统的实现基础是覆盖网络,即在底层拓扑结构中合理的组织和管理结点并设计路由。而其中最关键的是对结点的活动规律准确掌握,并据此对结点分组以及维护组内结点状态和设计数据放置策略。如果不考虑结点频繁的上下线行为,将导致系统所能提供的存储服务质量很差,降低数据的可用性。目前已有的资料和研究缺乏对结点活动规律的了解,因此无法考虑结点的可用性度量,进而影响了整个系统的可靠性评价。其主要原因有两点:对一个P2P网络系统的结点行为要完全掌握和控制非常困难;另外,P2P存储系统作为一个新的研究领域,对某一类特定的P2P网络结点活动规律进行测量,其结果不具有普遍效应。文献[1]分别对PlanetLab、微软企业内部桌面机和Maze这三个P2P系统的运行环境日志进行了详细分析,测量了不同环境中结点的动态性,并对不同环境的系统所表现出来的特征进行对比讨论。但是一般而言,要获得一个系统的完整运行日志并不容易。即使获得了这样的日志,也因为不同的应用领域和网络环境导致获得的日志不能满足实际系统的需求。结点在线率和响应时间相关的P2P存储系统刘志明1,2,沙基昌1,万亚平2,阳小华2LIUZhi-ming1,2,SHAJi-chang1,WANYa-ping2,YANGXiao-hua21.国防科技大学信息系统与管理学院,长沙4100732.南华大学计算机科学与技术学院,湖南衡阳4210011.CollegeofInformationSystemandManagement,NationalUniversityofDefenseTechnology,Changsha410073,China2.SchoolofComputerScienceandTechnology,UniversityofSouthChina,Hengyang,Hunan421001,ChinaE-mail:nhdxlzm@foxmail.comLIUZhi-ming,SHAJi-chang,WANYa-ping,etal.P2Pstoragesystembasedonon-linerateandresponsetimeofnode.ComputerEngineeringandApplications,2010,46(28):1-5.Abstract:Thispaperdesignsasemi-structuredP2Pstoragesystemarchitecture,whicheffectivelyreducestheproblemofoverlaynetworknotmatchingthelocationofphysicalnetwork.Semi-structuredP2Poverlaynetworkwhichcombinesthestructuredandunstructuredcharacteristicshasgoodscalabilityandmanageability.Thispaperassignsgroupaccordingtothere-sponsetimeofdetectionmessageandselectssupernodeaccordingtothereputationvaluewhichiscomputedthroughcom-biningon-linerateandresponsetimeofnode.Thesimulationresultsshowthatthedesignedstructurereducesjoinandexitnumberofmessagesthateachnodesendsandthesearchdelayofinformation.Itachievesgoodcustomersatisfaction.Keywords:semi-structured;responsetime;failuredetection;P2Pstoragesystems摘要:设计了一种半结构化的P2P存储系统结构,其有效地减少了结点在物理网络和覆盖网络中的位置不匹配问题。半结构化P2P覆盖网络综合了结构化和非结构化的特点,具有很好的扩展性和可管理性。所提出的半结构化P2P存储系统,通过检测信息的响应时间对结点分组,结合结点的在线率和结点的响应时间计算每个结点的信誉值,对组内每个结点按照信誉值大小排队,并以此为选择超级结点的依据。仿真实验表明,设计的系统结构降低每个结点加入和退出时发送的消息数量,减少了信息检索延迟,取得了较好的用户满意度。关键词:半结构化;响应时间;故障检测;对等存储系统DOI:10.3778/j.issn.1002-8331.2010.28.001文章编号:1002-8331(2010)28-0001-05文献标识码:A中图分类号:TP391⦾博士论坛⦾基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.70671051);湖南省教育厅资助科研项目(theScientificResearchFundofEducationDepartmentofHunanProvinceunderGrantNo.08C756)。作者简介:刘志明(1972-),男,博士生,副教授,主要研究领域为分布式计算、知识管理;沙基昌(1945-),男,博士,教授,博导,主要研究领域为管理科学、军事运筹学;阳小华(1963-),男,博士,教授,博导,主要研究领域为智能信息处理、可信计算;万亚平(1973-),男,博士,讲师,主要研究领域为网络存储技术。收稿日期:2010-05-25修回日期:2010-08-231ComputerEngineeringandApplications计算机工程与应用2010,46(28)P2P存储系统一般是构建在底层物理网络之上的逻辑虚拟层,实际P2P网络中的结点一般分布在一个广域网的环境中。系统为了掌握结点的“存活”状态,必须要不断地交换信息,包括心跳检测信息和数据的查询信息。如果对这些结点不加以组织,则系统会因为频繁地出现失效导致数据的不可用或者彻底丢失。但是,如果放任这些信息在网络中肆意转发,则会导致检测信息“洪灾”的泛滥,尤其是在一个开放性的P2P网络中。因此,基于结点的在线率和消息响应时间,设计了一种P2P存储系统。它考虑结点在网络拓扑中的历史表现以及检测信息的响应时间分组,根据系统性能的改变,始终保持稳定地选择性能最优的结点作为超级结点,并且在超级结点失效的情况下,迅速选举出一个新的超级结点代替失效结点的功能。1相关工作半结构化P2P网络得到了广泛的应用,其结合了结构化和非结构化的特点,具有很好的扩展性和可管理性。但该结构存在明显的不足之处:过分依赖超级结点导致系统易受攻击,从而引起网络不稳定;超级结点作为P2P网络的核心部分,因为受到攻击而失效或暂时退出会对网络造成的更大影响;超级结点承担的责任较重,容易产生负载平衡问题;超级结点的信誉不是非常可靠,容易主动失效。正因为半结构化拓扑网络存在这些缺点,所以迫切需要引入一些优化策略来提高目前P2P网络的性能。文献[2]采用冗余超级结点的思想优化底层覆盖网络。这种方法将会带来极大的带宽消耗。如果一些超级结点频繁退出系统,不愿意履行超级结点的职能,诚信度较低的话,系统稳定性低的问题也无法得到根本改变。文献[3]提出可以通过IP地址来获取底层物理网络拓扑的信息,即根据网络层获取的信息推断物理网络的拓扑结构,其需要DNS或者BGP(BorderGatewayProtocol)协议的支持。另外文献[3]也提出可以根据网络延迟来确定结点间的相对位置。通过网络延迟得到的物理位置,对底层网络的拓扑结构反映较好,具有更好的利用价值,可以对解决拓扑失配问题提供很好的技术支持。为了改善P2P网络中结点的物理位置与逻辑位置不匹配的状况,通过聚集半结构化P2P网络中物理位置相近的结点,文献[4]提出基于区域划分的超级结点选取机制,然而其对于物理位置比较分散的网络和动态IP网络的改善则并不是很明显。基于信誉感知[5]的超级结点选举算法,加入了信誉评测机制。根据结点提供服务的质量,计算结点信誉值,按照信誉高低排队,选择在线时间长、机器性能好的结点作为超级结点。Larrea在文献[6]中提出一种所谓“通信有效”的算法,其设定仅仅只有超级结点发送检测信息。其他超级结点优化策略比如H2O[7](Hierarchica12-levelOverlay),提供了一种非结构化P2P网络超级结点选举方法。超级结点向邻居广播自己的信息(例如带宽、在线时长、邻居数目、信誉等级),叶子结点存储这些广播信息。当叶子结点发送查询请求时,从已保存的超级结点信息中选择一个最好的发送请求。由于没有考虑结点的动态性,该方案同样存在着系统不稳定的问题。幂率分布“Power-law”规律[8]和小世界现象[9]表明,在现实生活中存在的网络拓扑结构,既不是DHT表现出来的确定性拓扑结构,也不是非结构化拓扑表现出来的完全随机图,更多表现的是一种半结构化结构。2存储系统模型P2P存储系统结点分布于不同的地理位置,行为特征大多数都不相同,因此无法很好地掌握结点的行为以及评价其信誉。但是在一个定义阈值合适的范围内,可以划分范围内的多个结点为一类,并且同类的结点可用性都处于比较相当的水平。系统以这些同类的结点组织成不同的分组,并选择一个或者多个超级结点对其管理,形成了一个基于组并分层的半结构化P2P拓扑。基于不同结点的在线情况和响应时间设计了一种P2P存储系统结构。其主要包括中心管理结点(CN)、超级结点(SN)和存储资源提供结点(RN),如图1所示。中心管理结点CN:系统的中心管理结点一般由系统中比较稳定的结点构成(可以认为,除非该结点硬件故障,此结点不会主动离线,具体该类结点由系统的实施者指定或者由所有超级结点选举产生),负责和超级结点之间的联系,其记录了系统中结点的分组信息和所有超级结点的相关信息:包括每个超级结点的标识符(ID)、信誉感知度评价、实际管理的资源提供结点的数目以及最大的结点管理数目。为了防止单点失效的问题,系统中心管理结点的数目至少为2个。多个中心结点之间互为备份,当某个中心管理结点失效,其他的中心结点能迅速接管其工作直到失效中心结点恢复为止。超级结点SN:超级结点负责管理系统中的存储资源提供结点RN,其不但提供存储资源服务,而且可以用来检索、查找和定位资源,记录每个RN结点的在线率和检测信息的响应时间,并结合一定的权值设置给以评分,并由此评分获得每个结点的信誉值,按信誉值对其管理的所有RN结点进行排队,从这些RN结点中选择信誉值最高的若干个结点充当候选超级结点,当SN失效的时候,重新选举一个综合评价值最高的候选超级结点升级为SN。超级结点在整个系统结构中处于承上启下的位置,相当于在中心管理结点和资源提供结点之间提供联系的一个通道。为了维护系统的健壮性,一般而言,会选择一定数目的候选超级结点以备当前超级结点失效的时候能够重新选举出一个新的超级结点对组内结点进行管理。如果组内的结点数目众多,从负载平衡的角度出发,还可以设置多个超级结点分担系统的管理任务和查询信息的转发,代价是增加了系统的一图1设计的半结构化拓扑结构示意图22010,46(28)致性维护成本。资源提供结点RN:资源提供结点可以自由地加入和离开系统,在加入之前首先必须从中心管理结点获得系统的分组信息以及组ID号,然后向相应的超级结点申请加入组,并注册自己所能提供的各种资源信息,比如存储空间的大小、网络带宽等。在某些特定的系统中,还需要新加入的结点作

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功