第18卷第12期系统仿真学报©Vol.18No.122006年12月JournalofSystemSimulationDec.,2006基于关联规则的HLA动态数据分发策略刘胤田1,2,唐常杰1,吴征宇3,曾涛1,陈鹏1(1.四川大学计算机学院,四川成都610065;2.南京陆军指挥学院,江苏南京210045;3.炮兵学院南京分院,江苏南京211132)摘要:针对HLA数据分发,提出了基于关联规则的动态数据分发策略,主要工作有:(1)提出基于关联规则的动态数据分发思想。(2)设计了描述仿真系统成员之间数据交互情况的发布订购树(PS-Tree)。(3)基于PS-Tree挖掘关联规则,实现动态数据分发策略。(4)给出动态数据分发策略性能的量化分析。实验结果说明动态数据分发策略通过提高组播资源利用率,有效实现了基于值的数据过滤,减少了冗余数据的发送与接收,从而提高仿真系统的实时性、稳定性。关键词:高层体系结构;数据分发管理;关联规则挖掘;组播优化中图分类号:TP391.9文献标识码:A文章编号:1004-731X(2006)12DynamicDataDistributionStrategyofHLABasedonAssociationRuleLIUYin-tian1,2,TANGChang-jie1,WUZheng-yu3,ZENGTao1,CHENPeng1(1.SchoolofComputerScience,SichuanUniversity,Chengdu610065,China;2.NanjingArmyCommandCollege,Nanjing210045,China;3.NanjingArtilleryAcademy,Nanjing211132,China)Abstract:ToensuretheefficiencyofdataexchangebetweensimulationmembersviamulticastgroupsinthesimulationsystembasedonHLA,themethodofdynamicdatadistributionstrategywasproposedbasedonassociationrule.Themaincontributionsinclude:(1)ProposingtheconceptofdynamicdatadistributionstrategyofHLAbasedonassociationrule.(2)ProposingthestructureofPublishing&SubscriptionTree(PS-Tree),whichcanmanifesttherelationshipofdataexchangebetweensimulationmembers.(3)Givingthemethodtomineassociationrulesofthepublishing&subscriptionrecordssetviaPS-Treeandformingtheforwardingtablewhichrealizesthestrategyand(4)Analyzingtheperformanceofdynamicdatadistributionstrategy.Experimentshowsthatthestrategyimprovestheefficiencyofdataexchangebecauseofthemoreefficientuseofmulticastgroupsresource.Keywords:HLA;DDM;associationrulemining;multicastoptimizing引言高层体系结构数据分发管理服务(HLADDM)[2-6]通过区域匹配实现基于值的接收方数据过滤,并利用组播技术在数据发布方与订购方之间实现数据交互,有效地减少了系统数据交互过程中的网络流量和仿真成员的数据处理负担,降低了数据传输延迟,保证了各仿真成员间数据的实时交互和同步。在此基础上,XuChun-lei[7]提出了基于多层次网格的高效相关过滤方法,克服了均匀网格方法匹配精度低,格子尺寸单一,难以适应所有实体的缺点,具有快速灵活的特点;ZhangYa-chong[8]提出了一种根据发布订购关系动态调整分配网格组播地址的模型。上述研究主要致力于解决区域的匹配及区域与组播地址的映射,解决了同类型数据通过区域匹配基于值的接收方数据过滤,并利用组播技术有效减少了数据发送方的数据处理负担和网络带宽的占用。但在系统层次上灵活有效地实现数据的有效传输与交互方面研究不够,要真正实现基于值的接收方数据过滤,下列问题亟待解决:z无效数据的接收问题。组播资源有限,同一区域可收稿日期:2005-09-16修回日期:2005-11-09基金项目:国家自然科学基金(60473071),高等学校博士学科点专项科研基金SRFDP(20020610007),四川省青创工程(2004AA0350)。作者简介:刘胤田(1972-),男,四川隆昌人,博士生,研究方向为数据库与知识工程,作战模拟;唐常杰(1946-),男,博导,教授,研究方向为数据库与知识工程。能覆盖多个不同的组播通道,同时不同的对象类实例属性所绑定的区域也可能覆盖同一组播通道,使得不同区域不同对象类实例的不同属性都会通过同一组播通道从不同的数据发布方发出。数据订购方能根据区域匹配结果选择对相应组播通道的主动侦听,但只能被动接收数据发布方发往相应组播通道的所有数据并进行二次过滤以找出自己订购的数据(称其为有效数据)。数据订购方通过组播通道接收到有效数据的同时,也接收了大量未订购的其它对象类实例属性,甚至是同一对象类实例的其它属性(称其为无效数据)。z接收方数据处理负担问题。数据订购方被动地接收大量无效数据,必须对所有接收数据一一进行判断,以过滤出自己订购的数据,增加了接收方数据处理负担。z组播资源利用效率问题。由于数据分布的不均匀及随着时间的推进,数据分布态势会动态改变,造成各组播通道数据流量的不均匀及无效数据的传输,使系统在整体上对于组播资源的利用率不够高。为解决上述问题,本文提出了基于关联规则的动态数据分发策略。其基本思想是:(1)充分利用组播地址资源。找出利用率不高的组播通道,关闭这些通道,并将这些通道的有效数据通过数据发布方与订购方之间其它的组播通道进行转发,避免无效数据的发送与接收,同时减少对低效率组播通道的维护开销;(2)进行数据转发时尽量减少相同数据在发布方的重复发送,以减少发布方数据处理负担和节约网第18卷第12期Vol.18No.122006年12月系统仿真学报Dec.,2006络带宽;(3)避免因数据转发产生新的无效数据。本文其余部分组织如下,第1节给出与数据分发的相关符号及术语,第2节介绍系统发布订购树PS-Tree,第3节阐述基于PS-Tree的关联规则挖掘,第4节给出基于PS-Tree的动态数据分发策略实现方法,第5节对动态数据分发策略的性能进行定量分析,第6节通过实验分析了动态数据分发策略的性能,第7节给出总结和下一步的相关研究工作。1符号及术语利用关联规则方法挖掘HLA分布交互式仿真系统的数据交互关系,需要把仿真成员之间的发布与订购事件转换为相应的发布订购记录,相关符号及术语描述如表1。表1符号术语表符号解释Imi组播地址项Iai对象类属性项Ipi发布成员项Isi订购成员项Iri区域项(Ir,{Im})Ir覆盖的组播地址项集{Im}(Is,Ir,Ia)Is带区域Ir订购属性项Ia(Ip,Ir,Ia)Ip带区域Ir注册对象实例属性Ia(Is,Ia,Im)订购记录(Ip,Ia,Im)发布记录(Ip,Is,Im,Ia:count)发布订购记录{(Ip,Is,Im,Ia:count)}系统发布订购记录集{(Ip,Is,Im,Ia,Im’)}系统数据转发记录集在军事仿真系统中,根据HLA规范及仿真环境,在形成系统发布订购记录集的过程中,应考虑到以下几点:(1)订购整个路径空间数据的仿真成员,如态势显示联邦成员,它需要获取各成员所有区域的数据,而自身很少发布数据,这类成员不参与发布订购记录集的生成。(2)带区域订购基于类层次,同一区域可与多个不同对象类属性绑定,同一对象类属性也可与多个区域绑定;带区域注册实例及实例属性与区域的绑定基于对象实例层次,同一区域可与多个同类及不同类对象实例的属性绑定,但一个对象实例属性只能和一个区域绑定。(3)一个区域只与一个发布或订购成员也即区域定义者绑定。(4)Is接收到Ip通过Im发送的对象实例属性Ia,如果Ia在Is的订购范围内,生成一条发布订购记录(Ip,Is,Im,Ia:1),如果Ia不在Is的订购范围内,则生成一条发布订购记录(Ip,Is,Im,Inull:1),表明Ip通过Im向Is发送了一条无效数据,其中属性项Inull表示接收的数据为无效数据。定义1仿真系统成员间的数据交互是一个五元组E=(∑Ip,∑Is,∑Im,∑Ia,∑δ),其中:(1)∑Ip是系统所有数据发布成员Ipi的集合。(2)∑Is是系统所有数据订购成员Isi的集合。(3)∑Im是系统所有组播地址资源Imi的集合。(4)∑Ia是系统所有对象类属性Iai的集合。(5)∑δ是系统所有发布订购记录δi的集合,δi=(Ip,Is,Im,Ia:count),描述了数据发布方Ip与接收方Is通过组播通道Im交互的对象类属性Ia及计数count。仿真系统按时间步长向前推进过程中,某一步的发布订购记录集记为PubsubSet,在两时间推进间隔之间增加的发布订购记录集记为PubsubSetNew,减少的发布订购记录集记为PubsubSetDel,二者合称发布订购记录调整集。2系统发布订购树(PS-Tree)对于发布订购记录集PubsubSet={(Ip,Is,Im,Ia:count)},每条记录描述了一定计数的同一对象类属性数据从发布方到接收方的传输过程。接收方与订购方都是指数据订购者,订购旨在说明订购者获取有效数据,而接收描述了订购者被动地从组播通道接收发往此通道的所有数据,无效数据也会由不同的数据发布方通过组播通道发往订购者。为体现整个系统数据交互的流向、流量及效率,引入发布订购树(PS-Tree)。定义2发布订购树(PS-Tree)是一棵深度固定为5的扁平式倒树,它可以描述一个系统在整个仿真过程中的数据交互情况,其中:(1)第零层节点为树的根节点root,第一层节点集为发布成员Ip项的集合,第二层节点集为订购成员Is项的集合,第三层节点集为组播通道Im项的集合,第四层为树的叶子节点,描述了对象类属性Ia项的集合。(2)发布订购记录集中的每一条记录对应树的一条分枝,其路径由根节点root开始,其子节点为发布成员项Ip;各Ip项节点的子节点为数据订购成员Is项;各Is项节点的子节点为组播通道Im项,代表Ip-Is之间传输数据的通道;各Im项节点的子节点为对象类属性Ia项,代表Ip-Is之间通过Im传输的具体数据内容。(3)由根节点到叶子节点的一条节点链构成树的一个分枝,不包含根节点和叶子节点的一条节点链构成树的一条路径。(4)各节点标注了其传输的数据量计数(包括有效数据及无效数据),与父节点、子节点及同名项节点的链结,Im层节点还标记了一条路径在动态数据分发策略中承担的角色。(5)PS-Tree中各分枝可以共享节点,共享度通过各节点的计数体现。作为PS-Tree的构造示例,设发布订购集PubsubSet的前五条记录值为(Ip1,Is2,Im3,Ia1:1),(Ip1,Is3,Im3,Ia2:3),(Ip1,Is3,Im4,Inull:7),(Ip2,Is2,Im4,Ia1:5),(Ip2,Is3,Im5,Ia2:2)。对第一条记录(Ip1,Is2,Im3,Ia1:1),描述了1个计数的对象类属性Ia1由发布成员Ip1经由组播通道Im3传送至接收成员Is2,为构造PS-Tree的第一个分枝,以Ip,Is,I