效用函数研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

效用函数研究报告003《一种TCP博弈模型的Nash均衡存在性分析与仿真》在TCP博弈中,当网络对任意流没有额外的处罚时,用户i的收益函数表示为:(,)()()iiiiiGaYuaDY。Y为此时链路的资源使用率,12(,,...,)nYfaaa,()iiua为用户i采取哪的策略时的效用,()iDY为链路上产生拥塞时.对分组的时延和丢弃所造成的拥塞成本。005《P2P环境中基于信号博弈论的资源定价机制》根据需求曲线和供给曲线的交点,即是均衡价格和均衡质量值.所以,可求出局部均衡价格*p,均衡质量*q,既均衡解为(*p,*q)。在确定信号传递模型时,从卖方以局部均衡价格作为出售价格来分析自身利益最大化的信号.局部均衡价格是卖方卖出资源的可能性最大的价格.所以,提供方在获得局部最优解后,根据自身的效用最大选择质量信号,进行资源定价,卖方也可以根据均衡价格,适当的调低或调高定价,这由卖方的个人喜好而定,资源可靠性为t,信号量为s,在不考虑交易是否成功时的卖方的效用为***()(1)()()(1)ssupqttpqspqts由于交易并不一定成交,因此在信息不对称的环境下,交易是否成交和价格p,及信号量s的选择有关,假设成交的可能性与价格和信号量的关系为(,)/lspksp,式中k是常量.当交易成功时,节点获得的收益为u;不成功时获得的收益为0.由此。确立新的卖方效用函数***2()(/)(1)(/)Upqkpstkps008《一种基于博弈论的P2P内容分发协议》本文通过博弈论的机制来激励节点间进行协作,促使网络中彼此互为邻居的节点同时成为对方的内容下载者与上传者.把该系统建模成一个非协作博弈,博弈主体为接收服务器S所分发数据包的所有节点.每个节点选择一种策略以决定自己如何执行博弈.数据包的下载收益和上传成本这两个因素是节点选择个人博弈策略的主要参考依据.其中,节点可以选择参加系统的协作(CA),贡献带宽和服务;或者不参加系统的协作(UCA),保持自私的行为.性能分析表明,最终每一个节点都不愿意独自偏离依照博弈理论所选定的协作策略即遵守本文设定的激励机制,达到对所有节点均最优的纳什均衡。收益值是节点所收到的分发数据包的数量的具体体现,可以表达成:1(Re1)miittHarvstmpmp上式中,Harvsti代表节点i加入系统m个回合后的总收益值,p为内容分发服务器s每回合所分发的数据包数量,Reit表示节点i在第t个回合所接收到数据包数.成本值是节点所发送数据包的数量的具体体现,可以简单地表达成:1()miitDataitGossipitFinetCostSeSeSe上式中,Costi代表节点i加入系统m个回合后的总成本值,其他Se分别表示节点i在第t个回合所发送的内容包、谣言/请求包和惩罚包的数量。效用值的表达iiiUHarvstCost(01)010《基于重复博弈和惩戒机制的P2P协作激励信誉模型》信誉机制加入到P2P网络后,节点间的博弈行为已不再是简单的单阶段博弈.假设节点将无法知道该博弈到何时终止,由博弈论知识可知,当局中人无法预知博弈终点时,该博弈将是一个无限重复的多阶段博弈.因此,P2P网络中节点交易便成为一种无限重复博弈节点在考虑本次交易所采取的策略时要考虑的标准是它在本阶段的预期收益值.由重复博弈理可知,节点的预期收益是此次交易与所有后续交易中单阶段收益值的贴现值之和,即()()ktiiktUtuk其中,δ为贴现因子,它可以看成一个节点对后续交易的耐心程度,其取值范围为0δ1.δ的值越大,说明节点对后继交易越有耐心;反之,节点越重视当前的交易,它的取值由P2P网络本身的各个因素决定;ui(k)为节点i在第k阶段的收益。020《基于博弈论框架的P2P激励模型》效用函数Ui用于刻画用户对于所得服务质量的以货币为度量的满意程度表现用户需求的异构性有了价值矩阵和差异服务概率函数就可以得到Pi的效用Ui(),0iiiiijjijjUcDpdBDB第1项表示加入系统需要付出的代价第2项是可从系统得到的收益。定义无量纲ui,0iiiUucD则(),0iiiijjijjudpdbdb-di表示Pi加入系统的代价它与Pi贡献的硬盘空间或者带宽的资源成正比Pi的获益取决于其他Peer对系统的贡献dj和这些贡献对于Pi的价值(bij)以及Pi可能从该Peer下载文件的概率(())ipd由P(0)=0和P()=1可知ui有两个极限0lim0,limiididiuu可见无限增大贡献di并不能无限地提高效用ui直观地解释就是参与者贡献越大得到的服务质量就越好但是参与者从系统中得到总的收益并不是随着其贡献的增加无限增大的而是有一个最大值前提是有一系统临界值bc.当bibc时效用函数才有可能取到最大.024《基于混合战略博弈的P2P激励机制》文献中,把结点行为分为服务(serve)和不服务(don’tserve),两种行为的支付函数分别为:()serveservetPayoffpCRU公式3-1''(1)()dontdonttPayoffpRU公式3-2其中,U和C是结点的效用函数和消耗函数,R是信誉值,由以下式给出1(1)servettRR公式3-3'1(1)dontttRR公式3-4是介于0到1的一个常量,其意义相当于贴现率。如果结点的混合战略Nash均衡为(p,l-p),即以P概率服务,以(1-p)概率拒绝服务,则根据等值法,占优混合战略中大于O分量的纯战略期望支付相等,有'servedontPayoffPayoff公式3-5将公式3-1至3-4代入公式3-5有p关于U、C、的函数关系:11(1)2(1)ttRUpCRUU公式3-6032《对等网络中的搭便车行为分析与抑制机制综述》效用函数(utilityfunction)是搭便车抑制机制研究中的一个关键概念。效用函数可能涉及以下自变量;节点共享文件的数量、节点已下载文件的数量、节点已上传文件数量、节点已下载数据的大小、节点已上传数据的大小等。定义计算复杂性小,却能客观地反映搭便车控制中关键问题的效用函数是激励机制设计的核心.以下通过介绍不同效用函数定义,分析激励机制的一般研究方法。式(1)~(3)是文献[1]中定义的3个效用函数。(,)(,)iiUpTUListPT(1)式(1)左端的(,)iUpT表示在T时刻,节点i的效用函数。右端的(,)iUListPT表示在T时刻,节点i所提供的共享文件数;是一个规范化系数,是个常量。采用式(1)作为效用函数,节点能享受的服务质量正比于节点共享的文件数量,效用函数(1)十分简单,节点所共享文件数量决定节点能享受的服务质量。((,))(,)()jiijFUListpTUpTsizeF(2)式(2)从文件大小角度来计算节点的效用函数。式(2)先把一个节点提供的共享文件大小求和,然后乘以规范化系数。对比式(1)和式(2),两者差异是在大文件和小文件的处理方面有区别。采用式(1),有利于共享多个小文件的节点享受高服务质量;而式(2)则有利于共享大文件的节点。式(1)和式(2)定义的效用函数均是静态效用函数,没有反映节点所提供的文件被其它节点下载次数的动态信息。((,))((,))(,)((,))()()jiiiijjjFUListpTFDListpTUpTkDCountFTsizeFsizeF(3)效用函数(3)既考虑了节点提供的共享文件的大小,又考虑了提供的共享文件在对等网络中的受欢迎程度。((,))((,))()jijjFUListpTkDCountFTsizeF表示节点i在时刻T的奖励值,((,))()iijFDListpTsizeF表示节点i在时刻T的惩罚值。奖励值中包括节点为其它节点提供下载文件大小之和,惩罚值是节点从网络中下载数据大小之和,已下载信息量越多则惩罚值越大。效用函数(3)可以有效区分那些提供不被访问信息资源的搭便车节点。然而式(3)在增加合理性的同时也增加了计算复杂度,它揭示了效用函数设计中的一个矛盾:复杂度与合理性的冲突。计算比较简单的效用函数,如式(1)、式(2),合理性较弱;而合理性强的定义则计算复杂度大。采用式(1)~(3)效用函数,可以有效限制节点的搭便车行为。在节点搭便车行为突出时,可让节点既无法发送查询请求,也不能下载信息资源。搭便车者若不能享受信息资源共享服务,它将离开对等网络,对等网络在线用户数量降低。然而对对等网络运营者而言,在线用户数量大小是衡量系统价值的重要指标,例如利用P2P系统从事广告业务,它可以允许不提供共享数据的节点存在,因为系统可以主动向搭便车节点发送广告信息。在线节点数量越多,则广告效果越好。如果严格执行上述效用函数,尽管有效抑制了节点的搭便车行为,却不利于提高对等网络的用户数量。评价一个节点为对等网络所做贡献不能单纯地按绝对贡献大小评价,继而提出了如式(4)所示的效用函数值大小比较方式,其中()iCt表示节点所作绝对贡献值,id表示节点的最大可支持物理带宽。式(4)中的效用函数值不是简单的绝对贡献值,而是服务贡献值与节点所能提供的最大带宽之比值。它对物理上贡献能力低、但尽力做了贡献的节点比较有利。()()(,())(,())jiiiijjjijCtCtUxtUxtdd(4)多数基于激励机制的搭便车行为控制方法是在节点提出查询或下载请求时计算该节点的效用函数,然后确定服务质量。但也有研究者认为在对等网络负载不大的情况下,应该尽量为所有节点服务。因此他们把激励机制的控制点选择在信息服务提供节点,而不是请求发起节点[2-3]。提供信息资源下载的节点根据当前网络状态,将其判定为拥塞和不拥塞两种类型。如果服务提供节点不拥塞,则尽力满足同一时刻所有节点提出的服务请求。但当服务提供节点发生拥塞时,它根据查询或下载请求发起节点的效用函数值对服务请求进行优先级分类。先满足效用函数值高的节点发出的服务请求,后满足效用函数值小的节点服务请求;特别拥塞的情况下,可能拒绝搭便车者的服务请求[2-3]。文献[4]中定义的效用函数如式(5)所示:'''''0(,)(,(),)(,)(,)(,,)ttrRuptbprttalptcprpartprt(5)式(5)与式(1)~(3)有两个区别:(1)在时间域上采用连续方式,用积分计算节点p在时刻t的效用函数;(2)评价收益的角度不同。式(1)~(3)是从整个P2P系统的角度来计算各个节点的效用函数,节点为其它节点提供了服务,则是正收益;节点从网络中下载了数据,则是负收益。式(5)却是从单个节点角度来评价效用函数,其中积分部分表示节点从网络下载的数据量。从对等网络中下载资源越多,则节点自身收益越大;求和部分表示节点为其它节点提供的下载服务总和,为系统贡献越大,则节点效用函数值越小。根据式(5)的计算结果,文献[4]把节点分成理性主义者、搭便车者和贪婪者3类。理性主义者期望效用函数值(,)upt较大;搭便车者则仅期望自身提供的下载服务量最小;贪婪者则仅注意积分部分值较大,即节点从网络中获得下载数据总量最大。文献认为无论是搭便车者还是贪婪者,都不值得提倡,对等网络提倡理性主义节点。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功