现实电力市场中边际电价结算机制和市场竞价结算机制对比EricGuerciandMohammadAliRastegar翻译:何晔5130719026【摘要】日前意大利批发电力市场的会议上一个基于代理计算模型被提出用以模拟对比市场在边际电价结算机制和市场竞价结算机制下不同的表现。宏计算结果我们通过检验它对过去情形模拟的准确性来提供理论支持。除了少数用电高峰时期,模拟得到的电价水平都很准确。至于考虑市场竞价结算机制时,数值实验表明这样会模拟得到相对于考虑边际电价结算机制时更高的市场电价。在市场竞价结算机制中,发电方为最大化利益所付出的成本更高因此电价更高。12.1前言设计电力竞价机制的关键点之一与定价方式有关。通常我们采用统一价格(按边际价格结算SMP)或按报价结算(PAB)价格。在经济学中,那种价格结算方式更有效并没有定论,但SM-P(按边际价格结算)机制更加流行。如今所有欧洲主要的电力市场都采用这套机制。然而,P-AB(按报价价格结算)和SMP(按边际价格结算)各有优缺点,并且这些优势、劣势可能会在特定的市场环境中体现或加强。比如说,电力市场发展成“无限重复市场机制”的本质可能诱使竞标者默契合谋(暗中勾结)。竞标者之间频繁重复的“互动”拓展到了暗号和一套有效的惩罚机制使他们可以配合协作。有几个作者已经分析了2001英国由OFGEM执行的电力市场改革。OFGEM认为SMP机制更容易受制于策略操纵且可能对某种不良的暗中勾结无能为力。相反地,OFGEM设想PAB机制可以降低暗中勾结获得的机会,因为此时出价将不再是不必付出代价的威胁。这些作者在某些情况下反对OFGEM提出的这项改革。比如,C.D.Wolfram声称考虑到英国电力市场结构的高度聚集——少数发电公司掌控着市场,转换为PAB体制并不能解决电价高的问题。J.BowerandD.W.Bunn甚至认为改革事实上会提高市场电价。他们的分析是根据基于代理模拟模型。主要原理是:市场电价一般不公开,占有很大市场份额的代理商在PAB机制中可以获得重要的信息优势,因此他们面对的竞争压力更小。G.Federico和D.M.Rahman从两个极端的市场体制的角度(也就是说,完全竞争和垄断供需)来研究这两个定价法则,他们的结论与OFGEM一致,就是,PAB体制更可能减小市场权势的影响并且能降低平均电价,导致更低的行业利润。本篇论文引出了这个引人关注的问题并提议使用日前意大利批发电力市场会议上的一个基于代理模拟模型来验证这个重组建议的有效性。一些构建复杂市场模型引人注意的角度,比如在电力市场中,一个自下而上的角度促进了一个计算方法在经济学中,特别是在批发电力市场研究中的应用。再这样一个人工计算环境中,自主的、自私的、适应的以及多元化的一些市场代理商可能会在彼此间重复地相互博弈,从而形成了一个现实的经济动态系统。A.Azadeh等人已经提出过通过基于代理技术比较电力市场定价机制,但是他们是对一个简化的市场环境展开这种分析。同时,他们文章中的很多工作都是提出了国家批发电力市场的详尽模型,但很少提到实证验证模型预测能力的工作。我们的文章设法完成这两件工作:比较实证验证的市场机制和一个现实的市场模型。为了更好地复制意大利市场的真实特征,一个数据驱使的的计算模型将被用来在宏观层面实证验证考虑SMP机制而提出的模型。本文结构如下:12.2介绍物理约束市场模型,意大利电网模型,基于代理计算模型和学习算法的采用。12.3介绍计算实验设定并展示讨论结果。结论在12.4中给出。12.2ACEModel12.2.1Marketmodel在下文中,DAM扫清市场的过程被详尽给出,它是基于标准直流最优功率流(DCOPF)。每个第i(i=1,2,...,N)个发电厂向DAM分别递交由一对他愿意支付的限价iPˆ(欧元/兆瓦时)组成的投标价和他同意生产的最大电量iQˆ(兆瓦)。我们假设每个发电单位有生产下限iQ和生产上限iQ,这就确定了该生产单位每小时实际产电量的可行区间:iiiQQQˆ(兆瓦)。第i个发电厂的总成本函数如下:)()(iiiliibQaFPQTC(欧元/小时)(12.1)其中lFP(欧元/吉焦)为第i个发电厂所用燃料(l)的价格,系数ia(吉焦/兆瓦时)和ib(吉焦/小时)设为常数。这组系数),(iiba随发电站的技术和效率而变化。常数项ilbFP对应空载成本,也就是发电厂保持产量为零时的固定成本。然而这些成本在电厂关闭时会消失。第i个发电厂不变的边际成本很容易由相应的总成本函数)(iiQTC得到:iliaFPMC(欧元/兆瓦时)(12.2)在收到所有发电厂的投标价后,DAM在考虑如下约束条件下:区域能量平衡(thezonalenergybalance)(基尔霍夫定律),每个发电厂的最大最小容量以及区域间传输限制,通过实行社会福利最大化来扫清市场。由于假定无价格弹性的需求,目标函数仅仅考虑了供应方面的市场份额。因此。社会福利的最大化可以转变为一个总报告生产成本的最小化,也就是说,对投标价格进行估计(见方程12.3)。这个以基于DCOPF的清扫机制同时决定了每个发电厂的机组组合(unitcommitment)和每个生产线(bus)节点边际价格(LMP)。然而,意大利市场需要引进两处轻微的修正。第一,卖家以区域价格被支付,也就是LMP,然而买家按市场中通常使用的全国统一价格(PUN)支付,PUN是通过按区域负载对区域价格进行加权平均计算得到的。第二,传输功率流约束随流向改变。准确的公式在下面给出:NiiiQP1ˆmin(欧元/小时)(12.3)受限于下面的约束条件:有功功率限制(Activepowergenerationconstraints):iiiQQQˆ(兆瓦)对于每个区域z的有功功率方程:ziinjectzloadziQQQ,,(兆瓦)loadzQ,:在区域z的负载需求injectzQ,:在区域z净功率输入injectzQ,通过标准直流最优功率流(DCOPF)模型计算得到线路实际功率流限:stlstlQQ,,(兆瓦)tsltslQQ,,(兆瓦)stlQ,是线路l上从区域s流到区域t的功率流,stlQ,是线路l在同一方向上,也就是从区域s流到区域t,最大的传输能力。stlQ,通过标准直流最优功率流(DCOPF)模型计算得到。问题的解由每个发电厂产生的有功功率iQ的集合和每个区域},,2,1{Kk的区域价格kZP(LMPs)集合组成。SMP清扫机制中区域k内第i个发电厂每小时的利润iR通过如下方式得到:)(iiikiQTCQZPR(欧元/小时)(12.4)然而市场竞价结算机制中每小时收益为:)(ˆiiiiiQTCQPR(欧元/小时)(12.5)12.2.2网络模型(前面)采用的市场清扫机制需要定义一个传输网络。本文考虑的网络模型(图12.1)展现了一个准确的区域市场结构和意大利电网模型中与这种结构对应的相邻区域间的最大传输能力。它相当于意大利输电系统运营商所定义的网络模型,即2006年末提出的被市场运营机构采用的TERNAS.p.A.。这个网络包含11个区域(BRNN(BR),CentralNorth(CN),CentralSouth(SR),FOGN(FG),MFTV,North(NO),PRGP(PR),ROSN(RS),Sardinia(SA),Sicily(SI),South(SO))和10条形成链状结构的,将意大利南北连接起来的传输线路。每天传输线路两个方向上不同的最大传输能力值也(在模型中)给出了。最后,输电损耗在模型中忽略不计。图12.1被计算实验所采纳的意大利输电网络模型包含11个区域和10条传输线;圆圈表示位于区域内的发电厂;三角表示每个区域内服务实体的总负载(LSE);线上和线下的数字分别表示下午三点线路上两个方向的传输能限值;箭头表示每个传输能限值对应的功率流向。12.2.3代理模型对两种类型的代理进行建模:买家和卖家。买家可以看成是区域层面的服务实体总负载。买家的数量投标可假设是没有价格弹性的并且就是2006.12.20历史负载曲线的重现,因此他们是没有任何协商余地的。市场的供应方由向他们的每个电厂投标的发电公司组成的。只有热电厂被考虑,因为它们代表了几乎四分之三的全国总发电能力,此外剩余的全国产电(水电、地热、核电、风电)以及进口电能很容易以零价格数量投标建模。进口电通常是在海外,主要是法国和瑞士,通过廉价的技术生产的,比如水力或者核能发电。在任何情形下,精确的历史数值被设定为能够决定所以这些后者(进口电)的贡献值。我们考虑的热电站的集合由158个发电机组和5种不同技术,烧煤的(CF),烧油的(OF),联合循环(CC),涡轮气(TG)和能源重利用(RP),构成。这些电厂在2006年或独立或合营,由16家不同的发电企业管理。然而,在我们的模拟中,我们设定每个电厂的所有权公司唯一并将其定为占有该店厂最大份额的发电公司。为了缩减代理的数量,我们已经根据热电厂接电的区域,产电的技术和所有权发电公司将代理设定为53个。特别地,第g个发电公司占有的位于区域z通过技术f发电的热电厂数量记作fzgN,,。我们将所有的这样的fzgN,,的热电厂分为53个自治的,自利的,自适应的异构代理。每第j)53,,2,1(j个向DAM呈递一组每个下属发电厂},,{1jNxxi乐意接受的限定价格ijP,ˆ(欧元/兆瓦时)对应的值和产电量ijQ,(兆瓦)的值(规定呈递他们电厂的最大产电能力)。jN为代理j所占有的发电厂数量,若代理j被第g个发电公司占有且位于区域z、使用技术f,则fzgjNN,,。此外,ijjijMCmP,,ˆ,其中jjAm(代理j行为空间)是一个对所有代理j占有的发电厂相同的标记值,ijMC,为代理j占有的第i个发电厂的边际成本。最后ijQ,ˆ表示被代理j占有的第i个发电厂的最大产电能力值。因此,代理被设定为每次投标他们发电厂最大产电能力值和统一的标记值。在计算实验中,我们已经假定}00.5,,12.1,06.1,00.1{jA对应百分之五的标记增长值和一个500%边际成本的最大标记值。因此,代理行为空间的基数相同,也就是对于所有j:67||MAj。于是,我们定义每个代理j的利润jR如下:},,{1jNxxiijRR(欧元/小时)(12.6)12.2.4学习模型代理/卖家每小时一个同时呈交24个报价给DAM。他们根据每小时的市场情况独立学习报价策略,也就是说在这种市场中没有相互联系合作。在意大利,每小时的报价同时呈交并且不允许分段竞价。A.E.Roth和I.Erev提出通过实现最初的一个经典强化算法,代理可以被模拟为自适应的代理。在这个学习模型中,考虑了人类学习的三个心理学层面:练习的幂指数定律(也就是:学习曲线刚开始很陡,之后越来越趋于平缓),近因效应(也就是:遗忘效应)和一个实验效应(也就是:不仅是实验操作,而且类似的策略也会增强)。J.Nicolaisen和其他人就解决将回报范围拓展到零回报和负回报的问题的提出了一些对原始算法的修正。这篇文章只考虑修正后的公式。对于每个策略jjAa,定义一个倾向值)(,jtjaS。每一轮t,倾向值)(1,jtjaS根据与倾向值)(,jtjaS相联系的一个新向量来更新:)()()1()(,1,,jtjjtjjtjaEaSraS(12.7)其中]1,0[r是近因参数,有助于以指数规律降低过去结果的效应。方程(12.7)中的第二项被称为实验功能,由下式给出{ˆ)1()ˆ(ˆ1)(,,1,)(jjjtjjjjtjaaeaaaMeaSjtjaE其中]1,0[e是实验参数(用来在发挥作用动作和非发挥作用动作间分配权重),M是动作数量,)ˆ(,jtja是在第t轮通过发挥作用动作jaˆ获得的奖励(增强)。奖励可以当做每个功率单位(兆瓦)的利润来计算:jjjjtjRaRa/)ˆ()ˆ(,(12.8)其中jR为代理j可获得的最