综述:证据理论的研究分析及其在电力系统短期电量预测领域的应用分析学院电子信息学院年级专业控制理论与控制工程学生姓名刘元科学号3113038003指导教师杨清宇证据理论的研究分析及其在电力系统短期电量预测领域的应用分析证据理论研究的历史在处理不确定数据方面,证据理论以其在不确定性表示、量测和组合方面的优势受到重视,先后推广到概率范围和模糊集,可像贝叶斯推理那样结合先验信息,且能处理类似语言的模糊概念证据,并逐渐发展成为一种重要的不确定性推理方法。证据理论是Dempster于1967年研究统计问题时提出的,该理论给出上、下概率的概念及合成规则和不满足可加性的概率。Shafer进一步推广,使之系统化、理论化,故又称为Dempster-Shafer证据理论(简称D—S或证据理论)。证据理论研究的现状国内外许多学者在理论和应用中作了大量工作。在理论方面,模糊数学的创立者Zadeh和专家系统MYCIN的主要开发者Shortliffe等人,都积极地进行证据理论模型解释、算法实现及实际应用研究。Dubois等人指出证据理论中的置信函数是模糊测度,以集合论的观点研究证据的并、交、补和包含等问题。Smets将置信函数推广到假设空间(识别框架)的所有模糊子集上,提出pignistic概率和可传递置信模型TBM。Pawlak提出的粗糙集理论为证据理论的发展提供了新的机制,使无限框架上的证据处理向有限框架近似转化成为可能。为能合理处理证据冲突,一些学者改进了合成规则,针对证据源的相对优先级、可靠性及重要性不同,提出了加权Dempster证据合成规则,但该合成规则丧失了可交换性,也无信息源优先级的判断准则。为解决合成规则在实现时存在指数爆炸等问题,一些学者相继提出扩展的证据理论法(EDS)、条件化的证据理论法(CDS)及修改的证据理论法(MDS)等。有研究人员针对多传感器的目标识别问题,证明2个传感器D-S融合识别同一目标时的若干结论。对Dempster规则的有效性作了系统论述,推导Dempster组合规则,给出Dempster规则成立的3个假设。在相关证据合成方面,通过定义证据强度及证据相关度的概念,给出修改的合成方法,指出经典合成方法是其特例。由于2个证据El和E2对应的m1和m2并不包含相关信息,故提出新的模型来表示证据理论中相关性问题,认为其中2个相关证据是由1个独立源证据分别与2个相关源证据通过正交合成得到,相关证据的合成可归结为3个源证据的正交和。Yen将证据理论推广到概率范围,先验证据用条件概率表示,用Zadeh的粒度重新定义焦元,又定义1个类似置信函数的概率价值:()(|)();{|()}ApAepeeeAGe其中G(e)为粒度集。合成规则分为:确定基本置信指派、利用Dempster规则合成、最后转化为概率价值。Guan等人把3步合并为1个公式。Spies建立条件事件和离散随机集的关系,引入条件置信函数。当全部证据理论为概率时,其合成规则的结果等于应用Jeffery全概率公式的结果。1996年Mahler利用随机集理论和条件事件代数提出条件证据理论(CDS)。Smets提出模糊集置信函数概念,并用模糊事件概率对关系函数的数学期望进行推广。Yen用线性规则的方法把与概率相容的置信函数和似真函数推广到模糊集,并给出相应的合成公式。Mahler教授把条件证据理论(CDS)推广到模糊集,形成模糊条件证据理论(FCDS),弥补了Yen理论的不足。Romer提出把置信函数约束到连续和离散的模糊随机变量上,结合了可能性分布。D-S方法的近似计算D-S方法的近似计算是通过减少置信函数的焦元个数来简化计算。Voorbraak发现,如果置信函数的合成产生1个贝叶斯信度函数,即1个识别框架上的概率测度,则信度函数用贝叶斯近似来代替,不影响Dempster合成规则的结果。Voorbraak证明,置信函数的贝叶斯近似的合成等于这些置信函数的合成的贝叶斯近似。该特性使应用贝叶斯获得近似结果,至少是识别框架的元素,而不是其子集的最终结论,可简化计算量。Dubois&Prade提出一致近似(consonantapproximation)的方法,其特点是:通过近似计算后的焦元是嵌套的,且焦元的个数不超过识别框架中的假设个数,I表示保留的焦点元素的最多个数,x表示允许被删除的最大mass值,x通常在0,0.1上取值。Smets提出衡量某种近似算法的误差要以pignistic概率分布为标准,因基于信度函数的数据融合所需pignistic概率。此外,Simard等人提出称为修剪的D-S(TruncatedDempster-shafer)算法:首先给定要保留的焦点元素的最大个数MaxNum,BPA的上限MaxBe和下限MinBe,再判断BPA数值大小,以决定其对应的焦点元素是否应该保留。修正的D-S方法主要指Mahler提出的条件化证据理论。CDS是在先验知识可能是非贝叶斯型的情况下,处理非贝叶斯证据的概率计算。作为CDS的特殊性,MDS结合了D-S方法和贝叶斯方法的优点,利用包含在先验概率分布中的信息。该方法已被广义化成模糊逻辑形式。Ishizuka等人结合了D-S方法和模糊集理论的优点来表示和处理不确定的和模糊的信息。经定义模糊集合的“包含度”和“相关度”来实现该目的,并将置信函数重新定义。给出包含度的定义并相应地修正Dempster合成公式。为此Yen提出一组新的置信函数及合成公式。电力系统电量预测的介绍电力电量预测是电力企业的重要工作。基于准确的电量预测可以经济合理地安排电力系统内部发电机组的启停,保持电网运行的安全稳定性,减少不必要的旋转备用容量,合理安排机组检修计划,保持社会的正常生产和生活,有效降低发电成本,提高经济效益和社会效益。预测的准确性直接影响到投资及运行的合理性,直接关系到电网的安全、经济、可靠运行。若电量预测比实际偏低,将会导致电网容量不足,无法满足用户正常供电要求,甚至还可能缺电;另一方面,电量预测比实际偏高,则会导致安装一些过多而又不能充分利用的设备,从而引起投资的浪费。科学的预测活动,主要由六个因素所组成:预测主体,即由谁去进行预测;预测客体,即预测对象是什么;预测目的,即预测要回答什么问题;预测依据,根据什么信息资料进行预测;预测方法,采用什么样的预测技术和手段;预测结果,通过预测活动得出的结论。预测结论是否理想、能否达到预期要求,它与预测目的是否明确、采用的方法是否适当、信息依据是否充分、预测者的分析判断能力及其对预测领域的认识和把握程度等直接相关。在电力市场中,对电量的分析和预测是一项很重要的工作。对电量的历史数据的分析可以直接或间接考察电力部门的管理经营情况,过去一段时间电价的合理性以及该地区的电力消费结构。对未来用电需求量的预测是电力市场中许多决策问题的前提和基础,它可以为投资规模、电力生产结构调整、电力销售结构调整以及电价制定等方面提供依据。电量的预测按照预测时期的不同可分为电量的长期预测、电量的中期预测、电量的短期预测。长期预测则可达30年或更久,而中期预测通常为5-6年,中期预测和长期预测的结果主要用于指导新增机组的投产及电网的增容和扩建。短期预测通常为年、季、月,短期预测可用于指导安排年、月供电计划,然后将发电容量进行科学有效的调度,使得发电成本最小的经济运行。在电力管理部门的工作中,电力电量预测是电力系统管理工作的重要工作之一,它关系到电力系统的调度、产电、开发、规划等工作。如果能够取得精准的短期电量预测结果,电力企业就能够做到科学、合理地统筹计划发电机组的开停机组数量,真正的保证了电网可以经济安全的运行,做到合理降低旋转储备容量,这样就提升了电力系统的经济与社会效益。如果能够精准的获得到短期电力系统的电量预测,那就更加有条件去考虑企业的今后发展问题,比如:电网的增容、机组的更新、企业的扩建甚至是再建发电厂等工作,这样才能保证电力市场的科学运行。因此,就要从历史数据入手来获取到高准确的电量预测。这项工作不仅很繁重而且受到的干扰因素也比较多,首先是选取的资料数据就极大的影响了预测的结果,如收集的数据是否准确,受到的影响因素繁多等,这都对预测结果有很大的干扰。对于短期电量预测,就要将选取的历史数据资料进行完善和修正,甚至有些还需要进行推算,否则这些数据会导致预测结果出现较大的误差。数据处理的好,预测会达到事半功倍的效果,否则,再好的预测模型也只能是一个进垃圾出垃圾的机器。构建证据处理模型的步骤:(1)构建识别框架U。通过定义识别框架U,将实际的判决问题转化为对数学集合的研究;(2)按照各个证据的贡献大小设定信度的初始分配,通过对各个证据的分析和比较,得出证据对每一集合的支持程度的大小;(3)通过因果分析,预测命题的信度。从直观上看,一批证据支持一个命题,则这一批证据也同样的支持该命题的推论。因此,一个命题的信度应该等于一批证据对这个命题的所有前提的信度和。采用集函数基本信度分配(BasicProbabilityAssignment)对每个命题的信度进行表达。另外,证据表示函数还包括真度函数(PlausibilityFunction)和众信度函数(CommonalityFunction)等等。证据理论中的组合规则提供了组合两个证据的规则。设1m和2m是2U上的两个相互独立的基本概率赋值,下面给出确定组合后的基本概率赋值:12mmm。设Bel1、Bel2是同一识别框架上基于2个独立证据的信度函数,1m和2m分别是其对应的基本概率赋值。其焦点元素分别为12,,...,kAAA和12,,...,kBBB,112()()1ijijABKmAmB,则:式中,若11K,则m确定一个基本概率赋值;若1K=1,则认为12,mm矛盾,不能对基本概率赋值进行组合。规范化因子就是其中的系数11k,为了防止在合成时将非空的概率赋值给空集。由定义所给出的证据组合规则称为Dempster组合规则。对于多个证据的组合,使用组合规则对证据进行两两综合。基于经济因素影响的识别框架由于经济因素(证据1)对电量值有着重要的影响,电力弹性系数和电耗系数是反映国民经济发展与电力负荷关系的主要指标。电力弹性系数指电量年增长率与GDP增长率的比值;电耗系数指每年的电量与当年GDP的比值。定义电耗系数与电量值的权重公式如下:2()1/2exp(/2)Fxx式中x—电量值,可取整数1、2、3……,β—电耗系数对电量的权重系数,取0-1之间很小的数。据仿真得出电耗系数与年电量关系如下图所示,纵坐标表示电耗系数值,横坐标表示相对应电耗系数值的电量值。因此,电量值jx对其每年的电耗系数iF公式为:2()1/2exp(/2)ijjFxx基于电量趋势相似度的识别框架假设给出了某两日(第i年、第j年)及它们环比的第i年、第j年的电量变化曲线形状非常相似,说明这两年及它们环比的第i年、第j年电量变化规律很相似。称它们及它们环比两年的电量曲线形状的相似程度为这两年的“趋势相似度(证据2)”,它量化了这两年及它们环比两年的电量水平变化规律的相似程度。证据2的识别框架为相似度和非相似度,相似度由下面的公式求出,非相似度和相似度之和为1。证据2的基本信度分配,第i、j两年的“趋势相似度”如下:2[()()()]()()ijijijijEXXEXEXTDXDX其中1(,...,,,),iiKikiiXxxxx1(,...,,,),jjKjkjjXxxxxK一般取值4-7。ix为第i年的电量值。基于电量形状相似度的识别框架同样,称年电量曲线(证据3)形状相同的两年彼此间是“电量曲线形状图相似年”,简称“形状相似年”。这两年的电量曲线图形状的相似程度就叫做它们的“形状相似度”。于是把这两年的“形状相似度”作为第三个证据融合的识别框架。证据3的识别框架和证据2类似。证据3的基本信度分配,第i、j两年的“形状相似度”可按下式计算:2[()()()]()()ijijijijEXXEXEXSDXDX基于温度因素影响的识别