论文题目:A题风电功率预测问题论文题目:A题风电功率预测问题第一页答卷编号:论文题目:A题风电功率预测问题姓名专业、班级有效联系电话参赛队员1印海洋实验电0915210725819参赛队员2殷毓灿实验电0915901393808参赛队员3罗潇实验电0915210724720指导教师:雍雪林参赛学校:华北电力大学报名序号:8322证书邮寄地址:北京市昌平区回龙观镇北农路2号华北电力大学09实验电印海洋收(学校统一组织的请填写负责人)第二页答卷编号:阅卷专家1阅卷专家2阅卷专家3论文等级3摘要本文针对题目中所给数据建立风电功率实时预测的模型,前后共采用五种以上模型进行仿真计算以及误差分析,在此基础上对模型进行利弊分析,对比得出最佳模型并加以改进。对于问题一,我们首先对数据进行初步处理,通过相关度分析发现横向相关度(相邻时刻的风电功率)较高,而纵向相关性(即每天相同时刻的风电功率)不甚明显,进一步,我们画图可看出数据没有明显的单调性及周期性。基于风电功率的以上特点,我们建立了以下四种模型来进行预测。首先,我们利用多项式拟合来进行风电功率预测,结果不甚理想。其次,我们采取了时间序列方法。此方法中建立人工神经网络和LS-SVM两种预测模型,发现在实时预测的前12个数据误差很小,但随后预测并不准确。再次,我们利用了灰色预测模型GM(2,1)及verhulst模型来预测风电功率,此种方法短期预测效果较好,但预测长期则偏差较大。最后使用了ARMA模型,既考虑变量自身因素,又考虑历史扰动的影响,准确率可达97.10%,预测结果精度非常高。对于问题二,小组基于问题一中计算得到的数据,单个机组选择PA为典型,P4、P58机组预测得到的数据进行误差分析比较。采用两种对比方式:第一种选定了数量相近的典型值进行了统计,分别从采样数、优/劣质点平均误差、优/劣质点最小误差、优/劣质点最大误差、优/劣质点个数以及优质点百分比这几个方面进行比较。第二种是参考风电场功率预测预报考核指标中的合格率以及准确率的计算方法,用这两个指标对比预测结果的误差大小。最终综合两种参数,得出风电机组的汇聚(“以量代大”)可减小预测误差的结论。对于问题三,小组将问题一中各个模型的预测结果以及误差进行比较,在此基础上参考问题二的分析结果对出影响预测精度的因素进行分析讨论。同时查阅相关资料,对问题一中的LS-SVM模型进行了改善,主要是将输入变量由列向量改为矩阵形式。并给出了物理-统计组合模型,使预测数据的精确度得到有效提高。4关键词:时间序列预测人工神经网络LS-SVM灰色预测ARMA系统模型一.问题重述风能是现今可再生能源中最具发展潜质的能源,但风力的波动性、间歇性、低能量密度性也是风能发电不可回避的问题。当风电接入电网时,必须对风能发电功率进行有效的预测,这样才能根据风力功率变化预先安排调度计划,减小风能发电波动对电网的不利影响,从而保证电网的功率平衡和运行安全。根据电力调度部门安排运行方式的不同需求,风电功率预测分为日前预测和实时预测。日前预测是预测明日24小时96个时点(每15分钟一个时点)的风电功率数值。实时预测是滚动地预测每个时点未来4小时内的16个时点(每15分钟一个时点)的风电功率数值。而《国家能源局颁布的风电场功率预测预报管理暂行办法》也给出了误差统计的相应指标。现有某风电场由58台风电机组构成,每台机组的额定输出功率为850kW。题目中给出了2006年5月10日至2006年6月6日时间段内该风电场中指定的四台风电机组(A、B、C、D)输出功率数据(分别记为PA,PB,PC,PD;另设该四台机组总输出功率为P4)及全场58台机组总输出功率数据(记为P58)。根据题设,我们需要讨论以下三个问题:1:风电功率实时预测及误差分析用不少于三种预测方法(至少选择一种时间序列分析类的预测方法)来对PA,PB,PC,PD,P4及P58进行功率实时预测(预测范围为5月31日0时0分至5月31日23时45分和5月31日0时0分至6月6日23时45分),分析准确行并比较2:试分析风电机组的汇聚对于预测结果误差的影响利用1的预测结果,试比较单台风电机组功率(PA,PB,PC,PD)的相对预测误差与多机总功率(P4,P58)预测的相对误差,其中有什么带有普遍性的规律吗?从中你能对风电机组汇聚给风电功率预测误差带来的影响做出什么样的预期?3:进一步提高风电功率实时预测精度的探索在问题1的基础上,构建有更高预测精度的实时预测方法(方法类型不限),并用预测结果说明其有效性。5最后请结合以上问题结论分析论证阻碍风电功率实时预测精度进一步改善的主要因素。风电功率预测精度能无限提高吗?二.合理假设1.每台风电机组发电的影响因素是相同的;2.风电功率预测精度在要求范围内就不会对电网产生不利影响;3.A、B、C、D四台机组在风电功率波动特性上具有代表性;三.符号约定Xt零均值平稳序列At为白噪声P自回归阶数Q滑动平均过程阶数i自回归系数m滑动平均数B滞后算子jG格林函数MkPK时段的实际平均功率PkPK时段的预测平均功率N日考核总时段数Cap风电场开机容量。四.问题的分析4.1风电功率实时预测及误差分析6首先小组分析题目所给数据,发现已知条件中风电功率仅和时间因素有关,其他物理因素或影响因素都未明确给出,已知条件十分有限,所以小组讨论认为只能根据数据之间的内部关系建立模型预测。随后小组对各组数据横向纵向进行了相关度分析。横向即一段连续时间内相邻风电功率之间的关系,纵向即每天同一时刻的风电功率之间的关系。发现纵向相关系数很低,横向相关系数较高,故在预测某一时刻功率时,选取该时间段前n个连续时间段作为预测的历史数据,而不考虑过去该时刻的风电功率的影响。第一种模型:因为已知数据较多,小组首先使用EXCEL直接对给出的数据作散点图观察规律,发现不同时刻的风电功率无明显规律,如单调性、周期性。出于难易考虑,小组先采用多项式拟合进行简单的功率预测。第二种模型:灰色预测是可以进行短期预测,并且结果较好的一种方法。所以小组采用灰色预测中的GM(2,1)和Verhulst模型对风电功率进行预测。第三种模型:考虑到数据中仅给出时间和功率两个变量,影响因素单一,比较符合时间序列预测的情况,小组采用人工神经网络和LS-SVM两种模型做时间序列预测。值得一提的是,在MATLAB软件下,可以非常直观的从图像上观测出预测量与实际量的误差大小。第四种模型:观测数据查阅资料发现,风电功率应该是一个既与以前响应有关的变量(我们称之为自响应系统AR(n)),又是一个与之前进入系统的扰动有关的变量(我们称之为MA(m)),即ARMA系统模型。所以小组使用SPSS软件建立ARMA系统模型进行结果预测并形成图像对比。4.2分析风电机组的汇聚对于预测结果误差的影响小组采用两种对比方式。第一种是对于PA(单个机组选PA为典型)及P4、P58,都选定了数量相近的典型值进行了统计,分别从采样数、优质点平均误差、优质点最小误差、优质点最大误差、劣质点平均误差、劣质点最大误差、优质点个数、劣质点个数以及优质点百分比这几个方面进行比较。第二种方法是参考题目所给资料中得风电场功率预测预报考核指标中得合格率以及准确率的计算方法,用这两个指标对比预测结果的误差大小,从而得出结论。4.3进一步提高风电功率测实时预测精度的探索通过对比问题一中各个模型的预测结果以及误差,参考问题二的分析结果进行分析讨论,得出影响预测精度的因素。同时查阅相关资料改进模型,对问题一中的LS-SVM进行了改善,主要是将输入变量由列向量改为矩阵形式,并给出了物理-统计组合模型,完善预测数据。五.模型的建立与求解5.1风电功率实时预测及误差分析。7在问题一中所有数据误差均为各个点实测值与预测值的相对误差。5.1.1多项式拟合:取历史时间为5月30日的96个时间点,先算一天中风电功率的相关度和不同日期同时段风电功率的相关度如下(spass程序,数据太多只截取了部分)由上数据可得,同一天中相邻的数据相关度较高,取5月30日第86到96共10个数据拟合来预测5月31日0点的电功率。由图形知,9次多项式拟合效果颇佳,但是由于多项式在后续预测中只能以单调函数的形式预测,所以结果不理想,误差很大,舍弃。5.1.2.1人工神经网络模型:人工神经网络是在现代神经科学的基础上提出和发展起来的,旨在反映人脑结构及功能的一种抽象数学模型。它在模式识别,图像处理,智能控制,组合优化,金融预测与管理,通信,机器人以及专家系统等领域得到广泛8的应用,提出了40多种神经网络模型,其中比较著名的有感知机,Hopfield网络,Boltzman机,自适应共振理论及反向传播网络(BP)等。我们在本题中将使用MATLAB动态神经网络(以下简称NNT)来进行时间序列预测。因为已知条件非常少,很多网络模型都需要更为精准的影响因素的多方数据才能建立较为可靠合理的模型,而NNT则不然,只要有个时间段的输入X,以及输出Y就可训练出未来时间段要预测的Y的权重。而且在训练过程中可以根据对隐藏层数(Numberofhiddenneurons)和numbersofdelaysd来调整相应权重以便得到更为靠近验证值的输出结果,进一步,我们可以在程序产生的误差图像上清晰的看出预测输出和实际数据的差值,更方便对比进行调整。原理可见上图。简单的叙述其原理如下:一个人工神经细胞(简称“神经细胞”)可以有任意N个输入,N代表总数,可以用下面的数学表达式代表所有n个输入:x1,x2,x3,x4,x5,……,xn同样N个权重可表达为:w1,w2,w3,w4,w5,……,wn而激励值就是所有输入与它们对应权重的之乘积之总和,因此,现在记为:A=w1x1+w2x2+w3x3+w4x4+w5x5+……wnxn如果激励值超过了阈值,神经细胞就输出1;如果激活小于阈值,则神经细胞的输出为0。本题中神经网络的拓扑结构为前馈型网络。即各神经元接受前一层的输入,并输出给下一层,没有反馈。结点分为两类,即输入单元和计算单元,每一计算单元可有任意个输入,但只有一个输出(它可耦合到任意多个其它结点作为其输入)。通常前馈网络可分为不同的层,第i层的输入只与第i−1层输出相连,输入和输出结点与外界相连,而其它中间层则称为隐层。我们粗略的将时间序列预测分为三类。第一类为NARX(nonlinearautoregressivewithexternalinput),第二类为NAR(nonlinearautoregressive),第三类为nonlinearinput-output。本题中的时间序列预测就属于NAR类。对非线性NAR时间序列应用系统可以扩散。一个NAR模型能够建立基于非线性回归量,这是通过对过去数据的输出的测量来估计下一次迭代输出的值。使一个数据集通过窗口和NAR窗口转变为一个新的输入(过去测量的)和输出集(未来的输出),这两个窗口分别为时间序列事件和一般的外部输入NAR事件。迭代预测(在递归方法中)下一个输出,该输出是基于先前的预测,及初始值都是由预测来工作。接下来使用MATLAB的neuralnetworkstart(nnstart)功能来对风电功率进行实时预测。以A机组5月31日0时0分至5月31日23时45分的实时预测为例:导入5月30日0时0分至5月31日23时45分的风电功率,以前67组数据作为训练数据,第68-81组数据作为验证数据,第82-96组数据作为测试数据得到权重,再代入5月30日21时0分至23时45分的数据求得5月31日0时0分的风电功率,即为预测值,之后的功率预测以此类推。每次训练时,结合plotresponse以及ploterrorautocorrelation两条曲线,通过改变隐藏层和delay的数值大小训练出一9组误差最小的权重。详细程序见附录,具体流程顺序参见下图。(顺序为1-2-3-4)1243下表给出了5月31日0点的实时预测,图给出了误差分析,由表中数据和图可以清晰得看出当序号越大数据的偏差也就越大,这是因为预测数据都是在历