基于气候相似度光伏系统发电功率的预测摘要:对光伏发电系统功率进行预测可以帮助提高电力系统运行的安全性和稳定性,具有现实意义。本文分析了影响光伏发电功率的各项因素,采用了一种加入气象数据信息的神经网络发电预测模型,计算了历史气象数据与预测日的相似度,用相似度较高日的发电数据代入BP神经网络预测模型进行了预测和评估。预测结果表明,预测模型有较高的精度,能够提高系统的稳定运行能力。关键词:光伏功率预测;神经网络;气象数据;相似度1引言光伏发电具有波动性和间歇性,大规模光伏电站并网运行会影响电力系统的安全稳定经济运行。对光伏电站的输出功率进行预测有助于电网调度部门统筹安排常规电源和光伏发电的协调配合,适时及时地调整调度计划,合理安排电网运行方式,一方面有效地减轻光伏接入对电网的不利影响,提高电力系统运行的安全性和稳定性,另一方面降低电力系统的旋转备用容量和运行成本,以充分利用太阳能资源,获得更大的经济效益和社会效益。因此,需要一种好的光伏发电功率预测方法对光伏系统发电功率进行预测[1]。目前,光伏功率预测从预测方法上可以分为统计方法和物理方法。统计方法是对历史数据进行统计分析,找出其内在规律并用于预测。物理方法需对光伏电站所在地进行物理建模,将平均温度、最高气温、最低气温、日类型等气象预测数据作为输入,采用物理方程进行预测。实际应用中是将两者结合起来[2]。从预测方式上可分为直接预测和间接预测。直接预测方式是直接对光伏电站的输出功率进行预测。间接预测方式首先对地表辐照强度进行预测,然后根据光伏电站出力模型得到光伏电站的输出功率[3];从时间尺度上可以分为超短期功率预测和短期功率预测。超短期功率预测的时间尺度为30min~6h,短期功率预测的时间尺度一般为1~2d[4]。2光伏发电系统相似日的计算2.1影响光伏发电功率的因素在光伏系统发电功率的预测模型中,影响预测精度的因素很多,如当前的发电状态、光伏电池温度、太阳辐射强度、天气因素以及其他一些随机因素都会对未来的发电状态产生影响[5]。天气因素对于光伏阵列发电的影响是相当显著的,天气状态包括气温、湿度、阴天、降雨、降雪、冰雹、风速等诸多因素,对发电量影响较明显的一个因素是气温。此外,降雨、阴天、降雪等日类型对光伏阵列影响也不容忽视。阴天通常会降低该地区的辐射强度,而降雨则会使辐射强度显1著下降,因而会对发电量产生影响。季节性因素对于光伏阵列发电量影响也是非常清晰的,这种影响源于太阳辐射强度的差异,发电功率随着辐射强度的变化而变化,季节性的发电量差异是一个具体表现。此外,由于地理位置的不同,各地的气候状况千差万别,季节性因素对于发电量特性影响的程度也是不同的[6]。因此,本文选取日平均温度、最高气温、最低气温及日类型作为影响光伏发电功率的因素。这些大致决定全天气象状况的局部信息,可由气象部门提供得到。2.2相似度的计算对于光伏阵列来说,一个明显的特征就是发电量时间序列本身高度自相关,所以,短期发电量预测模型中都将发电量时间序列作为输入变量。由于受到诸多因素的影响,发电量的变化是一个非平稳的随机过程,但同时又呈现出明显的周期性变化。在部分时间点,或者某些条件下,发电功率有一定的相似性[7]。因此提出了将相似度用于发电功率短期预测的模型,该模型首先计算气象数据与预测日的相似度,并确定相似度的阈值来筛选与预测日相似的气象数据,然后利用神经网络进行发电功率的计算,从而完成对发电功率的预测。光伏发电功率的影响因素构成如下向量:minmax,,,YTTTX(1)式中:T为平均温度,minT、maxT分别为最低温度和最高温度,X为日类型。将神经网络应用于系统发电功率的预测问题时,训练网络的原始数据中,不同的变量通常以不同的单位变量,数量级的差异也比较大,如发电量量的变化范围在0到100之间,然而气温通常的变化范围则在-10到40之间。我们由神经元激活函数的特性可以知道,神经元的输出通常被限制在一定的范围内,大多数人工神经网络的应用中使用的非线性激活函数为S函数,其输出被限定在(0,1)或(-1,1)之间,原始数据,尤其是期望输出值通常在此区间之外,直接以原始数据对网络进行训练会引起神经元饱和,因此在对网络进行训练之前必须对数据进行预处理,以消除原始数据形式不同所带来的不利,通常的做法是归一化处理。研究表明:以恰当的方式对数据进行归一化处理可以加速神经网络的收敛。归一化可以在模型的单个输入变量通道上独立进行,也可以对所有的输入通道一起进行。输入变量常用的归一化方法有以下几种:(1)简单归一化;(2)线性变换到[0,1]区间;(3)线性变换到区间[a,b]上。2当需要输入和目标数据落入[0,1]区间时,归一化公式为minmaxminnnppPppminmaxminnnnnNnn(2)式中:np,nn——原始输入、目标数据;minp,maxp,minn,maxn——p和n中的最小值和最大值;nP,nN——归一化后的输入、目标数据影响向量:(1)(2)(3)(4),,,TpppppYYYYY(1)(2)(3)(4),,,TNNNNNYYYYY(3)PY与NY在第k个因素的关联系数为minminmaxmaxmaxmaxPNPNNkNkNPNPNNkYkYkYkYkkYkYkYkYk(4)式中:是分辨系数,其值一般取0.5。综合各点的关联系数,定义整个PY与NY的相似度为41NNkFk(5)采用这种连乘方式定义相似度,可简单、自动地识别主导因素,并解决各因素权重设定问题。选择第i日相似日的具体步骤为:1)从最临近历史日开始,逆向逐日计算第j日与第i日的相似度值NF。2)选取最近一段时间中相似度最高的m日或者相似度NFr(r为一定的数值,本文中取r=0.80)的m日作为第N日的相似日。3BP神经网络BP神经网络是基于误差反向传播算法的人工神经网络,它随着数据信息的不断变化,可进行自我学习改进,完成正向误差传播和反向误差传播。数据每经3一次处理,神经网络就可完成一次自我学习,不断完成教学修正,自动对各数据计算权重值进行调整优化,直至数据处理结果和实际测量接近,并不断进行神经网络的学习训练[8]。本文采用BP神经网络进行光伏系统发电功率预测模型的结构设计,创建BP网络函数包含了输出、隐层数、隐层节点数、传递函数及训练函数等参数,因此只有在确定了这些网络参数后才能创建网络。网络的训练和模拟就是采用事先选定的训练样本、测试集样本利用MATLAB提供的训练和模拟函数来进行就可以了[9]。如图1所示为神经网络的学习算法原理。图1神经网络的学习算法Figure1LearningalgorithmofArtificialNeutralNetwork输出量代表系统要实现的功能目标,其选择确定相对容易,例如系统的性能指标,分类问题的类别归属,或非线性函数的函数值等等。输入量必须选择那些对输出影响大且能够检测或提取的变量,此外还要求各输入变量之间互不相关或相关性很小,这是输入量选择的两条基本原则[10]。对于设几个隐层和每个隐层设几个隐节点的问题,不存在通用性的理论指导,但根据神经网络设计者的实践经验,关于隐层数的设计,理论分析证明,具有单隐层的前馈网可以映射所有连续函数,只有当学习不连续函数(如锯齿波等)时,才需要两个隐层,当一个隐层的隐节点数很多仍不能改善网络性能时,才考虑再增加一个隐层。确定最佳隐节点数的一个常用方法称为试凑法,可用一些隐节点数的经验公式,这些公式计算出来的隐节点数只是一种粗略的估计值,可作为试凑法的初始值。4下面介绍几个公式[11]:mnl(6)log2nm(7)mnl(8)以上各式中m为隐层节点数,n为输入层节点数,l为输出节点数,为1-10之间的常数。在本文中,选取公式(8)计算隐层节点数。4预测实例4.1预测模型结合相似日的外推效果和BP神经网络的优点,本文采用相似日和BP神经网络结合的光伏发电功率预测模型。具体预测的步骤为:1)根据计算光伏发电功率相似日的方法,选择相似度大于0.8的日子作为预测日的相似日。一般地,相似日个数m要大于3,以满足训练网络有较强的外推性。2)以历史日实际数据作为输出,将该历史日m个相似日相同时间的数据作为输入,对历史日以及其相似光伏发电功率样本进行BP神经网络训练。3)选择预测日的m个相似日,将相似日样本输入训练好的BP神经网络,得出预测日的光伏电场发电功率。BP神经网络预测模型见图2。图2BP神经网络预测模型Figure2PredictionmodelofBPArtificialNeutralNetworka、输入层节点的确定输入层节点对应于模型的输入变量,模型采用10个输入变量,这10个输入变量为相似日的光伏发电数据。b、输出层节点的确定5这是由要预测的内容决定的。本文的输出向量(目标向量)为预测日的发电功率。c、隐含层及隐节点数的确定通过前面关于隐层数选择的分析,本文采用了3层的BP网络。由于输入层节点为10点,输出层节点为3点,则隐层节点数约为5点。通过预测模型所得到的流程图如下:图3程序流程图Figure3FlowchartofProgram4.2预测结果4.2.1相似度的计算考虑到光伏发电系统出力的季节性影响因素,取云南某光伏发电站所在地2010年10月1日-10月31日的气象数据构成样本数据集,以10月24日作为预测日,利用公式(5)计算相似度,用MATLAB7编程计算,所得到的10月24日与其它30日的相似度结果如表1所示。6表1相似度计算结果Table1CalculationresultsofSimilaritydegree日期12345678910相似度0.680.800.850.900.800.850.780.660.850.65日期11121314151617181920相似度0.720.670.790.790.700.930.850.810.660.74日期21222325262728293031相似度0.630.600.730.840.650.570.530.500.620.58选取0.80NF的10d作为24日的相似日,则相似日共有10个。4.2.2BP神经网络收集云南某光伏发电站的发电数据,将10个相似日对应的发电功率数据整理,输入BP神经网络进行预测,得到10月24日的光伏发电功率预测值。图4神经网络训练结果Figure4TrainingresultsofNeutralNetwork4.3误差分析常见的神经网络模型的评估方法为平均绝对误差,均方根误差等,均方根误差能够对出现较大误差的情况进行放大,采用均方根误差作为模型评估方法能够7保证模型预测误差的平稳性。本文采用均方根误差RMSE及均方误差MSE对结果进行分析,如表2所示。20iiNfaiPPRMSEN20iiNfaiPPMSEN(9)式中:N——数据的个数;ifP——预测值;iaP——实际值;i——预测时间。表2预测误差统计Table2StatsofPredictionerrorRMSEMSE5.99e-0023.58e-0055结论(1)采用光伏发电功率相似日的选择方法对光伏发电数据进行甄别和预处理,筛选出了某些特征相似、适于进行预测的样本,并将其作为神经网络的输入。由于筛选出的这些样本相似度高,所以对光伏发电功率的预测精度有很大的帮助。(2)运用云南某光伏发电场的发电功率数据对本文预测模型进行验证,其预测精度相对满意,该方法具有一定的实用性。(3)由于相关因素的数据有限,本文在预测精度上仍然不理想,随着相关因素数据的进一步完善,预测精度将进一步提高。参考文献:[1]李军,许继生,王生渊,等.一种并网型光伏电站光功率及发电量预测的方法[J].青海电力,2010,29(2):18-20.[2]MaLei,LuanShiyan.Areviewontheforecastingofwindspeedandgeneratedpo