东北石油大学本科生毕业设计(论文)文献翻译1模型预测油田水中溶解的碳酸钙含量:压力和温度的影响XXX译摘要:油田中水垢沉积会对储层造成伤害、堵塞地层孔道、表面以及注入设备。碳酸钙是水中最常见的结垢化合物之一,储层产生的盐水会使压力和温度降低,储层压力降低会使CaCO3的溶解度降低,进而提高体系中碳酸钙的饱和速率,而温度下降会产生相反的结果。因此温度和压力一起作用的结果可能增加或减小CaCO3溶解度,用体系温度的变化来指定其压力的变化。因此,在石油生产系统中精确的预测方法的应用备受关注。目前的研究重点是运用基于最小二乘支持向量机(LSSVM)预测模型来估计油田水中溶解碳酸钙浓度的大小。用超优化参数(r和C2)的遗传算法(GA)嵌入到LSSVM模型,这种方法可简单准确的预测油田卤水中溶解碳酸钙浓度的最小量。1.引言随着油田卤水压力和温度变化,气体可能会从储层到地表的运动,导致某些固体沉淀。为了保持注水井压力平衡并将油运移到生产井,有时需要将卤水注入到储层中,因此,过量的盐垢可以沉积在储层或井眼内。对于大部分油田结垢多会发生在此过程中。碳酸钙沉积通常是一个自发的过程,沉积形成的主要原因是二氧化碳从水相逸出,导致油气层的压力下降,该过程会除去了水中的碳酸,直到方解石溶解完全。在恒定二氧化碳分压下,方解石的溶解性随温度的降低而降低[1-4]。根据公式(1),碳酸钙沉积垢来自碳酸钙沉淀:Ca2++CO32-→CaCO3↓下面的公式为碳酸的电离式[5–7]:CO2+H2O→H2CO3H2CO3→H++HCO3-HCO3-→H++CO32-若要形成碳酸氢根离子和氢离子,碳酸要电离,因为碳酸的第一电离常数远大于它的第二电离常数,从碳酸第一电离离子化的氢离子与水中自由的碳酸根离子结合。此外,碳酸钙沉淀的方程式可以说明[8–10]:东北石油大学本科生毕业设计(论文)文献翻译2Ca(HCO3)2→CaCO3↓+CO2↑+H2O碳酸钙的溶解度很大程度上取决于二氧化碳在水中的含量(即二氧化碳气体逸出时所需最小的分压)[10–12]。二氧化碳气体注入到储层卤水可产生酸性溶液,能溶解地层中的方解石,压力的下降导致二氧化碳气体从酸性溶液中逸出,并且在近井地带的地层空隙和射孔眼处沉积碳酸盐垢。而且,在井筒附近产生的垢会进一步导致气井产能的下降和更多结垢的产生[13,14]。Bahadori借助范德蒙德行列式的相关性来研究估算油田卤水溶解的碳酸钙浓度[15]。本论文中涉及到的最小二乘支持向量机(LSSVM),是作为一种传统简化的支持向量机(SVM)来预测油田卤水中溶解碳酸钙浓度量的大小。遗传算法(GA)偶合来优化主题,用于确定超参数。据我们所了解的,目前还没有文献记录采用支持向量方法进行天然气产能建模。2.原理理论2.1最小二乘支持向量机(LSSVM)支持向量机(SVM)最初形成的是一种智能化的系统方法[16]。支持向量机已被广泛应用于分类,回归分析和模式识别,是一种非常有效的而方法[17]。支持向量机的原理是对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能,并且基于结构风险最小化理论之上在特征空间中建构最优分割超平面[18]。这种新方法基于结垢风险最小化理论(SRM)和统计学理论(SLT)概念[19]。支持向量机通过求解二次规划(QP)问题来发现目标函数的全局最小值,而不是获得局部最优解。与其他回归技术不同,二次规划问题是一个凸函数[20]。然而,这种做法可能会耗时并且困难,因为它需要各种非线性公式(QP),Suyken和Vandewalle[21]建议最小二乘支持向量机(LSSVM)作为支持向量机(SVM)的一个备用方法。SVM也具有LSSVM类似的优点。此外,需要一个二次规划(QP)可代替多个非线性公式(线性规划),这使得计算问题简单且容易处理。LSSVM公式中的非线性函数可表示如下,给出训练集{Xk,Yk},K=1,2,…N,其中Xk∈Rn,是第i个输入到输入集合空间,Yk∈R输出值为特定输入变量的对应值(即Xk),N是指训练样本的数目,通过一个非线性映射,把样本空间映射到一个高维乃至无穷维的特征空间中,构造的回归模型如下:东北石油大学本科生毕业设计(论文)文献翻译3其中w表示权重向量,而b是一个偏置术语,上表“n”是数据区域的范围,“nh”表示未知区域(高维和无穷维)的范围[20]。当应用LSSVM时会产生一个新的优化问题,该方法涉及的优化问题如下:根据下列等式进行约束:其中r表示正则化参数的平衡训练误差和模型阐述[19],ek是回归误差。拉格朗日乘子理论构造如下,以找到优化问题的约束条件:其中,ak拉格朗日乘子或支集值,为了获得上述方程的解,对上述方程中的变量w,b,ek,ak微分:在除去变量w和e后,获得Karush-Kuhn-Trucker系统如下:其中y=[y1,…yN]T,1N=[1,…1]T,a=[a1,…aN]T,I是一个单位矩阵,是内核函数,必须满足Mercerd的条件内核函数三种典型的选择方法如下所示:(1)线性核函数K(x,y)=x·y;(2)多项式核函数K(x,y)=[(x·y)+1]^d;(3)径向基函数K(x,y)=exp(-|x-y|^2/d^2)由此LSSVM模型函数估计如下:东北石油大学本科生毕业设计(论文)文献翻译4其中(b,a)是式(14)线性系统的解。文献中,一些综合性描述支持向量机内容是可用的[16,21,23],并且对最小二乘支持向量机理论的解释很详细[21,24],此外,刘等人[25–27],提供了LSSVM理论价值的解释,以及SVM和LSSVM在有关情况下的区别,所以,感兴趣的读者可以参考上述文献以了解更多的细节。2.2遗传算法遗传算法(GeneticAlgorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。遗传算法是从代表问题可能潜在的解集的一个种群(population)开始的,而一个种群则由经过基因(gene)编码的一定数目的个体(individual)组成。每个个体实际上是染色体(chromosome)带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现。因此,在一开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如二进制编码,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度(fitness)大小选择(selection)个体,并借助于自然遗传学的遗传算子(geneticoperators)进行组合交叉(crossover)和变异(mutation),产生出代表新的解集的种群。这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码(decoding),可以作为问题近似最优解。1.初始化:此阶段由r和C2超参数来创造染色体,C2表示正规化因素,r代表RBF核函数的宽度,染色体A的定义为A={a1,a2},其中a1和a2与r和C2相对应的,此外,选定种群数量大小为20的,最大的代分配给100,初始化代分配给0。2.评价适应度:此阶段,对每一个解(染色体)指定一个适应度的值,根据问题求解的实际接近程度来指定(以便逼近求解问题的答案)。测试数据的平均相对偏差为适应度函数。其中Caiactual表示实际碳酸钙浓度的大小,Caipredicted表示用LSSVM模型预测碳酸钙浓度的级数。3.选择:选择的目的是把优化的个体(或解)直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。轮盘赌选择法(roulettewheelselection)是最简单也是最常用的选择方法。东北石油大学本科生毕业设计(论文)文献翻译5图1遗传算法的超参数选择流程图4.交叉:所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。生成每一对新的染色体的可能性为0.8,且执行单点交叉,新染色体结合为新的个体后代。5.变异:变异操作遵循交叉操作,并确认是否有染色体变异来进行进一步创造,在目前的进展中,均匀变异概率为0.05,此进化方法设计并执行。6.下一代:一代一代演化下去,直到达到期望的解为止。7.终止条件:当最优个体的适应度达到给定的阈值,或者最优个体的适应度和群体适应度不再上升时,或者迭代次数达到预设的代数时,算法终止,预设代数为100。3.方法论GA-LSSVM是由实验室1.8免费工具箱和遗传算法工具箱MATLABR2009a对LSSVM变量进行优化。在识别和收集数据之后,再定义LSSVM模型的输入和输出参数,在文献数据库的基础上,油田卤水中溶解碳酸钙浓度量作为LSSVM预测模型的输出参数,该模型有两个输入参数:压力和温度。识别收集的实际数据库分为两个子集。首先在预测培训的过程中,利用整个数据的80%(63个数据点),50个等于数据线,剩余的13个组成样本设置,来检验上述建议方法的评估能力和完整性。与其他内核函数比较,RBF核的参数少并且有最佳的整体性能,因此RBF核函数在文献中被视为一种合适有效的内核函数[30,31]。在利用LSSVM模型和东北石油大学本科生毕业设计(论文)文献翻译6RBF核函数开发模型,在上述方程中超参数r2和C2规范很重要,因为这两个参数在获得高估计完整性和概括性的LSSVM模型中有很重要的作用,其中r2为正则化因子,C为样本方差[20]。根据Ahmadi等,其中包括Levenberg-Marquardt(LM)和SimplexSlmelatedAnnealingAlgvrithm(M-SIMPSON)不倡导不是基于逐代优化技术的方法,因为支持向量机无法处理高非线性问题。基于逐代优化技术即遗传算法,已经用于对超参数(r2和C2)的评估,AARD的测试数据为遗传算法的适应度,重复优化过程才肯能确定,相应的ARRD变量如图2所示.在图2中,36代后ARRD稳定,并达到最佳态,通过这种方式,从油田卤水溶解碳酸钙浓度量获得r2和C2级数值,分别为20.961370794和1072577.9326。图2-ARRD变异随代数的变化4.结果和讨论在本研究中,确定参数r2和均方误差(MSE)评价预测模型有效性和准确性的指标,计算MSE和r2的表达式如下:其中,N表示数据点的数量,yiactual表示第i个数值,yipredicted表示第i个输出模型值,yiactual平均表示实验观察数据的平均值。表1中有MSE和r2值,用于预测训练,测试和数据分析。最后,如果得到r2和MSE值分别接近于1和0,GA-LSSVM预测估计结果令人满意。东北石油大学本科生毕业设计(论文)文献翻译7表1-用于预测油田卤水中溶解碳酸钙的GA-LSSVM方法性能和优化超参数模型中得到的结果,油田卤水中溶解碳酸钙浓度量大小随温度的实际变化,如图3所示,此外,油田卤水中溶解碳酸钙浓度量大小随压力的实际变化,如图4所示,此外,油田卤水中溶解碳酸钙浓度量大小随压力和温度变化的三维图见附录A,GA-LSSVM模型预测和实际油田卤水中溶解碳酸钙浓度量大小的比较,如图5所示,此图所表示的GA-LSSVM模型预测和实际油田卤水中溶解碳酸钙浓度量大小值相互覆盖的现象。图3-油田卤水中溶解碳酸钙浓度量大小随温度的实际变化[1,15].图4-油田卤水中溶解碳酸钙浓度量大小随压力的实际变化[1,15]东北石油大学本科生毕业设计(论文)文献翻译8图5-GA-LSSVM模型预测和实际油田卤水中溶解碳酸钙浓度量大小的比较油田卤水中溶解碳酸钙浓度量大小的实际值与GA-LSSVM预测估计值关系,如图6所示,油田卤水中溶解碳酸钙浓度量大小预测值分散在1:1线出,表明GA-optimized模型可以很好的预