第二章无约束优化方法§2-1最速下降法(梯度法)§2-2牛顿类方法§2-3变尺度法§2-4共轭方向法§2-5鲍威尔方法§2-6其它方法(如坐标轮换法、单纯形法)第1章所列举的机械优化设计问题,都是在一定的限制条件下追求某一指标为最小,它们都属于约束优化问题。工程问题大都如此。为什么要研究无约束优化问题?(1)有些实际问题,其数学模型本身就是一个无约束优化问题。(2)通过熟悉它的解法可以为研究约束优化问题打下良好的基础。(3)约束优化问题的求解可以通过一系列无约束优化方法来达到。所以无约束优化问题的解法是优化设计方法的基本组成部分,也是优化方法的基础。(4)对于多维无约束问题来说,古典极值理论中令一阶导数为零,但要求二阶可微,且要判断海赛矩阵为正定才能求得极小点,这种方法有理论意义,但无实用价值。和一维问题一样,若多元函数F(X)不可微,亦无法求解。但古典极值理论是无约束优化方法发展的基础。目前已研究出很多种无约束优化方法,它们的主要不同点在于构造搜索方向上的差别。min()nfRxx(1)间接法——要使用导数,如梯度法、(阻尼)牛顿法、变尺度法、共轭梯度法等。(2)直接法——不使用导数信息,如坐标轮换法、鲍威尔法单纯形法等。无约束优化问题是:12[]Tnxxxx求n维设计变量()minfx使目标函数1(0,1,2,)kkkkskxx搜索方向的构成问题乃是无约束优化方法的关键。用直接法寻找极小点时,不必求函数的导数,只要计算目标函数值。这类方法较适用于解决变量个数较少的(n≤20)问题,一般情况下比间接法效率低。间接法除要计算目标函数值外,还要计算目标函数的梯度,有的还要计算其海赛矩阵。2-1梯度法1(0,1,2,)kkkkskxx1()(0,1,2,)kkkkafkxxx基本思想:函数的负梯度方向是函数值在该点下降最快的方向。将n维问题转化为一系列沿负梯度方向用一维搜索方法寻优的问题,利用负梯度作为搜索方向,故称最速下降法或梯度法。()fx搜索方向s取该点的负梯度方向(最速下降方向),使函数值在该点附近的范围内下降最快。为了使目标函数值沿搜索方向能够获得最大的下降值,其步长因子应取一维搜索的最佳步长。即有()kfxk1()[()]min[()]min()kkkkkkaaffaffafxxxxx根据一元函数极值的必要条件和多元复合函数求导公式,得'()[()]()0Tkkkkfffxxx1[()]()0kTkffxx1()0kTkss在最速下降法中,相邻两个迭代点上的函数梯度相互垂直。而搜索方向就是负梯度方向,因此相邻两个搜索方向互相垂直。这就是说在迭代点向函数极小点靠近的过程,走的是曲折的路线。形成“之”字形的锯齿现象,而且越接近极小点锯齿越细。图2-2最速下降法的搜索路径方法特点(1)初始点可任选,每次迭代计算量小,存储量少,程序简短。即使从一个不好的初始点出发,开始的几步迭代,目标函数值下降很快,然后慢慢逼近局部极小点。(2)任意相邻两点的搜索方向是正交的,它的迭代路径为绕道逼近极小点。当迭代点接近极小点时,步长变得很小,越走越慢。00102()10424()50100xfxfxxx沿负梯度方向进行一维搜索,有01000024()2100fxxx0为一维搜索最佳步长,应满足极值必要条件122()min(24)25(2100)min()fx例2-1求目标函数的极小点。解取初始点则初始点处函数值及梯度分别为0[2,2]Tx2212()25fxxx00'()8(24)5000(2100)0算出一维搜索最佳步长06260.0200307231252第一次迭代设计点位置和函数值0120241.91987721000.307178510x1()3.686164fx继续作下去,经10次迭代后,得到最优解00Tx()0fx这个问题的目标函数的等值线为一簇椭圆,迭代点从走的是一段锯齿形路线,见下图。0x将上例中目标函数引入变换2212()25fxxx221212(,)yyyy其等值线由椭圆变成一簇同心圆。仍从即出发进行最速下降法寻优。此时:0[2,2]Tx0[2,10]Ty00102()10424()220yyyyy沿负梯度方向进行一维搜索:则函数f(X)变为:y1=x1,y2=5x21000000()242410201020yyyβ为一维搜索最佳步长,可由极值条件:10022()min[()]min()()(24)(1020)yyy0()0由0260.552从而算得一步计算后设计点的位置及其目标函数:010124010200()0yy经变换后,只需一次迭代,就可找到最优解。这是因为经过尺度变换:11225yxyx等值线由椭圆变成圆。梯度法的特点(1)理论明确,程序简单,对初始点要求不严格。(2)对一般函数而言,梯度法的收敛速度并不快,因为最速下降方向仅仅是指某点的一个局部性质。(3)梯度法相邻两次搜索方向的正交性,决定了迭代全过程的搜索路线呈锯齿状,在远离极小点时逼近速度较快,而在接近极小点时逼近速度较慢。(4)梯度法的收敛速度与目标函数的性质密切相关。对于等值线(面)为同心圆(球)的目标函数,一次搜索即可达到极小点。2-2牛顿法及其改进2()()()()()1()()()2kkTkkTkkffffxxxxxxxxxxx设为的极小点1kx()x1()0kx基本思想:在xk邻域内用一个二次函数来近似代替原目标函数,并将的极小点作为对目标函数求优的下一个迭代点。经多次迭代,使之逼近目标函数的极小点。牛顿法是求函数极值的最古老算法之一。()x()x()fx1kx()fx21()()()0kkkkffxxxx121[()]()(0,1,2,)kkkkffkxxxx这就是多元函数求极值的牛顿法迭代公式。对于二次函数,海赛矩阵H是一个常矩阵,其中各元素均为常数。因此,无论从任何点出发,只需一步就可找到极小点。例2-2求目标函数的极小点。解取初始点2212()25fxxx0[2,2]Tx102010102402()()121000050ffxxxx00x()0fx从牛顿法迭代公式的推演中可以看到,迭代点的位置是按照极值条件确定的,其中并未含有沿下降方向搜寻的概念。因此对于非二次函数,如果采用上述牛顿迭代公式,有时会使函数值上升。阻尼牛顿法121[()]()(0,1,2,)kkkkkkkksffkxxxxxk阻尼因子,沿牛顿方向进行一维搜索的最佳步长,由下式求得:1()()min()kkkkkkkffsfsxxx经过一次迭代即求得极小点函数极小值阻尼牛顿法程序框图方法特点(1)初始点应选在X*附近,有一定难度;(2)尽管每次迭代都不会是函数值上升,但不能保证每次下降;(3)若迭代点的海赛矩阵为奇异,则无法求逆矩阵,不能构造牛顿法方向;(4)不仅要计算梯度,还要求海赛矩阵及其逆矩阵,计算量和存储量大。此外,对于二阶不可微的F(X)也不适用。虽然阻尼牛顿法有上述缺点,但在特定条件下它具有收敛最快的优点,并为其他的算法提供了思路和理论依据。1(0,1,2,)kkkkskxx1()(0,1,2,)kkkkafkxxx121[()]()(0,1,2,)kkkkffkxxxx121[()]()(0,1,2,)kkkkkffkxxxx一般迭代式:梯度法:牛顿法:阻尼牛顿法:梯度法与牛顿法:1()kkkkkfxxAx2-3变尺度法DFP变尺度法首先有戴维顿(Davidon)与1959年提出,又于1963年由弗莱彻(Fletcher)和鲍维尔加以发展和完善,成为现代公认的较好的算法之一。DFP法是基于牛顿法的思想又作了重要改进。这种算法仅用到梯度,不必计算海赛阵及其逆矩阵,但又能使搜索方向逐渐逼近牛顿方向,具有较快的收敛速度。1.基本思想变量的尺度变换是放大或缩小各个坐标。通过尺度变换可以把函数的偏心程度降到最低限度。例如在用最速下降法求的极小2212()25fxxx值时,需要进行10次迭代才能达到极小点[0,0]Tx如作变换y1=x1,y2=5x2把的尺度放大5倍,则目标函数等值线由一簇椭圆变成一簇同心圆。x2221212(,)yyyy消除了函数的偏心,用最速下降法只需一次迭代即可求得极小点。梯度法构造简单,只用到一阶偏导数,计算量小,初始点可任选,且开始几次迭代,目标函数值下降很快;其主要缺点是迭代点接近X*时,即使对二次正定函数收敛也非常慢。牛顿法收敛很快,对于二次函数只需迭代一次便达到最优点,对非二次函数也能较快迭代到最优点,但要计算二阶偏导数矩阵及其逆阵,对维数较高的优化问题,其计算工作和存储量都太大。能不能将两种算法的优点综合起来,扬长避短?1()kkkkkfxxAxAk是需要构造n×n的一个对称方阵,如Ak=I,则得到梯度法;21[()]kkfAx则得到阻尼牛顿法;如当矩阵Ak不断地迭代而能很好地逼近21[()]kfx时,就可以不再需要计算二阶导数。变尺度法的关键在于尺度矩阵Ak的产生。对于二次函数:1()2TTfxxGxbxcxQx进行尺度变换在新的坐标系中,函数f(x)的二次项变为:1122TTTxGxxQGQx目的:减少二次项的偏心如G是正定,则总存在矩阵Q,使得:TQGQI用矩阵Q-1右乘等式两边,得:用矩阵Q左乘等式两边,得:1TQGQTQQGI所以1TQQG上式说明:二次函数矩阵G的逆阵,可以通过尺度变换矩阵Q来求得。121[()]()(0,1,2,)kkkkkffkxxxx牛顿迭代公式:1()(0,1,2,)kkTkkQQfkxxx记:TAQQ搜索方向:1()(0,1,2,)kkksfkAx迭代公式:1()(0,1,2,)kkkkkfkxxAxA称为变尺度矩阵2212()25fxxx在例2-2中122121222011()2505022TxfxxxxxxxGx20050G如取1021052Q11002010221050101005252TQGQI求得:1111000222111000505252TGQQ2.构造尺度矩阵Ak从初始矩阵A0=I(单位矩阵)开始,通过对公式1kkkAAA因此,一旦达到最优点附近,就可望达到牛顿法的收敛速度。1)DFP法(Davidon-Fletcher-Powell)[][][][]TkkkkkTkkkTkkTkkxxAggAAxggAg111()()kkkkkkkkffgggxxxxx式中中修正矩阵的不断修正,在迭代中逐步逼近于kA1()kGx。2)BFGS算法(Broyden-Fletcher-Goldfrob-Shanno)DFP算法由于舍入误差和一维搜索不精确,有可能导致构造矩阵的正定性遭到破坏,以至算法不稳定。BFGS算法对于维数较高