第三章最优化理论初步§3.1基本问题最优化要解决的基本问题是:)(minxf0)(..xigtsi=1,2,…,m0)(xjhj=1,2,…,n其中,nRx,f,gi,hj都定义在开集nRD。f称为目标函数,gi,hj称为约束条件。无约束条件的优化问题称为无约束极值问题,带有约束条件的优化问题称为约束极值问题。最优化理论研究的主要内容:1)解的存在性条件;2)近似算法。常用的四种方法:1)Lagrange方法;2)差分方法;3)极大极小原理(Pontryagin原理);4)动态规划(Bellmen方法)。基本定理Kuhn-Tucker定理§3.2基础知识1)梯度Tnxfxff),,(1Hesse矩阵jixxff22,i,j=1,2,…,n222212222221221221212nnnnnnxfxxfxxfxxfxfxxfxxfxxfxf2)凸分析初步凸集的定义设S是Rn空间中的一个子集,若对任意的,xyS,及任意的01,有(1)xyS则称S是Rn空间中的凸集。凸集的性质:1、凸集的交集也是凸集;2、定义集合1122{:,,,1,2,,}nniiiSzzaxaxaxxSaRin称为iS的线性和。设iS,1,2,,in都是Rn空间中的凸集,则也是Rn空间中的凸集;3、设iS,1,2,,in都是Rn空间中的凸集,则它们的笛卡尔积也是Rn空间中的凸集。凸函数和凹函数的定义:定义:设f是定义在Rn空间中的凸集S上的实值函数,若对,xyS和01,有[(1)]()(1)()fxyfxfy则称f是定义在S上的凹函数。若有[(1)]()(1)()fxyfxfy则称f是定义在S上的凸函数。若对任意的,xyS,上述不等式都是严格的不等式,则称函数为严格凹(凸)函数。一元凸(凹)函数的几何意义是曲线上任意两点的连线都在曲线的上(下)方。如图。注意:1、线性函数是唯一一个既是凹函数,有是凸函数的函数。2、一个函数有无凸性,与它的定义域有关,如函数-3-2-1123-1-0.50.51sinyx。凹函数的一些常用性质:1、设f是定义在凸集S上的实值函数,则对于aR,集合{:,()}xxSfxa是凸集;2、凹函数的非负线性组合仍是凹函数,即对于0ia,1,2,,ik,若if,1,2,,ik是凹函数,则1122kkafafaf也是凹函数;3、设S是Rn空间中的凸集,f是S上的实值凹函数的必要充分条件是对任意正数k,及任意的ixS,0i,且121k,有11221122()()()()kkkkfxxxfxfxfx4、设S是Rn空间中的凸集,f是S上的实值可微函数,f是凹函数的必要充分条件是对任意的01,xxS,01010()()()xxfxxfxfx5、设S是Rn空间中的开凸集,f是S上的实值二阶可微实值函数,则i.f在S上是凹的,当且仅当对xS,2()fx是半负定的;ii.如果对xS,2()fx是负定的,则f在S上是严格凹的;iii.f在S上是凸的,当且仅当对xS,2()fx是半正定的;iv.如果对xS,2()fx是正定的,则f在S上是严格凸的。设有生产函数()yfx。其中,x表示n个要素的投入量,y表示单一产品的产出。假设f是凹函数,则由性质5,对01,nxxR,且01xx,有01010()()()()xxfxxxfxfx和10101()()()()xxfxxxfxfx取定i,对任意的ji,令10jjxx,然后,让i遍取1,2,…,n,则有0110()()()0iiiifxfxxxxx。设10iixx,则对1,2,,in,有01()()0iifxfxxx即f对每个变量的偏导数都是非增的。这说明如果生产函数是凹的,则任何要素的边际产出都是非增的。特别地,若f是严格凹函数,则任何要素的边际产出都是递减的。如果f代表消费者的效用函数,则效用函数的凹性假设表明效用边际递减的特性。若进一步假定生产(效用)函数是二阶可微的,则可直接得到产出(效用)的非增性质。3)无约束极值问题一阶必要条件:0)(*xf;二阶充分条件:)(*2xf正定极小;)(*2xf负定极大。4)等式约束与Lagrange方法问题:)(minxf0)(..xigts,i=1,2,…,m或者,令Tmgg))(,),(()(1xxxg,则上面的问题可以改写为)(minxf0)(..xgts通常假设)(xg连续可微。设mR,令)()()(xgxx,fL称为原问题的Lagrange函数。容易证明,L的无约束极值点),(**x中的*x是原问题的约束极值点。证明该结论的基本思想:(为简化记号,以两个变量,一个约束为例)设问题为),(minyxfz0),(..yxgts假设由约束中可以将y解出来,记为y=k(x)。将它带入目标函数,有))(,(),(xkxfyxfz这样,就把约束极值问题转变为无约束极值问题了。根据极值的一阶必要条件,有0dxdyyfxfdxdz注意到,在隐函数0),(yxg中,y对x导数为ygxgdxdy带入上式,有0ygxgyfxf整理得并引入新记号ygufxgxf则极值点的必要条件可以写为0xgxf0ygyf0),(yxg上面的三个式子正是Lagrange函数的偏导数。在L的最优解中,称*是原问题的Lagrange乘子,在经济研究中,也称为影子价格。影子价格的经济意义:假设目标函数代表利润函数,约束条件表示需投入的资源及限额。则影子价格表示在最优生产计划处,再增加一单位的资源所带来的利润。可以证明,*x是函数),(*xL的极小值点,*是函数),(*xL的极大值点。一般来说,设有函数)(y,xF,若点),(**yx满足条件:)()()(****y,xy,xy,xFFF则称),(**yx是函数(,)Fx的鞍点。5)最大最小问题在最优化理论中,我们要寻找最大值或最小值,但是,给出的条件仅仅是极值点的条件。其原因如图。为了保证极值点也是最值点,需要增加一个条件,即凸性假设。大多数极值点的必要条件,增加凸性条件后,就变成了必要充分条件了。§3.3有不等式约束的极值问题记mTmRggg))(,),(),(()(21xxxxg,pTpRhhh))(,),(),(()(21xxxxh,则一般的最优化模型可以简写为)(minxf(P)0)(..xgts0)(xh解决该问题的难点:极值点*x有可能在0)(*xig处取得。一阶Kuhn-Tucker条件(必要条件)设*x是问题(P)的解,g,f在*x处可微,h在*x处连续可微,pjhjx*,,2,1)(线性独立,且存在nRz,满足条件:若0)(*xig,则0)(zx*ig和0)(zx*jh,j=1,2,…,p,则存在mR*,**R,使得0)()()(*****xhxgxf0)(**ixigi=1,2,…,m(松弛条件)0*在这里,**,也是影子价格。松弛条件的意义:假设在*x处,0)(*xig,这意味着在最优处,第i种资源有多余的。因此,影子价格为0;若0)(*xig,这意味着在最优处,第i种资源是紧缺的,是一个瓶颈,故其影子价格大于0。例1:)(minxf0)(..xgts引入与无约束极值问题同样的Lagrange函数)()(),(xgxxfL,则它的T-K条件是0Lx0L0)(**ixigi=1,2,…,m(松弛条件)0*i例2)(minxf0)(..xgts其T-K条件是0Lx0L0)(**ixigi=1,2,…,m(松弛条件)0*i例3)(maxxf0)(..xgts其T-K条件是0Lx0L0)(**ixigi=1,2,…,m(松弛条件)0*i例4)(maxxf0)(..xgts其T-K条件是0Lx0L0)(**ixigi=1,2,…,m(松弛条件)0*i§3.4影子价格现在以线性规划为例,解释影子价格的经济意义。下列一对线性规划称为互为对偶的规划:xcmin(A)bxAts..0xbymax(B)cyAts..0y在经济学中,yx,互称为影子价格。例:某厂生产甲、乙两种产品,需要先后经过两种机床加工。甲产品在机床1上所需加工工时为3,在机床2上为3;乙产品在机床1上所需加工工时为1,在机床2上为4;机床1、2的可用工时分别为48、120;甲、乙产品的利润分别为5、6。问题1甲、乙产品各生产多少,能使利润最大?问题2若将机床出租,问租金至少是多少?解:设产品产量为x1,x2;机床租金y1,y2。则上述两问题的数学模型分别为下列两个线性规划:2165maxxx(A)483..21xxts1204321xx0,21xx2112048minyy(B)533..21yyts6421yy0,21yy容易看出,模型(A)和模型(B)互为对偶。因此,某种资源的影子价格就是一单位该资源的赢利能力。因此它具有价格特性,然而,这种价格不会出现在交易中,故称为影子价格。§3.5