信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn1凸优化理论与应用第7章无约束优化信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn2无约束优化问题问题描述:minimize()fx无约束问题求解的两种方法:迭代逼近:()*()kfxp求解梯度方程:*()0fx为凸函数,且二次可微。()fx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn3例梯度方程*0Pxq二次优化:1minimize,2TTnxPxqxrPS信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn4迭代起始点满足条件2的几种函数:起始点满足:(0)(0)1.dom2.{dom|()()}xfSxffxfx;为闭集。(0)x函数任意下水平集都是闭集;()fx函数的定义域为nR当时,bddomxf()fx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn5强凸性定义:函数在上具有强凸性,若满足2(),0fxmIm()fxS()fx若函数具有强凸性,则有2222()()()()21()()2Tmfyfxfxyxyxfxfxm()fx为最优值,则2*21()()2fxpfxm*p信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn6强凸性则有22()()()()2TMfyfxfxyxyx为最优值,则2*21()()2pfxfxM*p若函数在上具有强凸性,则可以证明存在,满足2()fxMI()fxS0M信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn7强凸性对于,矩阵的特征值从大到小依次为。则有:21()nmIIfxIMIxS2()nfxS1{,...,}n定义:矩阵的条件数为最大特征值与最小特征值之比,即。1/nr2()nfxS/rMm条件数的上界:信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn8下降法下降法的基本原理:迭代,满足(1)()kkxxtx为下降方向,为步长因子。(1)()()()kkfxfxxt对于凸函数,当满足时,存在某个,使得。()fxx()0Tfxxt(1)()()()kkfxfx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn9下降法下降法的一般步骤:给出初始点;domxf循环迭代计算下降方向;x搜索步长因子;t迭代:xxtx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn10步长因子搜索精确一维搜索:0argmin()ttfxtx回溯一维搜索:给定参数循环迭代初始化:令;若,则终止退出;(0,0.5),(0,1)否则令tt1t()()()Tfxtxfxtfxx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn11步长因子搜索m信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn12梯度下降法算法简单,但收敛速度较慢。下降方向:()xfx终止条件:2()fx收敛性:其中。()*(0)*()(())kkfxpcfxp(0,1)c信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn13收敛性分析则有:设函数具有强凸性,则存在和,满足:()fx2()mIfxMI0m0M22222()()()()2Mtfxtxfxtfxfx若采用精确一维搜索,则,收敛速度因子:t1/tM1/cmM若采用回溯一维搜索,收敛速度因子:t1min{2,2/}cmmM条件数越大,收敛速度越小。信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn14例当时,算法收敛速度很慢。11or初始解为,采用精确一维搜索;(,1)22121minimize(),02xx迭代:()111kkx()211kkx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn15例步长因子采用回溯一维搜索。1minimizelog(),500,100mTTiiicxbaxmn信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn16最速下降法归一化最速下降方向:argmin{()|1}Tnsdvxfxvv非归一化最速下降方向*()sdnsdxfxx欧式范数:()sdxfx二次范数:1/2()TPxxPx1()sdxPfx范数:1l()sdiifxxex信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn17最速下降法信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn18收敛性分析范数界:*2,(0,1]xx收敛速度因子:2212min{1,/}cmM信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn19牛顿法设函数二阶可微,则在附近,的泰勒展式为:泰勒展开可作为在附近的近似;21()()()()2TTfxxfxfxxxfxx()fxx()fx下降方向:21()()ntxfxfx()fxx为二次范数上的最速下降方向。221/2()(())Tfxxxfxx信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn20牛顿法信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn21牛顿减量令为在处的牛顿减量。牛顿减量的性质1:211/2()(()()())Txfxfxfx()fxx性质2:()x21()inf()()()()2ntyfxfyfxfxxx牛顿减量可作为迭代求解的误差估计。2()()Tntfxxx性质3:牛顿减量具有仿射不变性。信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn22牛顿方法初始化:给定初始解以及LOOP:计算:221()()()Tfxfxfx若则终止退出;ntxxtx一维线性搜索:计算步长因子;domxf021()()ntxfxfx2/2t迭代:信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn23收敛性分析定理:假设二阶连续可微,具有强凸性,即存在,满足:2()mIfxMI则存在,0Mm()fx且海森矩阵满足Lipschitz条件,即存在,满足:0L2222()()fxfyLxy20/,0mL2(1)()2222()()22kkLLfxfxmm若,则;若,则,且()2()kfx(1)()()()kkfxfx()2()kfx()1kt信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn24收敛性分析定理:假设二阶连续可微,具有强凸性,即存在,满足:2()mIfxMI则存在,对于,有0Mm()fx且海森矩阵满足Lipschitz条件,即存在,满足:0L2222()()fxfyLxy0k1232()*()22121()()22lkllmfxpfxmLlk信息与通信工程学院庄伯金bjzhuang@bupt.edu.cn25例