凸优化初步七月算法邹博2015年3月31日2/50julyedu.com主要内容凸集基本概念凸集保凸运算分割超平面支撑超平面凸函数基本概念上境图Jensen不等式凸函数保凸运算凸优化一般提法对偶函数鞍点解释用对偶求解最小二乘问题强对偶KKT条件3/50julyedu.com思考凸集和凸函数y=x2是凸函数,函数图像上位于y=x2上方的区域构成凸集。凸函数图像的上方区域,一定是凸集;一个函数图像的上方区域为凸集,则该函数是凸函数。稍后给出上述表述的形式化定义。因此,学习凸优化,考察凸函数,先从凸集及其性质开始。4/50julyedu.com凸集集合C内任意两点间的线段均在集合C内,则称集合C为凸集。5/50julyedu.com凸集6/50julyedu.com超平面和半空间超平面hyperplane半空间halfspace7/50julyedu.com超平面和半空间8/50julyedu.com多面体多面体有限个半空间和超平面的交集。仿射集(如超平面、直线)、射线、线段、半空间都是多面体。多面体是凸集。此外:有界的多面体有时称作多胞形(polytope)。注:该定义略混乱,不同文献的含义不同。9/50julyedu.com多面体10/50julyedu.com保持凸性的运算集合交运算思考:如何证明?(提示:根据定义)仿射变换函数f=Ax+b的形式,称函数是仿射的:即线性函数加常数的形式透视变换投射变换(线性分式变换)11/50julyedu.com集合交运算:半空间的交12/50julyedu.com仿射变换仿射变换伸缩、平移、投影若f是仿射变换,若S为凸集,则f(S)为凸集;若f(S)为凸集,则S为凸集。13/50julyedu.com透视变换透视函数对向量进行伸缩(规范化),使得最后一维的分量为1并舍弃之。透视的直观意义小孔成像14/50julyedu.com透视变换的保凸性凸集的透视变换仍然是凸集。思考:反过来,若某集合的透视变换是凸集,这个集合一定是凸集吗?15/50julyedu.com投射函数(线性分式函数)投射函数是透视函数和仿射函数的复合。g为仿射函数:定义f为线性分式函数若c=0,d0,则f即为普通的仿射函数。16/50julyedu.com分割超平面设C和D为两不相交的凸集,则存在超平面P,P可以将C和D分离。注意上式中可以取等号:所以:逆命题:“若两个凸集C和D的分割超平面存在,C和D不相交”为假命题。加强条件:若两个凸集至少有一个是开集,那么当且仅当存在分割超平面,它们不相交。17/50julyedu.com分割超平面18/50julyedu.com分割超平面的构造两个集合的距离,定义为两个集合间元素的最短距离。做集合C和集合D最短线段的垂直平分线。19/50julyedu.com支撑超平面设集合C,x0为C边界上的点。若存在a≠0,满足对任意x∈C,都有成立,则称超平面为集合C在点x0处的支撑超平面。凸集边界上任意一点,均存在支撑超平面。反之,若一个闭的非中空(内部点不为空)集合,在边界上的任意一点存在支撑超平面,则该集合为凸集。20/50julyedu.com思考如何定义两个集合的“最优”分割超平面?找到集合“边界”上的若干点,以这些点为“基础”计算超平面的方向;以两个集合边界上的这些点的平均作为超平面的“截距”支持向量:supportvector若两个集合有部分相交,如何定义超平面,使得两个集合“尽量”分开?注:上述“集合”不一定是凸集,可能是由若干离散点组成。若一组集合为(x,1),另一组集合为(x,2),则为机器学习中的分类问题。21/50julyedu.com凸函数若函数f的定义域domf为凸集,且满足22/50julyedu.com一阶可微若f一阶可微,则函数f为凸函数当前仅当f的定义域domf为凸集,且23/50julyedu.com进一步的思考结合凸函数图像和支撑超平面理解该问题对于凸函数,其一阶Taylor近似本质上是该函数的全局下估计。反之,如果一个函数的一阶Taylor近似总是起全局下估计,则该函数是凸函数。该不等式说明从一个函数的局部信息,可以得到一定程度的全局信息。24/50julyedu.com二阶可微若函数f二阶可微,则函数f为凸函数当前仅当dom为凸集,且若f是一元函数,上式表示二阶导大于等于0若f是多元函数,上式表示二阶导Hessian矩阵半正定。25/50julyedu.com凸函数举例26/50julyedu.com上境图函数f的图像定义为:函数f的上境图(epigraph)定义为:27/50julyedu.com凸函数与凸集一个函数是凸函数,当且仅当其上境图是凸集。思考:如何证明?(提示:定义)进一步,一个函数是凹函数,当且仅当其亚图(hypograph)是凸集。28/50julyedu.comJensen不等式:若f是凸函数基本Jensen不等式若则若则29/50julyedu.comJensen不等式是几乎所有不等式的基础利用f(E(x))≤E(f(x)),(f是凸函数),证明下式D≥0利用y=-logx是凸函数,证明:提示:任取a,b0,θ=0.5带入基本Jensen不等式0,0,2baabbaxqxpExqxpxpqpDxpxloglog||30/50julyedu.com保持函数凸性的算子凸函数的非负加权和凸函数与仿射函数的复合凸函数的逐点最大值、逐点上确界31/50julyedu.com凸函数的逐点最大值f1,f2均为凸函数,定义函数f:则函数f为凸函数。32/50julyedu.com思考逐点上确界和上境图的关系一系列函数逐点上确界函数对应着这些函数上境图的交集。直观例子Oxy平面上随意画N条直线(直线是凸的——虽然直线也是凹的),在每个x处取这些直线的最大的点,则构成的新函数是凸函数;同时:N条直线逐点求下界,是凹函数;在Lagrange对偶函数中会用到该结论。33/50julyedu.com凸优化优化问题的基本形式34/50julyedu.com优化问题的基本形式优化问题的域可行点(解)(feasible)x∈D,且满足约束条件可行域(可解集)所有可行点的集合最优化值最优化解35/50julyedu.com凸优化问题的基本形式fi(x)(0≤i≤m)为凸函数,hj(x)(1≤i≤p)为仿射函数凸优化问题的重要性质可行域为凸集局部最优解即为全局最优解36/50julyedu.com对偶问题一般优化问题的Lagrange乘子法Lagrange函数对固定的x,Lagrange函数L(x,λ,v)为关于λ和v的仿射函数37/50julyedu.comLagrange对偶函数(dualfunction)Lagrange对偶函数若没有下确界,定义:根据定义,显然有:对∀λ≥0,∀v,若原优化问题有最优值p*,则进一步:Lagrange对偶函数为凹函数。38/50julyedu.com左侧为原函数,右侧为对偶函数39/50julyedu.com鞍点解释为表述方便,假设没有等式约束,只考虑不等式约束,结论可方便的扩展到等式约束。假设x0不可行,即存在某些i,使得fi(x)0。则选择,对于其他乘子,假设x0可行,则有fi(x)≤0,(i=1,2,...,m),选择有:iotherwisemixfxfxfxfxLimiii,2,1,0sup,sup01000ijj,0mii,,2,1,040/50julyedu.com鞍点:最优点而原问题是:从而,原问题的本质为:而对偶问题,是求对偶函数的最大值,即:而:xfx0inf,supinf0xLx,infsup0xLx,supinf,infsup00xLxLxx41/50julyedu.com证明:对于任意的(x,y)∈domfyxfyxfxyyx,maxmin,minmaxyxfyxfyxfyxfyxfyxfxyyxxyyx,maxmin,minmax,maxmin,min,max,42/50julyedu.com线性方程的最小二乘问题原问题Lagrange函数Lagrange对偶函数对L求x的偏导,带入L,得到g对g求v的偏导,求g的极大值,作为原问题的最小值43/50julyedu.com求L的对偶函数bAxxxxLTT,TTTTAxAxxbAxxxxL2102令gbAAbAAAAbAAAAbAxxxxLTTTTTTTTTTTTTTT412141212121,44/50julyedu.com求对偶函数的极大值bAAgTTT41bAAAxbAAAAbAAAAbAAAAbAAbAAbAAgTTTTTTTTTTTTTTTT1112122202141令45/50julyedu.com极小值点极小值:极小值点的结论,和通过线性回归计算得到的结论是完全一致的。线性回归问题具有强对偶性。bAAAAbbAAAAAAbbAAAbAAAxxTTTTTTTTTTTTT21111minbAAAxTT146/50julyedu.com强对偶条件若要对偶函数的最大值即为原问题的最小值,考察需要满足的条件:47/50julyedu.comKarush-Kuhn-Tucker(KKT)条件48/50julyedu.com参考文献ConvexOptimization,StephenBoyd,LievenVandenberghe,CambridgeUniversityPress,2004中译本:王书宁,许鋆,黄晓霖译,凸优化,清华大学出版社,2013同济大学数学教研室主编,高等数学,高等教育出版社,1996同济大学数学系编,工程数学线性代数(第五版),高等教育出版社,200749/50julyedu.com我们在这里七月算法官网:免费视频直播课程问答社区联系我们:微博@研究者July@七月问答@邹博_机器学习50/50julyedu.com感谢大家!恳请大家批评指正!