最优化方法第一次

雷神gsx
1 ℃
2020-02-17

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

最优化方法前言一、最优化方法简介最优化方法是一门古老而又年青的学科。这门学科的源头可以追溯到17世纪法国数学家拉格朗日关于一个函数在一组等式约束条件下的极值问题(求解多元函数极值的Lagrange乘数法)。19世纪柯西引入了最速下降法求解非线性规划问题。直到20世纪三、四十年代最优化理论的研究才出现了重大进展，1939年前苏联的康托洛维奇提出了解决产品下料和运输问题的线性规划方法；1947年美国的丹奇格提出了求解线性规划的单纯形法，极大地推动了线性规划理论的发展。非线性规划理论的开创性工作是在1951年由库恩和塔克完成的，他们给出了非线性规划的最优性条件。随着计算机技术的发展，各种最优化算法应运而生。比较著名的有DFP和BFGS无约束变尺度法、HP广义乘子法和WHP约束变尺度法。最优化问题本质是一个求极值问题，几乎所有类型的优化问题都可概括为如下模型：给定一个集合(可行集)和该集合上的一个函数(目标函数)，要计算此函数在集合上的极值。通常，人们按照可行集的性质对优化问题分类：如果可行集中的元素是有限的，则归结为“组合优化”或“网络规划”，如图论中最短路、最小费用最大流等；如果可行集是有限维空间中的一个连续子集，则归结为“线性或非线性规划”；如果可行集中的元素是依赖时间的决策序列，则归结为“动态规划”；如果可行集是无穷维空间中的连续子集，则归结为“最优控制”。线性规划与非线性规划是最优化方法中最基本、最重要的两类问题。一般来说，各优化分支有其相应的应用领域。线性规划、网络规划、动态规划通常用于管理与决策科学；最优控制常用于控制工程；非线性规划则更多地用于工程优化设计。前面提到的算法是最优化的基本方法，它们简单易行，对于性态优良的一般函数，优化效果较好。但这些经典的方法是以传统微积分为基础的，不可避免地带有某种局限局限性，主要表现为：①大多数传统优化方法仅能计算目标函数的局部最优点，不能保证找到全局最优解。对于多峰值函数，这些方法往往由于过分追求“下降”而陷于局部最优解；②许多传统优化方法对目标函数的光滑性、凹凸性等有较高的要求，对于离散型函数、随机型函数基本上无能为力。二十世纪六、七十年代以来，人们将人工智能技术和生物进化机理引入最优化方法,逐渐形成了一批完全不同于传统优化方法、令人耳目一新的现代优化方法。例如模拟退火、神经网络、进化计算、模糊逻辑等，其中进化计算中的遗传算法以其良好的全局搜索性成为现代优化算法中最受关注的算法之一，已被广泛应用于函数优化、组合优化、自动控制、生产调度、图像与信号处理、机器人和人工生命等领域。二、《最优化方法》课程主要内容本门课程的主要内容为常用经典优化方法、现代优化方法中的模拟退火算法和遗传算法以及运筹优化软件Lingo简介。经典优化方法包括：1.常用的一维搜索方法——黄金分割法、Fibonacci法和解析法；2.最速下降法、共轭梯度法；3.牛顿法；4.变尺度法——DFP和BFGS法；5.常用约束优化方法——梯度法、罚函数法、乘子法。模拟退火算法包括物理背景、算法过程以及简单应用等内容。遗传算法包括基本遗传算法、多峰值函数优化的小生境遗传算法、多目标优化遗传算法简介。Lingo软件只介绍基本功能与基本操作。三、授课方式与课程要求1.授课方式——自学+讨论+讲解首先由学生按教师要求对下次授课内容自学，然后在课堂上就有关问题与教师进行简要讨论、交流，最后由教师对本次授课内容进行扼要讲解、总结，布置作业。2.课程要求希望掌握优化计算这个数学工具的工程技术人员可以分为下列三个层次：①不愿意花费精力去了解优化计算的数学原理，只要能熟练使用一些现成的优化数学软件，如Lingo、Matlab优化工具箱等；②希望大致明白优化计算的数学原理，了解各种算法的优缺点及适用范围，对计算结果有一定的分析判断能力，让自己成为一个有数学素养的优化工具使用者。但也不打算自己编制算法程序；③希望透彻地了解最优化计算的数学原理，详细掌握各种算法的计算步骤，由自己编制质量较较高的优化计算软件。本课程对学生的具体要求为：①理解最优化的基本概念、算法原理和算法结构；②熟悉几种常用的经典优化算法，知晓其优缺点及适用范围；③了解模拟退火算法和遗传算法的基本原理；④能较为熟练地运用Lingo软件求解各种优化问题。3.编程要求基于下列理由，本门课要求学生对2~3个基本优化算法（如一维搜索、梯度法、变尺度法、模拟退火、基本遗传算法）编制出通用程序，编程工具建议采用C++、Matlab或Maple。①最优化方法是一门实践性特别强的课程，算法众多。如果对于一个算法仅了解其数学原理，不将算法编制成高质量的程序，那么就不能保证你已对此算法有了全面、正确的理解，对此算法的优缺点、适用范围就缺乏深刻的体会，更无法体验到最优化方法的精髓；②在一些大型计算中，可能要求优化计算是“实时计算”，即优化计算从前一计算环节获取参数，计算结果后立即传送给后一环节，所有这些计算都是在内存中进行的。显然，现成的工具软件对此无能为力；③Lingo、Matlab优化工具箱等优化软件功能的确强大，但它们也不是万能的。首先,对于某些优化问题，这些工具软件有都求不出最优解。其次不能保证对任何优化问题都有现成的工具软件，实际上，许多现代优化方法都不可能编制成通用软件；④熟练使用相关科技软件、具有一定的编程水平是工科研究生所必须具有的素养，从某种程度上讲，后者更能反映出个人的能能力，而编程经验和水平不是凭一朝一夕就可以提高的，要靠大量的编程实践和不断地日积月累。4.参考书目①粟塔山，最优化计算原理与算法程序设计，国防科技大学出版社；②谢金星，优化建模与Lingo软件，清华大学出版社；③周明，遗传算法原理及应用，国防工业出版社。信箱：austmathmodeling@163.comMM：matlabmaple第一次自学讨论内容1.多元函数梯度的定义、几何意义；等高线的概念，等高线与梯度的关系；梯度为零的点与极值点的关系。2.Hesse矩阵的概念；多元函数Hesse矩阵的正定性与函数曲面凹凸性的关系。3.设A为n阶对称矩阵，b、X为n元列向量，c为标量，对二次函数求梯度、Hessain矩阵。(要写出详细计算过程)4.写出二元函数的二阶Taylor展式的矩阵形式。5.凸集的概念。6.凸函数的概念；凸函数的两个充要条件；凸函数的极值点有什么特点？Xf2XfcXbAXXXfTT21第一部分经典最优化方法Ch1.最优化的基本概念一、预备知识1.梯度定义1.1对n元可微函数,向量称为在处的梯度，记为或,称为梯度算子或Hamilton算子。nxxxfXf,,,2112,,,TnfffxxxfXXfgradfX从几何上讲，的方向是在处上升最快的方向，的模是在处上升最快的速率。若，则函数曲面在处的切平面是水平的。fXXffX0XfXfX2.二阶导数矩阵定义1.2设n元函数具有二阶连续偏导数，则的所有二阶偏导数构成的矩阵称为在处的二阶导数矩阵或海色(Hessain)矩阵，记为。nxxxfXf,,,21f''''''11121''''''21222''''''12nnnnnnffffffffffXXf2显然，是一个对称矩阵。在几何上，反映了函数曲面的弯曲方向。若(正定)，则函数曲面向上弯曲(凹)；若(负定)，则函数曲面向下弯曲(凸)。Xf2Xf202Xf02Xf例1.1设A为n阶对称矩阵，b,X为n元列向量，c为标量，对二次函数求梯度、Hessain矩阵。解以二元函数为例计算。cXbAXXXfTT21Xf2Xf11121112121222221,,2aaxxfXxxbbcaaxx22111222121211221122axaxaxxbxbxc1111221121222212,ffaxaxbaxaxbxx''''''''11111221122222,,faffafa1111221121222212,,TTfffXaxaxbaxaxbxx111211122222aaxbAXbaaxb''''111221112''''12222122aafffXAaaff即对可将算子、理解为对向量函数的一阶、二阶导数，易得2bAXXfAXf2cXbAXXXfTT213.n元函数的二阶Taylor展式一元函数的Taylor展式：其中。20000()0()()()()2!()!nnnfxfxxfxfxxxfxxRn10,)!1()(10)1(nnnxnxxfR二元函数的Taylor展式：其中),(),(),(000000yxfyyxxyxfyyxxf2000011(,)(,)2!!nnxyfxyxyfxyRxynxy10),,()!1(1001yyxxfyyxxnRnn二元函数的二阶Taylor展式：yyxfyxyxfxyxfyyxxf),(),(),(),(0000000022200002(,)(,)12!fxyfxyxxyxxy222000022(,)(,)fxyfxyyxyRyxy若引入矩阵记号则,,,,,0000XXXyxXyxXTT000()(),,TfXfXbfXxy220022022002()()()()()fXfXxxyAfXfXfXyxyn元函数的二阶Taylor展式与二元函数的二阶Taylor展式形式类似。0212TTfXbXXAXR2020021RXXXXXfXfXfTT4.凸集与凸函数定义1.3设，若中任两点的连线都属于，即对任意，均有，则称为一个凸集。定义1.4设为定义在凸集上的函数,若对任意，均有则称为上的凸函数。若上式改为严格不等式，则称为上的严格凸函数。nRSSS12,XXS12(1),XXS(01)S)(XfS12,XXS)10()1()1(2121XfXfXXf)(XfS)(XfS定理1.1（一阶判别条件）一阶可微函数在开凸集上为凸函数的充要条件是：对任意，均有。定理1.2（二阶判别条件）二阶连续可微函数在开凸集上为凸函数的充要条件是：对任意，半正定。为严格凸函数的充要条件是正定。)(XfS12,XXS12112XXXfXfXfT)(XfSSXXf2)(XfXf2