模拟退火算法及其MATLAB实现模拟退火第6章模拟退火算法及其MATLAB实现6.1算法基本理论6.2算法的MATLAB实现6.3应用实例简单了解退火算法特点介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。简单了解退火算法特点爬山算法如图所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。模拟退火算法在搜索到局部最优解A后,会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点,于是就跳出了局部最大值A。6.1算法基本理论一、算法概述工程中许多实际优化问题的目标函数都是非凸的,存在许多局部最优解。求解全局优化问题的方法可分为两类:确定性方法和随机性方法。确定性算法适用于求解具有一些特殊特征的问题,而梯度法和一般的随机搜索方法则沿着目标函数下降方向搜索,因此常常陷入局部而非全局最优解。6.1算法基本理论一、算法概述模拟退火算法(SA)是一种通用概率算法。用来在一个大的搜索空间内寻找问题的最优解。1953年,Metropolis等提出了模拟退火的思想。1983年,Kirkpatrick等将SA引入组合优化领域。6.1算法基本理论二、基本思想退火,俗称固体降温先把固体加热至足够高温,使固体中所有粒子处于无序的状态,然后将温度缓慢下降,粒子渐渐有序,这样只要温度上升得足够高,冷却过程足够慢,则所有粒子最终会处于最低能态。算法试图随着控制参数T的降低,使目标函数值f(内能E)也逐渐降低,直至趋于全局最小值(退火中低温时的最低能量状态),算法工作过程就像固体退火过程一样。6.1算法基本理论模拟退火算法的由来模拟退火退火解粒子状态最优解能量最低的状态目标函数f内能控制参数温度T6.1算法基本理论Metropolis准则——–以概率接受新状态若在温度T,当前状态i(解1)→新状态j(解2)若𝐸𝑗(目标函数𝑓2)𝐸𝑖(𝑓1),则接受j为当前状态;若𝐸𝑗𝐸𝑖,概率𝑃=𝑒−𝐸𝑗−𝐸𝑖𝐾𝑇大于[0,1)区间的随机数,则仍接受状态j为当前状态;若不成立,则保留状态I为当前状态。新状态的内能当前状态的内能温度EjEi(更差的解)时,0P1,P随着T的减小而减小;6.1算法基本理论𝑃=𝑒−𝐸𝑗−𝐸𝑖𝐾𝑇6.1算法基本理论当初始温度足够高时,概率P接近于1,所以当前解经过扰动产生的新解,无论好坏,基本都可以被接受为当前解。即不受制于当前解,不会困在局部最优解中,可以遍及解空间的各个区域,当然也不会保持在最优解处。随着温度降低,概率降低,较差解被接受的次数减少,当前解逐渐停留到最优解周围。温度达到终止温度前,概率足够低,使得只有最优解被接受,较差解都不接受。最优解即为最后接受的当前解。算法总结在高温下,可接受与当前状态能量差较大的新状态;在低温下,只接受与当前状态能量差较小的新状态。6.1算法基本理论三、算法其他参数的说明退火过程由一组初始参数,即冷却进度表控制,它的核心是尽量使系统达到准平衡,以使算法在有限的时间内逼近最优解。冷却进度表包括:1.控制参数的初值𝑇0:冷却开始的温度;2.控制参数T的衰减函数:要将连续的降温过程,离散成降温过程中的一系列温度点,衰减函数即计算这一系列温度的表达式;3.控制参数T的终值𝑇𝑓(停止准则);4.Markov链的长度𝐿𝑘:任意温度T的迭代次数。6.1算法基本理论四、算法基本步骤1、令T=𝑇0,随机生成一个初始解𝑥0,并计算相应的目标函数值𝐸(𝑥0);2、令T等于冷却进度表中的下一个值𝑇𝑖;3、根据当前解𝑥𝑖进行扰动,产生一个新解𝑥𝑗,计相应的目标函数值𝐸(𝑥𝑗),得到∆𝑒=𝐸(𝑥𝑗)−𝐸(𝑥𝑖);4、∆𝑒0,则新解𝑥𝑗被接受,作为新的当前解;∆𝑒0,则新解𝑥𝑗按概率𝑒−𝐸𝑗−𝐸𝑖𝐾𝑇接受;5、在温度𝑇𝑖下,重复𝐿𝑘次的扰动和接受过程,即执行步骤(3)、(4);6、判断T是否已达到𝑇𝑓,是,则终止算法;否则转到(2)继续执行初始温度,随机产生初始解。计算两解的目标函数差值∆𝑦∆𝑦0接受新解作为当前解计算概率与[0,1)随机数之间的差值差值大于0𝑇𝑇𝑓当前解𝑥𝑖扰动次数𝐿𝑘𝑇𝑘+1=𝛼𝑇𝑘结束,输出当前解扰动,产生新解𝑥𝑖+1YNYNNYYN6.1算法基本理论四、算法基本步骤算法实质分为两层循环,在任一温度下随机扰动产生新解,计算目标函数值的变化,决定是否接受。由于算法初始温度比较高,这样使E增大的新解在初始时也可能被接受,因此能跳出局部极小值,然后通过缓慢地降低温度,算法可能收敛到全局最优解。虽然在低温时接受函数已经非常小了,但仍不排除有接受更差解得可能,因此一般都会把退火过程中碰到的最好的可行解(历史最优解)也记录下来,与终止算法前最后被接受解一并输出。6.1算法基本理论五、几点说明1、新解的产生要求尽可能地遍及解空间的各个区域,这样,在某一恒定温度下,不断产生新解时,就可能跳出局部最优解。2、收敛的一般条件:•初始温度足够高;•热平衡时间足够长;•终止温度足够低;•降温过程足够缓慢;6.1算法基本理论五、几点说明6.1算法基本理论六、算法优缺点优点:计算过程简单,通用,鲁棒性强,适用于并行处理,可用于求解复杂的非线性优化问题。缺点:收敛速度慢,执行时间长,算法性能与初始值有关及参数敏感等缺点。6.2算法的MATLAB实现旅行商问题一名商人要到n个不同的城市去推销商品,每2个城市I和j之间的距离为d,如何选择一条路径使得商人每个城市走一遍后回到起点所走的路径最短。例:有52座城市,已知每座城市的坐标,求每个城市走一遍后回到起点,所走的路径最短。初始温度(93),随机产生初始解(1到52的随机排列)。计算两解的目标函数差值∆𝑦(两条路径之差)∆𝑦0接受新解作为当前解计算概率与[0,1)随机数之间的差值差值大于0𝑇3当前解𝑥𝑖扰动次数10000𝑇𝑘+1=0.99𝑇𝑘结束,输出当前解扰动,产生新解𝑥𝑖+1YNYNNYYN扰动:数0.5随机产生0~1的数二变换法三变换法NY6.2算法的MATLAB实现一、算法设计步骤6.2算法的MATLAB实现一、算法设计步骤2.新解的产生(扰动)(1)二变换法:任选序号𝑢,𝑣设𝑢𝑣𝑛,交换𝑢,𝑣之间的访问顺序。(2)三变换法:任选序号𝑢,𝑣,𝑤设𝑢≤𝑣𝑤,将𝑢,𝑣之间的路径插到𝑤之后访问6.2算法的MATLAB实现一、算法设计步骤whilet=tfforr=1:Markov_lengthif(rand0.5)%随机产生0~1的数,若小于0.5,则二变换ind1=0;ind2=0;while(ind1==ind2)ind1=ceil(rand.*amount);ind2=ceil(rand.*amount);endtmp1=sol_new(ind1);sol_new(ind1)=sol_new(ind2);sol_new(ind2)=tmp1;else%否则,三变换ind1=0;ind2=0;ind3=0;while(ind1==ind2)||(ind1==ind3)...||(ind2==ind3)||(abs(ind1-ind2)==1)ind1=ceil(rand.*amount);ind2=ceil(rand.*amount);ind3=ceil(rand.*amount);endtmp1=ind1;tmp2=ind2;tmp3=ind3;6.2算法的MATLAB实现一、算法设计步骤if(ind1ind2)&&(ind2ind3)elseif(ind1ind3)&&(ind3ind2)ind2=tmp3;ind3=tmp2;elseif(ind2ind1)&&(ind1ind3)ind1=tmp2;ind2=tmp1;elseif(ind2ind3)&&(ind3ind1)ind1=tmp2;ind2=tmp3;ind3=tmp1;elseif(ind3ind1)&&(ind1ind2)ind1=tmp3;ind2=tmp1;ind3=tmp2;elseif(ind3ind2)&&(ind2ind1)ind1=tmp3;ind2=tmp2;ind3=tmp1;end%ind1ind2ind3tmplist1=sol_new((ind1+1):(ind2-1));%u、v之间的城市sol_new((ind1+1):(ind1+ind3-ind2+1))=...sol_new((ind2):(ind3));%将v到w的城市移到u后面sol_new((ind1+ind3-ind2+2):ind3)=...tmplist1;%u、v之间的城市移到w后面end6.2算法的MATLAB实现一、算法设计步骤3.目标函数访问所有城市的路径总长度:𝐶𝑐1,𝑐2,…,𝑐𝑛=𝑑𝑐𝑖,𝑐𝑖+1+𝑑(𝑐1,𝑐𝑛)𝑛−1𝑖=1模拟退火算法求出目标函数的最小值6.2算法的MATLAB实现一、算法设计步骤%计算目标函数即内能E_new=0;fori=1:(amount-1)E_new=E_new+...dist_matrix(sol_new(i),sol_new(i+1));end%从第一个城市到最后一个城市的距离E_new=E_new+...dist_matrix(sol_new(amount),sol_new(1));6.2算法的MATLAB实现一、算法设计步骤6.2算法的MATLAB实现一、算法设计步骤ifE_newE_currentE_current=E_new;sol_current=sol_new;ifE_newE_best%冷却过程中最好的解保存下来´E_best=E_new;sol_best=sol_new;endelse%若新解的目标函数大于当前解的,%则以一定的概率接受新解ifrandexp(-(E_new-E_current)./t)E_current=E_new;sol_current=sol_new;elsesol_new=sol_current;endend6.3应用实例:背包问题的求解一、0-1背包问题有一个贼在偷窃一家商店时发现有N件物品:第i件物品值𝑣𝑖元,重𝑤𝑖磅(1≤𝑖≤𝑛),此处𝑣𝑖和𝑤𝑖都是整数。他希望带走的东西越值钱越好,但他的背包小,最多只能装下W磅的东西(W为整数)。如果每件物品或被带走或被留下,小偷应该带走哪几样东西?例:假设有12件物品,质量分别为2磅、5磅、18磅、3磅、2磅、5磅、10磅、4磅、11磅、7磅、14磅、6磅,价值分别为5元、10元、13元、4元、3元、11元、13元、10元、8元、16元、7元、4元,包的最大允许质量是46磅模拟退火算法及其MATLAB实现谢谢大家!