遗传算法1.11.21.3遗传算法(GeneticAlgorithm)●遗传算法(GeneticAlgorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。●最初由美国Michigan大学J.Holland教授于1975年首先提出来,并出版了颇有影响的专著《AdaptationinNaturalandArtificialSystems》,GA这个名称才逐渐为人所知,J.Holland教授所提出的GA通常为简单遗传算法(SGA)。1.1基本概念1.个体与种群●个体就是模拟生物个体而对问题中的对象(一般就是问题的解)的一种称呼,一个个体也就是搜索空间中的一个点。●种群(population)就是模拟生物种群而由若干个体组成的群体,它一般是整个搜索空间的一个很小的子集。2.●适应度(fitness)就是借鉴生物个体对环境的适应程度,而对问题中的个体对象所设计的表征其优劣的一种测度。●适应度函数(fitnessfunction)就是问题中的全体个体与其适应度之间的一个对应关系。它一般是一个实值函数。该函数就是遗传算法中指导搜索的评价函数。3.染色体与基因染色体(chromosome)就是问题中个体的某种字符串形式的编码表示。字符串中的字符也就称为基因(gene)。例如:个体染色体9----1001(2,5,6)----0101011104.遗传操作亦称遗传算子(geneticoperator),就是关于染色体的运算。遗传算法中有三种遗传操作:●选择-复制(selection-reproduction)●交叉(crossover,亦称交换、交配或杂交)●变异(mutation,亦称突变)选择-复制通常做法是:对于一个规模为N的种群S,按每个染色体xi∈S的选择概率P(xi)所决定的选中机会,分N次从S中随机选定N个染色体,并进行复制。NjjiixfxfxP1)()()(这里的选择概率P(xi)的计算公式为交叉就是互换两个染色体某些位上的基因。s1′=01000101,s2′=10011011可以看做是原染色体s1和s2的子代染色体。例如,设染色体s1=01001011,s2=10010101,交换其后4位基因,即变异就是改变染色体某个(些)位上的基因。例如,设染色体s=11001101将其第三位上的0变为1,即s=11001101→11101101=s′。s′也可以看做是原染色体s的子代染色体。1.2基本遗传算法遗传算法基本流程框图生成初始种群计算适应度选择-复制交叉变异生成新一代种群终止?结束算法中的一些控制参数:■种群规模■最大换代数■交叉率(crossoverrate)就是参加交叉运算的染色体个数占全体染色体总数的比例,记为Pc,取值范围一般为0.4~0.99。■变异率(mutationrate)是指发生变异的基因位数所占全体染色体的基因总位数的比例,记为Pm,取值范围一般为0.0001~0.1。基本遗传算法步1在搜索空间U上定义一个适应度函数f(x),给定种群规模N,交叉率Pc和变异率Pm,代数T;步2随机产生U中的N个个体s1,s2,…,sN,组成初始种群S={s1,s2,…,sN},置代数计数器t=1;步3计算S中每个个体的适应度f();步4若终止条件满足,则取S中适应度最大的个体作为所求结果,算法结束。步5按选择概率P(xi)所决定的选中机会,每次从S中随机选定1个个体并将其染色体复制,共做N次,然后将复制所得的N个染色体组成群体S1;步6按交叉率Pc所决定的参加交叉的染色体数c,从S1中随机确定c个染色体,配对进行交叉操作,并用产生的新染色体代替原染色体,得群体S2;步7按变异率Pm所决定的变异次数m,从S2中随机确定m个染色体,分别进行变异操作,并用产生的新染色体代替原染色体,得群体S3;步8将群体S3作为新一代种群,即用S3代替S,t=t+1,转步3;1.3遗传算法应用举例例4.1利用遗传算法求解区间[0,31]上的二次函数y=x2的最大值。y=x231XY分析原问题可转化为在区间[0,31]中搜索能使y取最大值的点a的问题。那么,[0,31]中的点x就是个体,函数值f(x)恰好就可以作为x的适应度,区间[0,31]就是一个(解)空间。这样,只要能给出个体x的适当染色体编码,该问题就可以用遗传算法来解决。解(1)设定种群规模,编码染色体,产生初始种群。将种群规模设定为4;用5位二进制数编码染色体;取下列个体组成初始种群S1:s1=13(01101),s2=24(11000)s3=8(01000),s4=19(10011)(2)定义适应度函数,取适应度函数:f(x)=x2(3)计算各代种群中的各个体的适应度,并对其染色体进行遗传操作,直到适应度最高的个体(即31(11111))出现为止。首先计算种群S1中各个体s1=13(01101),s2=24(11000)s3=8(01000),s4=19(10011)的适应度f(si)。容易求得f(s1)=f(13)=132=169f(s2)=f(24)=242=576f(s3)=f(8)=82=64f(s4)=f(19)=192=361再计算种群S1中各个体的选择概率。NjjiixfxfxP1)()()(选择概率的计算公式为由此可求得P(s1)=P(13)=0.14P(s2)=P(24)=0.49P(s3)=P(8)=0.06P(s4)=P(19)=0.31赌轮选择示意s40.31s20.49s10.14s30.06●赌轮选择法在算法中赌轮选择法可用下面的子过程来模拟:①在[0,1]区间内产生一个均匀分布的随机数r。②若r≤q1,则染色体x1被选中。③若qk-1r≤qk(2≤k≤N),则染色体xk被选中。其中的qi称为染色体xi(i=1,2,…,n)的积累概率,其计算公式为ijjixPq1)(选择-复制设从区间[0,1]中产生4个随机数如下:r1=0.450126,r2=0.110347r3=0.572496,r4=0.98503染色体适应度选择概率积累概率选中次数s1=011011690.140.141s2=110005760.490.632s3=01000640.060.690s4=100113610.311.001于是,经复制得群体:s1’=11000(24),s2’=01101(13)s3’=11000(24),s4’=10011(19)交叉设交叉率pc=100%,即S1中的全体染色体都参加交叉运算。设s1’与s2’配对,s3’与s4’配对。分别交换后两位基因,得新染色体:s1’’=11001(25),s2’’=01100(12)s3’’=11011(27),s4’’=10000(16)变异设变异率pm=0.001。这样,群体S1中共有5×4×0.001=0.02位基因可以变异。0.02位显然不足1位,所以本轮遗传操作不做变异。于是,得到第二代种群S2:s1=11001(25),s2=01100(12)s3=11011(27),s4=10000(16)第二代种群S2中各染色体的情况染色体适应度选择概率积累概率估计的选中次数s1=110016250.360.361s2=011001440.080.440s3=110117290.410.852s4=100002560.151.001假设这一轮选择-复制操作中,种群S2中的4个染色体都被选中,则得到群体:s1’=11001(25),s2’=01100(12)s3’=11011(27),s4’=10000(16)做交叉运算,让s1’与s2’,s3’与s4’分别交换后三位基因,得s1’’=11100(28),s2’’=01001(9)s3’’=11000(24),s4’’=10011(19)这一轮仍然不会发生变异。于是,得第三代种群S3:s1=11100(28),s2=01001(9)s3=11000(24),s4=10011(19)第三代种群S3中各染色体的情况染色体适应度选择概率积累概率估计的选中次数s1=111007840.440.442s2=01001810.040.480s3=110005760.320.801s4=100113610.201.001设这一轮的选择-复制结果为:s1’=11100(28),s2’=11100(28)s3’=11000(24),s4’=10011(19)做交叉运算,让s1’与s4’,s2’与s3’分别交换后两位基因,得s1’’=11111(31),s2’’=11100(28)s3’’=11000(24),s4’’=10000(16)这一轮仍然不会发生变异。于是,得第四代种群S4:s1=11111(31),s2=11100(28)s3=11000(24),s4=10000(16)显然,在这一代种群中已经出现了适应度最高的染色体s1=11111。于是,遗传操作终止,将染色体“11111”作为最终结果输出。然后,将染色体“11111”解码为表现型,即得所求的最优解:31。将31代入函数y=x2中,即得原问题的解,即函数y=x2的最大值为961。YYy=x28131924X第一代种群及其适应度y=x212162527XY第二代种群及其适应度y=x29192428XY第三代种群及其适应度y=x216242831X第四代种群及其适应度例1.2用遗传算法求解TSP。分析由于其任一可能解——一个合法的城市序列,即n个城市的一个排列,都可以事先构造出来。于是,我们就可以直接在解空间(所有合法的城市序列)中搜索最佳解。这正适合用遗传算法求解。(1)定义适应度函数我们将一个合法的城市序列s=(c1,c2,…,cn,cn+1)(cn+1就是c1)作为一个个体。这个序列中相邻两城之间的距离之和的倒数就可作为相应个体s的适应度,从而适应度函数就是niiiccdsf11),(1)((2)对个体s=(c1,c2,…,cn,cn+1)进行编码。但对于这样的个体如何编码却不是一件直截了当的事情。因为如果编码不当,就会在实施交叉或变异操作时出现非法城市序列即无效解。例如,对于5个城市的TSP,我们用符号A、B、C、D、E代表相应的城市,用这5个符号的序列表示可能解即染色体。然后进行遗传操作。设s1=(A,C,B,E,D,A),s2=(A,E,D,C,B,A)实施常规的交叉或变异操作,如交换后三位,得s1’=(A,C,B,C,B,A),s2’=(A,E,D,E,D,A)或者将染色体s1第二位的C变为E,得s1’’=(A,E,B,E,D,A)可以看出,上面得到的s1’,s2’和s1’’都是非法的城市序列。为此,对TSP必须设计合适的染色体和相应的遗传运算。事实上,人们针对TSP提出了许多编码方法和相应的特殊化了的交叉、变异操作,如顺序编码或整数编码、随机键编码、部分映射交叉、顺序交叉、循环交叉、位置交叉、反转变异、移位变异、互换变异等等。从而巧妙地用遗传算法解决了TSP。遗传算法2.1遗传算法特点2.22.3遗传算法的收敛性分析2.4遗传算法改进2.5遗传算法的融合2.1遗传算法的特点与优势◆传统优化算法-枚举法:枚举出可行解集合内的所有可行解,以求出精确最优解。*对于连续函数,要求先进行离散化处理。枚举空间比较大时,方法求解效率较低,甚至无法求解。-启发式算法:寻求一种能产生可行解的启发式规则,已找到一个最优解或近似最优解。*该方法的求解效率比较高,但对每一个需求解的问题必须找出其特有的启发式规则,这个启发式规则一般无通用性,不适合于其他问题。-搜索算法:寻求一种搜索算法,该算法在可行解集合的一个子集内进行搜索操作,已找到问题的最优解或近似最优解。*该方法虽然保证不了能够获得问题的最优解,但若适当地利用一些启发式规则,就可以在近似解的质量和效率上达到一种较好的平衡。◆遗传算法的主要特点——遗传算法一般是直接在解空间搜索,而不像图搜索那样一般是在问题空间搜索,最后才找到解,因而可以更加直接地应用。——遗传算法是一