JSOI2003集训队论文浅谈记忆化搜索第1页共13页浅谈记忆化搜索江苏省常州高级中学吴景岳【摘要】搜索和动态规划是信息学中的两大重要算法。它们各有自己的优点和缺点。针对它们的优缺点,一个新的算法——“记忆化搜索”产生了。它采用了搜索的形式与动态规划的思想,扬长避短,在解决某些题目时,有非常出色的表现。它在信息学竞赛中也有举足轻重的地位,NOI2001的cannon与NOI2002的dragon都使用到了这个算法。这篇论文着重分析了搜索、动态规划和记忆化搜索之间的联系和区别,以及各自的优缺点,并通过几个例子使得大家对记忆化搜索有一个初步的了解。【关键字】重叠子问题拓扑关系形式+思想【目录】一、搜索1.搜索树2.例子——words3.效率低下的原因——重叠子问题二、动态规划1.基本原理——最优子结构、无后效性2.拓扑关系(例子——最长路径)三、记忆化搜索1.记忆化搜索=搜索的形式+动态规划的思想2.记忆化深度优先搜索(1)程序框架(2)例子——words3.记忆化宽度优先搜索(1)程序框架(2)例子——cannon4.缺点分析四、总结JSOI2003集训队论文浅谈记忆化搜索第2页共13页【正文】一、搜索1.搜索树一道搜索题目拿到手,我们往往要弄清楚这样一些问题:以什么作为状态?这些状态之间又有什么样的关系?其实,在这样的思考过程中,我们已经不知不觉地将一个具体的问题抽象成了一个图论的模型——树。状态对应着顶点,状态之间的关系(或者说从一个状态到另一个状态的形成过程)对应着边。这样的一棵树就叫做搜索树。初始状态对应着根结点,目标状态对应着目标结点。我们的任务就是找到一条从根结点到目标结点的路径——一个成功的解。2.例子——words[问题描述]Io和Ao在玩一个单词游戏。他们轮流说出一个仅包含元音字母的单词,并且后一个单词的第一个字母必须与前一个单词的最后一个字母一致。游戏可以从任何一个单词开始。任何单词禁止说两遍,游戏中只能使用给定词典中含有的单词。游戏的复杂度定义为游戏中所使用的单词的长度总和。编写程序求出使用一本给定的词典来玩这个游戏所能达到的游戏最大可能复杂度。数据规模限制:单词总数不超过16,单词长度不超过100。[算法分析]这是省集训队冬令营的一道题目,当时大多数同学都用了搜索。让我们看看他们是如何搜索的。状态:现在说到哪一个单词+已经说过的单词集合我们将状态表示为(I,S),表示说到了单词I,已经说过的单词集合为S。状态之间的关系:(I,S)-(j,S1)(S1=S+j)的条件为单词J不在集合S中,并且单词J可以接在单词I后面。根结点目标结点一个成功的解JSOI2003集训队论文浅谈记忆化搜索第3页共13页但是,这样搜索效率是不会高的。所以,当时很多人都是因为超时,最后三个点没有出来。那么,搜索效率低下的根本原因是什么呢?3.重叠子问题在一些复杂的搜索问题中,搜索树是极其庞大的,结点数量非常多,结点之间的关系也非常复杂,这是导致搜索算法效率低下的重要原因。其实,在有的情况下,状态的总数并没有多少,有可能很多结点表示的都是同一个状态,我们把这样的状态叫做“重叠子问题”。由于搜索算法本身性质的制约,它不能把这些重叠子问题记录下来,只能不知疲倦地继续访问下去,不断遇到这些讨厌的重叠子问题。显然,如果能不把时间放在处理重叠子问题上,算法的效率将发生一个质的飞跃。那么有没有这样一种可以避免重复地处理重叠子问题的算法呢?这就是——二、动态规划1.基本原理动态规划是大家极为熟悉的一种算法,实际上一道动态规划的问题也可以转化为求解搜索树的问题。同样是搜索树,动态规划却比搜索算法高效很多,这是因为它把每个状态的最优值都记录了下来,于是成功地避免了重复地处理重叠子问题。不过,动态规划的使用是要满足两个基本条件的:最优子结构用动态规划解决一个问题的第一步是刻划一个最优解的结构。如果一个问题的最优解中包含了子问题的最优解,我们就说这个问题具有最优子结构。无后效性动态规划的过程是一个状态转移的过程:不断地从一个已知的状态出发,推出一个新的状态。但是,如果新的状态又能够推出前面的状态(影响前面的状态),那么这样的状态划分就具有了后效性。动态规划能够成功的一个必要条件就是无后效性。2.拓扑关系我们同样地对动态规划问题进行抽象:状态-结点,状态之间的关系-边。这样,一个动态规划的问题就可以抽象成为一个图。因为动态规划是满足无后效性的,这样的图必将是一个有向无环图。在动态规划中,状态之间有着严格的递推关系,我们必须确定哪些状态必须先推出,哪些应当后推出。这就称为拓扑关系。将点(状态)按照拓扑关系排序,就叫做拓扑排序。拓扑排序保证:除初始状态以外,每个状态都可以由它前面的状态推出。举一个例子:下图是一个有向无环图,求从顶点1到顶点6的最长路径。(规定边的方向从左到右)123465JSOI2003集训队论文浅谈记忆化搜索第4页共13页我们将从起点(顶点1)开始到某个顶点的最长路径作为状态,用一维数组opt记录。显然,opt[1]=0,这是初始状态,即动态规划的边界条件。于是,我们很容易地写出状态转移方程式:opt[j]=max{opt[k]+a[k,j]}(k到j有一条长度为a[k,j]的边)。虽然有了完整的状态转移方程式,但是我们还不知道动态规划的顺序。所以,我们还需要先进行一下拓扑排序,按照排序的顺序推下去,opt[6]就是问题的解。可以看出,动态规划相比搜索之所以高效,是因为它将所有的状态都保存了下来。当遇到重复子问题时,它就不会像搜索那样把这个状态的最优值再算一遍,只要把那个状态的最优值调出来就可以了。例如,当计算opt[4]和opt[5]的时候,我们都用到了opt[3]的值。因为我们将它保存下来了,所以就没有必要再去搜索了。但是,动态规划仍然是有缺点的。一个很突出的缺点就是要进行拓扑排序。这道题的拓扑关系是很简单的,但有些题的拓扑关系是很复杂的。对于这些题目,如果也进行拓扑排序,工作量巨大。遇到这种情况,我们又该怎么办呢?——三、记忆化搜索1.概念讲了那么多有关搜索和动态规划的东西,终于进入正题了——记忆化搜索。什么是记忆化搜索呢?前面我们分析了搜索和动态规划各自的优缺点:搜索的低效在于没有能够很好地处理重叠子问题;动态规划虽然比较好地处理了重叠子问题,但是在有些拓扑关系比较复杂的题目面前,又显得无奈。记忆化搜索正是在这样的情况下产生的,它采用搜索的形式和动态规划中递推的思想将这两种方法有机地综合在一起,扬长避短,简单实用,在信息学中有着重要的作用。用一个公式简单地说:记忆化搜索=搜索的形式+动态规划的思想。既然它具有搜索的形式,那么我们也按照讨论搜索算法的方式讨论这个新事物:2.记忆化深度优先搜索(1)程序框架constnonsense=-1;{这个值可以随意定义,表示一个状态的最优值未知}var……{全局变量定义}functionwork(s:statetype):longint;var……{局部变量定义}beginifopt[s]nonsensethenbeginwork:=opt[s];JSOI2003集训队论文浅谈记忆化搜索第5页共13页exit;end;{如果状态s的最优值已经知道,直接返回这个值}枚举所有可以推出状态S的状态S1begintemp:=由S1推出的S的最优值{有关work(s1)的函数};if(opt[s]=nonsense)or(temp优于opt[s])thenopt[s]:=temp;end;work:=opt[s];{用动态规划的思想推出状态s的最优值}end;记忆化深度优先搜索采用了一般的深度优先搜索的递归结构,但是在搜索到一个未知的状态时它总把它记录下来,为以后的搜索节省了大量的时间。可见,记忆化搜索的实质是动态规划,效率也和动态规划接近;形式是搜索,简单易行,也不需要进行什么拓扑排序了。(2)例子——words我们继续讨论这个老题目words(问题描述见1.1.3),不过这次我们不再讨论如何搜索了,而是讨论如何记忆化搜索。先回顾一下状态和状态之间的关系:状态:到某一时刻为止的最后一个单词+已经说过的单词集合我们将状态表示为(I,S),表示说到了单词I,已经说过的单词集合为S。状态之间的关系:(I,S)-(j,S1)的条件为单词J不在集合S中,并且单词J可以接在单词I后面(S1=S+j)。按照这样的状态表示方法,状态总数最多为2^20。在FreePascal下是完全可以存得下的。经过这样的划分,状态转移方程式显而易见:opt[j,s1]=max{opt[I,s]+length[j]}单词J不在集合S中,并且单词J可以接在单词I后面(S=S1-j)。初始条件:opt[I,{I}]=length[I]不过值得注意的是集合的表示方法:将一个集合与一个二进制数对应,再将二进制数与十进制数对应。为了方便操作,单词的编号也可以从1…N,改成0…N-1。比如:集合[1,4,5]-集合[0,3,4]-11001(2)-2^0+2^3+2^4=25。这样操作不但节省了空间,而且在进行集合操作时可以用位操作,又节省了时间。我们再来考虑算法的实现,如果用一般的动态规划,就需要先进行拓扑排序,很显然这样做是不可取的,因为状态之间的关系十分复杂。于是,我们将目光投向了记忆化搜索。记忆化搜索是不需要拓扑排序的,这正好避免了我们的问题——复杂的拓扑关系。按照推导出的状态转移方程式和前面展示的框架,相信大家都可以轻松地写出源程序了。(源程序见附录1)在这个解法中,虽然我们想到了如何表示状态以及状态之间的关系,但是如果没有记忆化搜索的参与,我们对于如此复杂的拓扑关系仍是无所适从。所以,记忆化搜索的参与可以使得这类具有复杂拓扑关系的动态规划问题得到了较为圆满的解决。JSOI2003集训队论文浅谈记忆化搜索第6页共13页3.记忆化宽度优先搜索(1)程序框架记忆化宽度优先搜索实际上是把一般的动态规划倒过来了。动态规划在计算每一个状态的最优值时,总是寻找可以推出该状态的已知状态,然后从中选择一个最优的决策。而记忆化宽度优先搜索是不断地从已知状态出发,看看能推出哪些其它的状态,并修改其它状态的最优值。这个算法有两大优点:与记忆化深度优先搜索相似,避免了对错综复杂的拓扑关系的分析化倒推为顺推,更加符合人类的思维过程,而且在顺推比倒推简单时,可以使问题简单化下面我们通过一个例子,具体问题具体分析。(2)例子——cannon[问题描述]司令部的将军们打算在N*M的网格地图上部署他们的炮兵部队。一个N*M的地图由N行M列组成,地图的每一格可能是山地(用“H”表示),也可能是平原(用“P”表示),如下图。在每一格平原地形上最多可以布置一支炮兵部队(山地上不能够部署炮兵部队);一支炮兵部队在地图上的攻击范围如图中黑色区域所示:PPHPHHPPPHPHPHPPPPPHHHPHHPHPPPPHHPPPPHPHHPPHPHHPHHHPPPPH如果在地图中的灰色所标识的平原上部署一支炮兵部队,则图中的黑色的网格表示它能够攻击到的区域:沿横向左右各两格,沿纵向上下各两格。图上其它白色网格均攻击不到。从图上可见炮兵的攻击范围不受地形的影响。现在,将军们规划如何部署炮兵部队,在防止误伤的前提下(保证任何两支炮兵部队之间不能互相攻击,即任何一支炮兵部队都不在其他支炮兵部队的攻击范围内),在整个地图区域内最多能够摆放多少我军的炮兵部队。数据限制:N=100M=10[算法分析]这一题目若用图论的模型来做,就是一个最大独立集问题,而最大独立集问题确实一个边界条件进入队列找到一个没有扩展过的且肯定最优的状态,没有则退出扩展该状态,并修改扩展到的状态的最优值回第二步JSOI2003集训队论文浅谈记忆化搜索第7页共13页NP问题。并且我们也做过这种题目的原型题目,大部分都必须通过搜索来解决。故我们需要考察这个问题的特殊性。由数据限制可知mmaxnmax。注意这是唯一一个与原型题目不同的地方。可是如何使用呢?我们先考虑一种极端情况