第8章NP完全性理论18.1计算模型•8.1.1随机存取机RAM•8.1.2随机存取存储程序机RASP•8.1.3RAM模型的变形与简化•8.1.4图灵机•8.1.5图灵机模型与RAM模型的关系•8.1.6问题变换与计算复杂性归约28.1.1随机存取机RAM1.RAM的结构38.1.1随机存取机RAM2.RAM程序一个RAM程序定义了从输入带到输出带的一个映射。可以对这种映射关系作2种不同的解释。解释一:把RAM程序看成是计算一个函数若一个RAM程序P总是从输入带前n个方格中读入n个整数x1,x2,…,xn,并且在输出带的第一个方格上输出一个整数y后停机,那么就说程序P计算了函数f(x1,x2,…,xn)=y解释二:把RAM程序当作一个语言接受器。将字符串S=a1a2…an放在输入带上。在输入带的第一个方格中放入符号a1,第二个方格中放入符号a2,…,第n个方格中放入符号an。然后在第n+1个方格中放入0,作为输入串的结束标志符。如果一个RAM程序P读了字符串S及结束标志符0后,在输出带的第一格输出一个1并停机,就说程序P接受字符串S。48.1.1随机存取机RAM3.RAM程序的耗费标准标准一:均匀耗费标准在均匀耗费标准下,每条RAM指令需要一个单位时间;每个寄存器占用一个单位空间。以后除特别注明,RAM程序的复杂性将按照均匀耗费标准衡量。标准二:对数耗费标准对数耗费标准是基于这样的假定,即执行一条指令的耗费与以二进制表示的指令的操作数长度成比例。在RAM计算模型下,假定一个寄存器可存放一个任意大小的整数。因此若设l(i)是整数i所占的二进制位数,则001||log)(iiiil58.1.2随机存取存储程序机RASP1.RASP的结构RASP的整体结构类似于RAM,所不同的是RASP的程序是存储在寄存器中的。每条RASP指令占据2个连续的寄存器。第一个寄存器存放操作码的编码,第二个寄存器存放地址。RASP指令用整数进行编码。2.RASP程序的复杂性不管是在均匀耗费标准下,还是在对数耗费标准下,RAM程序和RASP程序的复杂性只差一个常数因子。在一个计算模型下T(n)时间内完成的输入-输出映射可在另一个计算模型下模拟,并在kT(n)时间内完成。其中k是一个常数因子。空间复杂性的情况也是类似的。68.1.3RAM模型的变形与简化1.实随机存取机RRAM在RRAM模型下,一个存储单元可以存放一个实数。下列的各运算为基本运算且每个运算只耗费单位时间。(1)算术运算+,-,×,/。(2)2个实数间的比较(,≤,=,≠,≥,)。(3)间接寻址(整数地址)。(4)常见函数的计算,如三角函数,指数函数,对数函数等。优点:能够方便处理实数;适合于用FORTRAN,PASCAL等高级语言写的算法。78.1.3RAM模型的变形与简化2.直线式程序对于许多问题,所设计的RAM程序中的转移指令仅用于重复一组指令,而且重复的次数与问题的输入规模n成比例。在这种情况下,可以用重复地写出相同指令组的方法来消除程序中的循环。由此,对每一个固定的n得到一个无循环的直线式程序。经过对RAM模型的简化,得到直线式程序的指令系统如下:x←y+zx←y-zx←y*zx←y/zx←i其中x,y和z是符号地址(或变量),而i是常数。每条指令耗费一个单位时间。88.1.3RAM模型的变形与简化3.位式计算直线式程序计算模型显然是基于均匀耗费标准的。在对数耗费标准下,使用另一个RAM的简化计算模型,称之为位式计算(BitwiseComputation)模型。除了下列2点外,该计算模型与直线式程序计算模型基本相同:(1)假设所有变量取值0或1,即为位变量。(2)所用的运算是逻辑运算而不是算术运算。用∧代表与,∨代表或,代表异或,代表非。在位式计算模型下,每个逻辑运算指令耗费一个单位时间。98.1.3RAM模型的变形与简化4.位向量运算(BitVectorOperations)若在直线式程序计算模型中,假设所有变量均为位向量,而且所用的运算均为位操作指令,则得到位向量运算计算模型。例如,要表示一个有100个顶点的图中从顶点v到其余各顶点间有没有边相连,可以用100位的一个位向量表示。若顶点v到顶点vj之间有边相连,则该位向量的第j位为1,否则为0。缺点:所需的机器字长要远大于其他模型。108.1.3RAM模型的变形与简化5.判定树判定树是一棵二叉树。它的每个内结点表示一个形如x∶y的比较。指向该结点左儿子的边相应于x≤y,标号为≤。指向该结点右儿子的边相应于xy,标号为。每一次比较耗费一个单位时间。下图是对a,b,c三个数进行排序的一棵判定树。在判定树模型下,算法的时间复杂性可用判定树的高度衡量。最大的比较次数是从根到叶的最长路径的长度。118.1.3RAM模型的变形与简化6.代数计算树ACT以x=(x1,x2,…,xn)为输入的一棵代数计算树T是一棵二叉树,且:(1)每个叶结点表示一个输出结果YES或NO。(2)每个单儿子内部结点(简单结点)v表示下列形式运算指令:op或op或其中,和分别是结点v在树T中的祖先结点v1和v2处得到的结果值,或是x的分量;op∈{+,-,×,/};c是一个常数。(3)每个有2个儿子的内部结点(分支结点)v,表示下列形式的测试指令:0或≥0或=0其中,是结点v在树T中的祖先结点v1处得到的结果值,或是x的分量。1vvff2vfcfv1vf1vvff1vf2vf1vf1vf1vf1vf128.1.3RAM模型的变形与简化7.代数判定树ADT(AlgebraicDecisionTree)在代数计算树T中,若将所有的简单结点都压缩到其最近的子孙分支结点处,并将简单结点处的计算在压缩后的分支结点处同时完成,则计算结果可看作是输入x的一个代数函数fv(x)。由此引出另一个称为代数判定树的计算模型。代数判定树T是一棵二叉树,且(1)每个叶结点表示输出结果YES或NO。(2)每个内部结点v表示一个形如fv(x1,x2,…,xn)∶0的比较。其中,x=(x1,x2,…,xn)是输入,fv是一个代数函数。138.1.4图灵机1.多带图灵机148.1.4图灵机1.多带图灵机根据有限状态控制器的当前状态及每个读写头读到的带符号,图灵机的一个计算步可实现下面3个操作之一或全部。(1)改变有限状态控制器中的状态。(2)清除当前读写头下的方格中原有带符号并写上新的带符号。(3)独立地将任何一个或所有读写头,向左移动一个方格(L)或向右移动一个方格(R)或停在当前单元不动(S)。k带图灵机可形式化地描述为一个7元组(Q,T,I,δ,b,q0,qf),其中:(1)Q是有限个状态的集合。(2)T是有限个带符号的集合。(3)I是输入符号的集合,IT。(4)b是惟一的空白符,b∈T-I。(5)q0是初始状态。(6)qf是终止(或接受)状态。(7)δ是移动函数。它是从QTk的某一子集映射到Q(T{L,R,S})k的函数。158.1.4图灵机1.多带图灵机图灵机M的时间复杂性T(n)是它处理所有长度为n的输入所需的最大计算步数。如果对某个长度为n的输入,图灵机不停机,T(n)对这个n值无定义。图灵机的空间复杂性S(n)是它处理所有长度为n的输入时,在k条带上所使用过的方格数的总和。如果某个读写头无限地向右移动而不停机,S(n)也无定义。与RAM模型类似,图灵机既可作为语言接受器,也可作为计算函数的装置。168.1.5图灵机模型与RAM模型的关系图灵机模型与RAM模型的关系是指同一问题在这2种不同计算模型下的复杂性之间的关系。定理8-3对于问题P的任何长度为n的输入,设求解问题P的算法A在k带图灵机模型TM下的时间复杂性为,那么,算法A在RAM模型下的时间复杂性为。)(nT))((2nTO定理8-4对于问题P的任何长度为n的输入,设求解问题P的算法A在RAM模型下,不含有乘法和除法指令,且按对数耗费标准其时间复杂性为,那么,算法A在k带图灵机模型TM下的时间复杂性为。)(nT))((2nTO178.1.6问题变换与计算复杂性归约具体地说,假设有2个问题A和B,将问题A变换为问题B是指:(1)将问题A的输入变换为问题B的适当输入。(2)解出问题B。(3)把问题B的输出变换为问题A的正确解。若用O(τ(n))时间能完成上述变换的第(1)步和第(3)步,则称问题A是τ(n)时间可变换到问题B,且简记为A∝τ(n)B。其中的n通常为问题A的规模(大小)。当τ(n)为n的多项式时,称问题A可在多项式时间内变换为问题B。特别地,当τ(n)为n的线性函数时,称问题A可线性地变换为问题B。通过问题变换的技巧,可以将2个不同问题的计算复杂性联系在一起。这样就可以将一个问题的计算复杂性归结为另一个问题的计算复杂性,从而实现问题的计算复杂性归约。188.1.6问题变换与计算复杂性归约命题1(计算时间下界归约):若已知问题A的计算时间下界为T(n),且问题A是τ(n)可变换到问题B,即A∝τ(n)B,则T(n)-O(τ(n))为问题B的一个计算时间下界。命题2(计算时间上界归约):若已知问题B的计算时间上界为T(n),且问题A是τ(n)可变换到问题B,即A∝τ(n)B,则T(n)+O(τ(n))是问题A的一个计算时间上界。问题的变换与问题的计算复杂性归约的关系:在命题1和命题2中,当τ(n)=o(T(n))时,问题A的下界归约为问题B的下界,问题B的上界归约为问题A的上界。198.1.6问题变换与计算复杂性归约通过问题变换获得问题的计算时间下界的例子:(1)判别函数问题:给定n个实数,计算其判别函数。nxxx,...,,21jijixx)(元素惟一性问题可以在O(1)时间内变换为判别函数问题。任何一个计算判别函数的算法,计算出判别函数值后,再作一次测试,判断其值是否为0,即可得到元素惟一性问题的解。由命题1即知,元素惟一性问题的计算时间下界也是判别函数问题的一个计算时间下界。)log(nn(2)最接近点对问题:给定平面上n个点,找出这n个点中距离最近的2个点。在元素惟一性问题中,将每一个实数,1≤i≤n,变换为平面上的点(,0),1≤i≤n,则元素惟一性问题可以在线性时间内变换为最接近点对问题。ixix208.2P类与NP类问题•8.2.1非确定性图灵机•8.2.2P类与NP类语言•8.2.3多项式时间验证218.2.1非确定性图灵机非确定性图灵机(NDTM):一个k带的非确定性图灵机M是一个7元组:(Q,T,I,δ,b,q0,qf)。与确定性图灵机不同的是非确定性图灵机允许移动函数δ具有不确定性,即对于QTk中的每一个值(q;x1,x2,…,xk),当它属于δ的定义域时,Q(T{L,R,S})k中有惟一的一个子集δ(q;x1,x2,…,xk)与之对应。可以在δ(q;x1,x2,…,xk)中随意选定一个值作为它的函数值。在图灵机计算模型中,移动函数δ是单值的,即对于QTk中的每一个值,当它属于δ的定义域时,Q(T{L,R,S})k中只有惟一的值与之对应,称这种图灵机为确定性图灵机,简记为DTM(DeterministicTuringMachine)。228.2.2P类与NP类语言P类和NP类语言的定义:P={L|L是一个能在多项式时间内被一台DTM所接受的语言}NP={L|L是一个能在多项式时间内被一台NDTM所接受的语言}由于一台确定性图灵机可看作是非确定性图灵机的特例,所以可在多项式时间内被确定性图灵机接受的语言也可在多项式时间内被非确定性图灵机接受。故PNP。238.2.2P类与NP类语言NP类语言举例——无向图的团问题。该问题的输入是一个有n个顶点的无向图G=(V,E)和一个整数k。要求判定图G是否包含一个k顶点的完全子图(团),即判定是否存在V’V,|V’|=k,且对于所有的u,v∈V’,有(u,v)∈E。若用邻接矩阵表示图G,用二进制串表示整数k,则团问题的一个实例可以用长度为的二进位串表示。因此,团问题可表示为语言:C