第2章知识表示【主要内容】2.1概述2.2谓词逻辑表示法2.3产生式表示法2.4语义网络表示法2.5框架表示法2.6脚本表示法2.7状态空间表示法2.8面对对象的知识表示2.9小结按其作用可大致分为三类:(1)描述性知识(2)判断性知识(3)过程性知识按照作用的层次,知识还可以分成以下两类:(1)对象级知识(2)元级知识知识表示的方法按其表示的特征可分为两类:(1)叙述性表示(2)过程性表示所谓表示就是为描述世界所作的一组约定,是把知识符号化的过程、知识的表示与知识的获取、管理、处理、解释等有直接的关系。对知识表示有如下要求:(1)表示能力。能够将问题求解所需的知识正确有效地表达出来。(2)可理解性。所表达的知识简单、明了、易于理解。(3)可访问性。能够有效地利用所表达的知识。(4)可扩充性。能够方便、灵活地对知识进行扩充。知识表示方法(1)谓词逻辑(2)状态空间(3)产生式规则(4)语义网络(5)框架(6)概念从属(7)脚本(8)Petri网除了上述的几种主要的知识表示方法以外,还有很多知识表示方法,如直接表示法、过程表示法、面向对象的表示法,以及多种非规范逻辑等谓词逻辑表示分为命题逻辑和谓词逻辑两种。命题逻辑1.命题的含义在逻辑系统中,最简单的逻辑系统是命题逻辑。所谓的命题就是具有真假意义的陈述句。2.命题类型命题有两种类型:(1)原子命题:不能分解成更简单的陈述语句,称为原子命题。(2)复合命题:由连接词、标点符号和原子命题等复合构成的命题,称为复合命题。3.命题逻辑词所谓命题逻辑就是研究命题和命题之间关系的符号逻辑系统。重要概念:命题常量:如果一个命题标识符表示确定的命题,就称为命题常量。命题变元:如果命题标识符只表示任意命题的位置标志,就称为命题变元。谓词逻辑:根据对象和对象上的谓词(即对象的属性和对象之间的关系),通过使用连接词和量词来表示世界。谓词逻辑1.语法一阶谓词演算:标点符号、括号、逻辑连接词、常量符号集、变量符号集、n元函数符号集、n元谓词符号集、量词。谓词演算:合法表达式(原子公式、合式公式),表达式的演算化简方法,标准式(合取的前束范式或析取的前束范式)。2.基本概念(1)函数符号与谓词符号若函数符号f中包含的个体数目为n,则称f为n元函数符号。若谓词符号P中包含的个体数目为n,则称P为n元谓词符号。例如:father(x)是一元函数,less(x,y)是二元谓词。一般一元谓词表达了个体的性质,而多元谓词表达了个体之间的关系。(2)谓词的阶如果谓词P中的所有个体都是个体常量、变元、或函数,则该谓词为一阶谓词。如果谓词P中某个个体本身又是一个一阶谓词,则称P为二阶谓词。个体变元的取值范围称为个体域。个体域可以是有限的,也可以是无限的。把各种个体域综合在一起作为讨论范围的域称为全总个体域。3.项与公式在一阶谓词逻辑中,称Teacher(father(Wang))中的father(Wang)为项,项可定义如下。定义2.1项可递归定义如下:(1)单独一个个体是项(包括常量和变量)。(2)若f是n元函数符号,而t1,t2,…,tn是项,则f(t1,t2,…,tn)是项。(3)任何项仅由规则(1)(2)所生成。定义2.2若P为n元谓词符号,t1,t2,…,tn都是项,则称P(t1,t2,…,tn)为原子公式,简称原子。在原子中,若t1,t2,…,tn都不含变量,则P(t1,t2,…,tn)是命题。注意:谓词逻辑可以由原子和5种逻辑连接词,再加上量词来构造复杂的符号表达式。这就是所谓的谓词逻辑中的公式。定义2.3一阶谓词逻辑的合式公式(可简称公式)可递归定义如下:(1)原子谓词公式是合式公式(也称为原子公式)。(2)若P、Q是合式公式,则(┐P)、(P∧Q)、(P∨Q)、(P→Q)、(PQ)也是合式公式。(3)若P是合式公式,x是任一个体变元,则(x)P、(x)P也是合式公式。(4)任何合式公式都由有限次应用(1)、(2)、(3)来产生。定义2.4设D为谓词公式P的非空个体域,若对P中的个体常量、函数、谓词按如下规定赋值:(1)为每个个体常量指派D中的一个元素。(2)为每个n元函数指派一个从到D的映射。(3)为每个n元谓词指派一个从Dn到{T,F}的映射。则称这些指派为公式P在D上的一个解释。4.谓词逻辑适用范围谓词逻辑适合于表示事物的状态、属性、概念等事实性知识,也可以用来表示事物间具有确定因果关系的规则性知识。(1)对事实性知识(2)对规则性知识5.谓词逻辑表示步骤谓词公式表示知识的一般步骤如下:(1)定义谓词及个体,确定每个谓词及个体的确切含义;(2)根据所要表达的事物或概念,为每个谓词中的变元赋以特定的值;(3)根据所要表达的知识的语义,用适当的连接符将各个谓词连接起来形成谓词公式。6.一阶谓词逻辑表示法的特点(1)一阶谓词逻辑表示法的优点①严密性:可以保证其演绎推理结果的正确性,可以较精确地表达知识。②自然性:它的表现方式和人类自然语言非常接近。③通用性:拥有通用的逻辑演算方法和推理规则。④知识易于表达:如果对逻辑的某些外延扩展后,则可把大部分精确性知识表达成一阶谓词逻辑的形式。⑤易于实现:用它表示的知识易于模块化,便于知识的增删及修改,便于在计算机上实现。(2)一阶谓词逻辑表示法的缺点①效率低:由于推理是根据形式逻辑进行的,把推理演算和知识含义截然分开,抛弃了表达内容所含的语义信息,往往是推理过程太冗长,降低系统效率。另一方面,谓词表示越细,表示越清楚,推理越慢、效率越低。②灵活性差:不便于表达和加入启发性知识和元知识。不便于表达不确定性的指示,但人类的知识大都具有不确定性和模糊性,这是使得它表示知识的范围受到了限制。③组合爆炸:在其推理过程中,随着事实数目的增大及盲目的是用推理规则,有可能产生组合爆炸。产生式可表示的知识种类及其基本形式1.可表示的知识种类2.产生式的基本形式3.产生式与谓词逻辑中蕴涵式的区别1.确定性规则知识的产生式表示确定性规则知识的产生式形式为P→Q或者IFPTHENQ其中,P是产生式的前提,用于指出该产生式是否是可用的条件;Q是一组结论或操作,用于指出前提P所指示的条件被满足时,应该得出的结论或应该执行的操作。2.不确定性规则知识的产生式表示产生式可用于不确定知识的表示,不确定性规则知识的产生式形式为P→Q(可信度)或者IFPTHENQ(可信度)其中,P是产生式的前提,用于指出该产生式是否是可用的条件;Q是一组结论或操作,用于指出前提P所指示的条件被满足时,应该得出的结论或应该执行的操作。3.确定性事实性知识的产生式表示事实性知识可看成是断言一个语言变量的值或是多个语言变量间的关系的陈述句。语言变量的值或语言变量间的关系可以是一个词,不一定是数字。事实性知识的表示形式一般使用三元组来表示:(对象,属性,值)或者(关系,对象1,对象2)其中对象就是语言变量。4.不确定性事实性知识的产生式表示有些事实性知识带有不确定性。不确定事实性知识的表示形式一般使用四元组来表示:(对象,属性,值,可信度值)或者(关系,对象1,对象2,可信度值)把一组产生式放在一起,让它们相互配合,协同作用,一个产生式生成的结论可以供另一个产生式作为已知事实使用,以求得问题的解决,这样的系统称为产生式系统。产生式系统一般由三个基本部分组成:(1)规则库(2)综合数据库(3)推理机1.规则库规则库就是用于描述某领域内的知识的产生式集合,是某领域知识(规则)的存储器,其中的规则是以产生式形式表示的。规则库中包含着将问题从初始状态转换成目标状态(或解状态)的那些变换规则。规则库是专家系统的核心,也是一般产生式系统赖以进行问题求解的基础,其中知识的完整性和一致性、知识表达的准确性和灵活性以及知识组织的合理性,都将对产生式系统的性能和运行效率产生直接的影响。2.综合数据库综合数据库又称为事实库,用于存放输入的事实、从外部数据库输入的事实以及中间结果(事实)和最后结果的工作区。当规则库中的某条产生式的前提可与综合数据库中的某些已知事实匹配时,该产生式就被激活,并把用它推出的结论放入综合数据库中,作为后面推理的已知事实。显然,综合数据库的内容是在不断变化的,是动态的。3.推理机推理机是一个或一组程序,用来控制和协调规则库与综合数据库的运行,包含了推理方式和控制策略。控制策略的作用就是确定选用什么规则或如何应用规则。通常从选择规则到执行操作分3步完成:匹配、冲突解决和操作。产生式系统推理机的推理方式有正向推理、反向推理和双向推理三种。1.正向推理正向推理是从已知事实出发,通过规则库求得结论。正向推理方式也被称为数据驱动方式或自底向上的方式。它的推理过程是:(1)规则库中的规则与综合数据库中的事实进行匹配,得到匹配的规则集合;(2)使用冲突解决算法,从匹配规则集合中选择一条规则作为启用规则;(3)执行启用规则的后件,将该启用规则的后件送入综合数据库或对综合数据库进行必要的修改。重复这个过程直至达到目标。2.反向推理反向推理是从目标(作为假设)出发,反向使用规则,求得已知事实。这种推理方式也被称为目标驱动方式或自顶向下的方式。其推理过程是:(1)规则库中的规则后件与目标事实进行匹配,得到匹配的规则集合;(2)使用冲突解决算法,从匹配规则集合中选择一条规则作为启用规则;(3)将启用规则的前件作为子目标。重复这个过程直至各子目标均为已知事实,则反向推理的过程就算成功结束。如果目标明确,使用反向推理方式的效率是比较高的,所以常为人们所使用。3.双向推理双向推理是一种既自顶向下又自底向上的推理。推理从两个方向同时进行,直至某个中间界面上两方向结果相符便成功结束。不难想象,这种双向推理较正向或反向推理所形成的推理网络来得小,从而推理效率更高。产生式表示法有以下特点:(1)清晰性(2)模块性(3)自然性语义网络是J.R.Quillian于1968年在研究人类联想记忆时提出的一种心理学模型,他认为记忆是由概念间的联系实现的。随后在他设计的可教式语言理解器(TeachableLanguageComprehendent)中又把它用作为知识表示方法。语义网络是一种通过概念及其语义联系(或语义关系)来表示知识的有向图,节点和弧必须带有标注。其中有向图的各节点用来表示各种事物、概念、情况、属性、状态、事件和动作等,节点上的标注用来区分各节点所表示的不同对象,每个各节点可以带有多个属性,以表征其所代表的对象的特性。在语义网络中,节点还可以是一个语义子网络;弧是有方向的、有标注的,方向表示节点间的主次关系且方向不能随意调换。标注用来表示各种语义联系,指明它所连接的节点间的某种语义关系。从结构上来看,语义网络一般由一些最基本的语义单元组成。这些最基本的语义单元被称为语义基元,可用如下三元组来表示为:(节点1,弧,节点2)语义网络除了可以描述事物本身之外,还可以描述事物之间的错综复杂的关系。经常使用的最基本语义关系有:1.类属关系2.包含关系3.属性关系4.时间关系5.位置关系6.相近关系7.因果关系8.组成关系1.事实性知识的表示2.情况、动作和事件的表示为了描述那些复杂的知识,在语义网络的知识表示法中,通常采用引进附加节点的方法来解决。西蒙(Simon)在提出的表示方法中增加了情况节点、动作节点和事件节点,允许用一个节点来表示情况、动作和事件。(1)情况的表示在用语义网络表示那些不及物动词表示的语句或没有间接宾语的及物动词表示的语句时,如果该语句的动作表示了一些其它情况,如动作作用的时间等,则需要增加一个情况节点用于指出各种不同的情况。(2)动作的表示有些表示知识的语句既有发出动作的主体,又