人工智能原理第6章知识表示本章内容6.1知识表示概述6.2本体论6.3产生式系统6.4框架6.5语义网络6.6脚本参考书目第6章知识表示3知识表示的重要性•知识表示是AI的基础,也就是构建智能体的基础•知识表示是推理和行动的载体/没有合适的知识表示,任何构建智能体的计划都无法付诸实施•表示常常和推理紧密联系•知识表示通常是一些符号的集合/推理和行动可以由这些符号构建,也可以本身就代表着一种行为结构(如神经网络)第6章知识表示6.1知识和知识表示第6章知识表示5知识与知识表示•知识的定义?•Feignebaum:知识是经过消减、塑造、解释和转换的信息•Bernstein:知识是由特定领域的描述、关系和过程组成的•Hayes-roth:知识是事实、信念和启发式规则•知识库的观点:知识是某领域中所涉及的各有关方面的一种符号表示第6章知识表示6知识与知识表示•知识的种类•事实性知识:采用直接表示的形式•如:凡是猴子都有尾巴•过程性知识:描述做某件事的过程•如:电视维修法•行为性知识:不直接给出事实本身,只给出它在某方面的行为•如:微分方程、(事物的内涵)•……第6章知识表示7知识与知识表示•知识的种类•……•实例性知识:只给出一些实例,知识藏在实例中•类比性知识:既不给出外延,也不给出内涵,只给出他与其他事物的某些相似之处,例如比喻、谜语•元知识:有关知识。最重要的元知识是如何使用知识的知识,如何从知识库中找到想要的知识第6章知识表示8知识与知识表示•知识的要素•事实:事物的分类、属性、事物间的关系、科学事实、客观事实等(最底层的知识)•规则:事务的行为、动作和联系的因果关系知识(启发式规则)•控制:当有多个动作同时被激活时,选择哪一个动作来执行的知识(技巧性)•元知识:高层知识。怎样使用规则、解释规则、校验规则、解释程序结构等知识第6章知识表示9知识与知识表示•知识表示的定义•知识表示研究用机器表示知识的可行性、有效性的一般方法。•知识表示是智能推理的部分理论•知识表示是有效计算的载体•知识表示是交流的媒介(如语义网络)第6章知识表示10知识与知识表示•选取知识表示的因素•表示范围是否广泛•是否适于推理•是否适于计算机处理•是否有高效的算法•能否模块化•……•总之,人工智能问题的求解是以知识表示为基础的。如何将已获得的有关知识以计算机内部代码形式加以合理地描述、存储、有效地利用,便是知识表示应解决的问题。第6章知识表示11知识与知识表示•知识表示研究特点•智能行为的特有的灵活性。“常识问题”不能概括为一类简洁的理论,使大量小理论的集合•AI的任务受到计算装置的约束。这导致了所采用的“表示”必须同时满足“刻画智能现象”与“计算装置可以接受”,这两个有时是矛盾的条件第6章知识表示6.2本体论(Ontology)6.2.1本体论研究内容6.2.2本体论分类6.2.3描述事物与时空6.2.4领域Ontology应用第6章知识表示13本体论与存在•本体论(Ontology)是关于存在(existence)的研究•存在是什么—所有的实体(entity),包括抽象的和具体的(abstract&concrete),正是它们组成了世界•当代定义:共享概念模型的明确的形式化规范说明/要素:•概念模型明确•形式化共享第6章知识表示14Ontology定义的要素•概念模型—对现实世界的一些现象抽象出相关概念而得到的模型•明确—所用概念和所用概念的约束均有明确定义•形式化—计算机可读的•共享—体现了共同认可的知识,反映的是相关领域中公认的概念集合第6章知识表示156.2.1本体论研究内容•本体论是关于事物本身的研究,主要研究如何描述事物(定义),特别是如何分类事物第6章知识表示16基于本体论的分类•基于本体论的分类/对于事物的描述•本体论分类(OntologicalCategories)或者称为基于本体论的分类:是对事物一种尽可能详细完备的分类方式•本体论分类可以分为4级:•顶级Ontology—最普通的概念及其关系•领域Ontology—特定领域的概念•任务Ontology—特定任务或行为中•应用Ontology—依赖于特定领域和任务第6章知识表示17构造Ontology的规则•构造Ontology的5条标准(Gruber,1995)•明确性和客观性—用自然语言对所定义术语给出明确、客观的语义定义•完全性—给出的定义是完整的,完全能表达所定义术语的含义•一致性—由术语得出的推论与术语本身的含义相容•最大单调可扩展性—添加通用或专用术语时,不需要修改已有内容•最小承诺—对待建模的对象给出最少的约束第6章知识表示186.2.2本体论分类•以美国著名的知识工程CYC(encyclopedia)为例(号称是世界上最大的知识库),介绍其顶层的分类(早期版本)•CYC研究最早始于1984年,距今已经20余年(ThedevelopmentofCycwasaverylong-term,high-riskgamblethathasbeguntopayoff.见其主页)•CYCKB包括数千个微理论(microtheories),一些微理论面向特定领域,该机制允许各子库独立维护•CYCKB已经有20万术语(term),每个术语又包含了几十个论断(assertion)第6章知识表示19CYC本体论顶层分类第6章知识表示IndividualObjectIntangibleRepresentedThingEventStuffIntangibleObjectCollectionIntangibleStuffRelationshipInternalMachineThingAttributeValueSlotAttributeAbsoluteAttr.ValueRelativeAttr.ValueQualitativeAttr.ValueNonphysicalAttr.ValuePhysicalPerceivableAttr.ValueProcessSomethingOccurringDynamicProcessSomethingExistingIntelligenceCompositeTangible&IntangibleObj.TangibleObjectTangibleStuffThing20CYC本体论的层次结构(1)•最顶层称为Thing/Entity/┬,下一层为什么是分为三个分支?最右分支一开始是作为其他两类的补充而出现,后来改进为元层次表示(metalevel),可作为“关于表示的表示”而存在•注意:某些CYC层次和分类仍有争论/也是本体论特色之一第6章知识表示21CYC本体论的层次结构(2)•合乎老子的道家学说:•TheTaogavebirthtotheOne;•TheOnegavebirthtotheTwo;•TheTwogavebirthtotheThree;•AndtheThreegavebirthtothetenthousandthings.第6章知识表示22本体论顶层分类(1)•二分法:物理(Physical)/抽象(Abstract)•三分法:独立(Independent)/关系(Relative)/中介(Mediating)•分别称为第一级(Firstness)/第二级(Secondness)/第三级/(Thirdness)•二者结合生成6个类别第6章知识表示23本体论顶层分类(2)•二分法和三分法结合(Peirce&Whitehead)/哲学上的理念第6章知识表示┬IndependentRelativeMediatingPhysicalAbstractActualityFormPrehensionPropositionNexusIntention24本体论顶层分类(4)•万物的存在形式与时间的关系:相对静止或变化中—于是增加一种属性描述,可以将上述分类再次一分为二•相对静止—连续相(Continuants)•相对变化—发生相(Occurrents)•从时间角度观察万物,存在着一个视点(Viewpoint):•Minutes尺度—冰河(glacier)=Continuants/雪崩(avalanche)=Occurrents/Centuries尺度—冰河=Occurrents第6章知识表示25本体论顶层分类(5)第6章知识表示ObjectProcessSchemaScriptJunctureParticipationDescriptionHistoryStructureSituationReasonPurposeIndependentRelativeMediatingPhysicalAbstractContinuantOccurrentContinuantOccurrent组合关系:Object=IPCetc.266.2.3描述事物与时空•本体论在描述事物与时空时有诸多考虑,这里概要地介绍一点•物理实体(physicalentity)与抽象形式(abstract)之间关系:多对一•同一形式可能对应于不同实体,存在歧义第6章知识表示•左图是:词汇“TOOT”?•1001上面加一横线?•桌子下面有两个气球?27集合与分类•如何描述多个事物?需要引入集合和分类/相关术语•集合(set)—具有两种操作的结构(/)/不能描述不可数事物•聚集(collection)—对事物更简单、更一般的排列/可以描述可数的和不可数的事物•类型(type)—关于实体聚集的规格(specification)/独立于集合内容的改变•分类(category)—用于分类的类型第6章知识表示28类型与事物集合•概念“类型(type)”是一个抽象规格,而不是事物的集合•对于每个类型t,有集合t称为t的指示(denotation)•frog=概念系统的一个类型,frog=世界上所有青蛙的集合•在类型格子(lattice)和集合(现实事物)格子之间不存在一一映射•如type(麒麟Unicorn)映射为空集/而Human和FeatherlessBiped指的都是人类第6章知识表示29空间与时间•集合论对离散元素和严格界限的要求给连续的空间和时间的表示带来麻烦•如空间中由点组成物体,那么中点/中线在哪里?•类似的问题:关于瞬时(instant)是否组成期间(duration)•引入:•没有点的空间(spacewithoutpoints)•没有瞬时的时间(timewithoutinstants)第6章知识表示306.2.4领域Ontology应用•生物信息学(bioinformatics)是当前一个学科交叉的研究热点•任务之一:在生物及医学科学文献中识别出生物实体之间的相互关系•例如:蛋白质与蛋白质之间的关系theGAGproteinfrommembranebindstoAlix/AIP1…•疾病与治疗手段之间的关系anantichlamydialmacrolideantibiotic,roxithromycin,canpreventmajorischaemiceventswithunstableangina第6章知识表示31N-N形式的名词复合•在科学文献中,多个名词顺序连接组合成一个名词短语用以表示一个科技术语,这类组合称为名词复合(nouncompounds,NCs)/最简单的是N-N复合•生物信息学中的例子•abdomenradiography•injuryrehabilitation•deliriumtreatment第6章知识表示32N-N间关系的确定•很显然,N-N两个名词之间存在一定的关系,如上例中abdomenradiography是身体部位与检查手段之间的关系/识别N-N之间的关系也是一种关系识别•有各种方法可以识别N-N之间的关系•建立识别规则库,积累识别的例子•通过语料库训练,采用统计学习方法进行分类•利用专业领域词典,判别N-N各自的类别,从而建立两者之间的关系第6章知识表示33生物医学领域词汇本体库MeSH•MeSH=MedicalSub