第五章-知识获取及表达

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第五章智能工程中的知识获取及表达第一节知识概述第二节知识获取第三节知识表达第一节知识概述一、知识的定义知识是事实和关系的集合,它以高度概括的形式揭示研究对象的属性和相互关系,用来解决实际问题和从事创造活动。个人或计算机具备的知识质量可用解决问题和创造能力来评价。二、知识的分类1.对象知识2.事件知识3.行为知识4.工序知识5.元知识1.对象知识对象知识是关于对象有关事实的知识。如“鲸鱼是哺乳动物”。对此,需要有表示对象、对象集合、类别和描述对象的方法。返回2.事件知识事件知识是关于过去发生、现在发生或将要发生的事件的知识。对此,不仅要把事件本身符号化,并要表示事件发生的时间、地点、状态、性质和因果关系。如“昨天下午他因病没有参加比赛”。返回3.行为知识行为知识是行为者之间、行为者和行为对象之间在相互作用时所表现的行为的知识。如,狗在条件反射实验中的各种反应的知识。返回4.工序知识工序知识是记述进行某些行为的操作步骤的知识,要求表达起动条件、顺序关系、因果关系等。如,描述汽车驾驶过程时运用的知识。返回5.元知识元知识是关于知识的知识,用来指导如何选择事实和规则(关系)的知识。这是比解决具体问题所需要的知识更高层次的带有指导意义的战略层次的知识。如,“物极必反”是元知识。元知识包括选择、评价、说明、诊断或检查知识去解决实际问题所需要的知识和开拓新领域需要的知识。返回本章第二节知识获取一、概述二、机器学习方法三、知识获取要考虑的问题一、概述1.知识获取的概念2.机器学习发展的三个阶段3.知识的采集和加工编辑4.获取的知识类型5.学习系统模型6.机器学习的主要研究类型1.知识获取的概念知识获取的理论基础是机器学习.机器学习指一个系统能不断改进自身性能的过程,它包括:(1)系统能够解决更多的问题;(2)系统能够提供更精确的答案;(3)系统能够以更低的代价获取知识.返回2.机器学习发展的三个阶段第一阶段:研究集中在修正自身以适应环境自组织系统上;第二阶段:70年代初期,由于Winston有影响的论文的发表,研究者接受了如下观点,即学习是一个复杂而又困难的过程,自然也就不能指望学习系统以完全没有任何知识为起点去学习高水平的概念;第三阶段:目前正在进行中,目标是为专家系统获取知识.返回3.知识的采集和加工编辑知识获取是确定知识范围,采集和加工编辑知识的过程.采集知识主要从专家那里采集与被求解问题有关的知识,专家知识包括专业知识和求解问题的方法和步骤的知识.加工编辑知识要使知识规格化、系统化,使知识库便于管理,包括如下方面:(1)问题的关系符号化,选择合适的知识表达方法;(2)建立知识库的编辑系统,可修改、删除、更新和调整知识库的内容;(3)检验知识库的完整性和无矛盾性.返回4.获取的知识类型对于构造专家系统,它需要获取的知识大致可以归纳为专业知识和元知识两大类.进一步可以划分为七个方面:事实知识、规则知识、判定树知识、概念知识、控制知识、原理性知识和关于知识的可靠性的知识。返回5.学习系统模型关于学习,不同领域的专家持不同的观点。神经学家、心理学家、控制论学者、人工智能研究者、实践操作人员、理论工作者都有不同的定义,其中Simon的观点也许是最完整,他把学习定义为“一个系统能不断改进自身性能的过程”,下图是费根鲍姆等根据这个定义提出的学习系统模型。环境知识库学习执行返回环境环境是系统获取知识的信息来源,包括工作对象或客体所处的外界条件。环境提供的信息水平确定了系统必须产生的假设类型。可以区分出四种基本的学习情况:(1)机械学习(2)告知学习(3)归纳学习(4)借助相似性学习返回知识库知识库用于存储和积累知识,根据记忆的稳定程度,库中的知识可以划分为:(1)长期记忆知识具有稳定性,如基本概念,定理,公理和规则等.(2)中期记忆知识可通过学习改变的知识(3)短期知识环境变化的信息和数据,学习的中间结果等.知识库中知识表示的形式必须具有易表示性、易推理性、可修改性和可扩充性。返回执行单元执行单元是整个学习系统的焦点,因为学习单元试图改进的正是执行单元的动作。有关执行单元的三个主要问题是:复杂性,反馈和透明性。(1)复杂性:当执行的任务很复杂,同时知识库很大时,综合新规则和诊断错误规则的问题变得非常复杂。(2)反馈:所有的学习系统都必须通过某种方式评价学习单元提出来的假设。(3)透明性返回6.机器学习的主要研究类型基础研究:发展各种理论,探讨所有可能的学习方法及算法,比较人类学习与机器学习的异同和联系,寻找适合机器学习的最好学习方法;模拟:从模拟人类学习过程出发,建立认识生理学模型与认识心理学模型,深入研究学习过程的各个环节和特征;应用:研制各种机器学习系统,使其能自动获取知识,自动总结经验,自行完善性能,自动适应环境变化。返回本节二、机器学习方法1.知识获取方法2.机器学习方法1.知识获取方法知识获取有如下方法:(1)心理学方法:即场记法,这是基于个人结构理论的多重表格法,用来提供场景、激发记忆和联想.(2)人工智能方法:机器学习法.(3)软件工程方法:知识分析法.(4)基于领域模型的方法:获取分类型知识.(5)基于案例的方法:获取规划和设计知识.2.机器学习方法(1)机械学习(2)告知学习(3)演绎学习(4)归纳学习(5)类比学习(5)类比学习类比学习是把两个或两类事物或情形进行比较,找出它们在某一抽象层上的相似关系,并以此为依据把某一事物或情形的有关知识加以适当整理对应到另一个事物或情形上去,从而获得后者的知识。(1)机械学习机械学习也称记忆学习,是指环境提供的信息和执行环节使用的信息有相同的水平和同样的形式.学习环节不必理解或解释收到的信息并改变信息的水平,只要把这些信息加入知识库.记忆可看成一种函数f,函数的输入是向量(x1,x2,…,xn),输出是向量(y1,y2,…,yn),记忆f的工作只是在存储器中保存组合对[(x1,x2,…,xn),(y1,y2,…,yn)].解决问题就是计算函数值f(x1,x2,…,xn),执行环节只要根据(x1,x2,…,xn),从存储器中读出(y1,y2,…,yn).记忆学习的简单模型如下图示.(x1,x2,…,xn)(y1,y2,…,yn)[(x1,x2,…,xn),(y1,y2,…,yn)]f输入格式执行函数计算的输出值组合对保存记忆学习模型返回(2)告知学习告知学习也称传授学习、请教学习或采纳建议学习。告知学习存在两种途径:途径一:要求系统接受抽象的、高级的建议,并把它们转换为可以用于执行环节的规则。这要求系统自动完成接受建议过程中各阶段的任务。它们包括:建议:专家提出建议;解释:把建议转化成内部形式;实用化:把建议转化成可用形式;归并:合并到知识库;评价:评价执行环节的行为。途径二:开发一种知识库编辑和调试高级系统。该系统使专家很容易把专门知识转换成具体规则,专家是学习系统的一个组成部分,由专家检测故障并修改知识库。这种途径是半自动的知识获取方法,要求知识工程师完成前三步工作,而系统本身完成后两步工作;帮助人把新知识加入知识库(智能编辑子系统),对知识库评价和修改错误(修改和说明子系统)。返回(3)演绎学习学习系统对已知的知识进行推理,由前提得到结论,导出的结论再作为进一步推理的前提。演绎推理的过程是一种保真变换。在已有知识集合中加进一些用演绎获取的知识,可能对问题的解决有所帮助。如,假设计算机里存放了如下的事实和推理规则:Occupation(Li,professor)(∀x){occupation(x,professor)→know(x,English)}返回(4)归纳学习学习系统对外界提供的信息进行普遍化,归纳出一般规则和理论,这是一个保假变换,是一个发现定理、定律的方法,可划分为实例学习和观察发现学习。实例学习:由特殊的实例归纳出一般规则的学习;观察发现学习:这种学习是由环境提供正事例(无反例),学习系统利用已知的简单概念(背景知识)来构造数据聚类,即生成一种理论来描述绝大部分已知数据,或是通过发现数据间的内在关系来发现新的概念。返回(5)类比学习类比学习是把两个或两类事物或情形进行比较,找出它们在某一抽象层上的相似关系,并以此为依据把某一事物或情形的有关知识加以适当整理对应到另一个事物或情形上去,从而获得后者的知识.类比有多种形式:概念类比、图形类比和方法类比等。类比学习获取知识的模型如下图示。这个模型中包括三个基本过程:联想:根据新问题的某些特征联想到过去某些相似的情节,以指导新问题的解决;变换:情节知识的变换和重构;类比:将新问题及解并入知识库,将新旧问题之间的共同特征组成一般化的情节,而将差异作为索引。新问题新问题的解老问题老问题的解类比学习模型返回本节三、知识获取要考虑的问题1.知识的抽取2.多位专家知识的抽取3.适当的知识容量的确定4.知识使用的频度返回本章第三节知识表达一、概论二、产生式系统三、谓词逻辑表达四、PROLOG五、语义网六、框架一、概论知识表示是一个复杂的问题,目前还没有对所有问题都适用的知识表示方法。当前,有三中不同的观点。1.认识论表示观假设这种观点认为表示是对自然界的描述,表示自身不显示智能行为,其唯一的作用是携带知识.2.本体论表示观假设本体论观点认为表示是对自然界的一种近似,它规定了看待自然界的方式,即是一种约定的集合.表示只是描述了在这个世界中,观察者当前所关心的那部分,其它部分被忽略.这种观点强调观察部分的有效性和“启发式”研究.3.知识工程表示观表示是对自然世界描述的计算模型,它应满足计算机这一实体的具体限制,因此可以理解为一类数据结构及在其上的一组操作.知识表示应做到以下几点:充分表示,充分推理,有效推理,有效地获取知识.返回本节二、产生式系统产生式系统是一种问题求解系统,是事件驱动型系统,适于用if-then来表示问题,这种形式称为产生式规则.产生式系统有三个组成部分:综合数据库,产生式规则库和控制系统.综合数据库包括所有完成特殊任务的有用信息,或已知条件,随着规则右边部分的执行,数据库可能增加新的内容.产生式规则库:规则包括左边和右边两部分,左边决定规则的可用条件,右边表示条件成立时应采取的行动,或条件成立时产生的结果.二、产生式系统控制系统对当前状态选择一条可应用的规则,并记住已经选用的规则序列以及执行规则产生的新数据.控制系统运用适当的策略把一组规则重复地应用到状态描述,直到产生目标状态描述为止.见下例.分油的例子初始状态(8,0,0),目标状态(4,4,0).a:8,b:5,c:3产生式规则(8条):R1:(a,b,c|b5)→(a-(5-b),5,c)R2:(a,b,c|b5,b+c5)→(a,5,c-(5-b))R3:(a,b,c|c3)→(a-(3-c),b,3)R4:(a,b,c|c3,b+c3)→(a,b-(3-c),3)R5:(a,b,c|b0)→(a+b,0,c)R6:(a,b,c|b5)→(a,0,b+c)R7:(a,b,c|c0)→(a+c,b,0)R8:(a,b,c|c0,b+c5)→(a,b+c,0)控制策略采用广度优先策略,按规则ri(i=1,2,…,8)足标顺序选择规则,生成新结点放入数据库,如果一条通路上生成了目标状态结点,则这一条路一定是最短通路.如图示.(8,0,0)(3,5,0)(0,5,3)(3,2,3)(6,2,0)(6,0,2)(1,5,2)(1,4,3)(4,4,0)(5,0,3)(5,3,0)(2,3,3)(2,5,1)(7,0,1)(7,1,0)(4,1,3)r1r3r4r7r6r1r4r7r8r3r8r3r2r5r8r3产生式系统的优缺点优点:1.自然性2.灵活性3.通用性4

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功