7_知识管理_RDF

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1知识管理KnowledgeManagement李海生Li_haisheng@163.com2课程邮箱btbukm@126.comPWD:123456783与知识管理相关的Topic信息检索InformationRetrieval知识工程KnowledgeEngineering语义网SemanticWeb本体Ontology资源描述框架ResourceDescriptionFramework本体描述语言OntologyWebLanguage知识网格KnowledgeGrid面向服务的架构Service-OrientedArchitecture知识管理成熟度模型KnowledgeManagementMaturityModel(K3M)知识管理案例……知识管理标准知识管理标准国家标准GB/T23703.1欧洲标准澳大利亚国家标准加拿大国家标准英国国家标准美国APQC标准(美国生产力与质量中心AmericanProductivityandQualityCenter)4知识管理国家标准框架术语组织文化知识活动实施指南评价5知识管理业务流程知识管理成熟度模型K3M知识管理评估模型67上次课程内容回顾元数据召回率(Recall)检索出的相关文档数和文档库中所有的相关文档数的比率衡量的是搜索引擎的查全率精度(Precision)检索出的相关文档数与检索出的文档总数的比率衡量的是搜索引擎的查准率8语义Web•语义Web的基础架构[TimBerners-Lee,2000]语义网书籍推荐9语义网书籍推荐1011元数据表示语言标记语言标准通用标记语言SGML超文本标记语言HTML可扩展标记语言XML虚拟现实模型语言VRML无线标记语言WML元数据标准DublinCoreHL7(描述医学网络资源的元数据)教育资源元数据机读目录(MARC)12XML性质W3C于1998年2月发布的一种标准是SGML的一个简化子集可扩展标记语言特点较好地解决了HTML无法表达数据内容等问题允许各个组织、个人建立适合自己需要的标记集合13XML与HTML比较文档的3个要素数据、结构以及显示方式HTML显示方式内嵌在数据中在创建文本时,要时时考虑输出格式创建文档的重复工作量大不易抽取语义信息XML显示格式从数据内容中独立出来,保存在样式单文件(StyleSheet)中自我描述性质能够很好地表现许多复杂的数据关系14XML结构文件头与HTML类似,是可选的文件主体包括一个或多个元素形式是一棵分级的树混杂的“结尾部分”由注释、处理指令和空白组成注释用!----!表示,可在文档中任意位置15元素(Element)表示方法由开始标记、结束标识以及标识之间的数据构成标记之间的数据被认为是元素的值每个元素都有不同的标记名director王力/director元素名是director元素值是“王力”actor王力/actor元素名是actor元素值是“王力”16元素要点关键的3点所有元素必须有结束标记所有元素必须正确嵌套,不允许交迭所有属性值必须加引号注意点XML文档主体有且仅有一个XML根元素可以嵌套XML元素,形成一棵树形结构17XML文档例子书类书国际标准书号=0345374827标题数据结构/标题作者许卓群等/作者/书书国际标准书号=0345374828标题数据挖掘/标题作者韩家炜等/作者/书/书类18例子的树状结构书类书书标题作者标题作者19XML属性给元素提供进一步的说明信息必须出现在起始标记中以名称/取值对出现,属性名不能重复名称与取值之间用等号“=”分隔用引号把取值引起来例如工资货币=人民币元100000/工资说明了工资的货币单位是人民币元20XML处理器目的解析XML文档提供对XML文档内容和结构的访问文档对象模型(DocumentObjectModel,DOM)将完整的XML转换成一棵树的形式放在内存中供随机访问元素、属性XML简单API(SimpleAPIforXML,SAX)采用事件驱动模型通过标记的起止来触发事件DOM与SAX的比较(讨论)21处理指令(ProcessingInstruction)目的给XML处理器提供信息,使其能够正确解释文档内容表示起始标记是“?”,结束标记是“?”方法XML分析器把这些信息原封不动地传给应用程序由应用程序来解释这个指令遵照它所提供的信息进行处理22两种处理指令XML声明?Xmlversion=1.0encoding=gb2312standalone=no?必须包括version属性,指明所采用的XML的版本号,而且它必须在属性列表中排在第一位standalone属性表明该XML文档是否和一个外部文档类型定义DTD配套使用encoding属性则指明了数据所采用的编码标准XSL样式单引用?xml-stylesheettype=“text-xsl”href=“contacts.xsl”?告诉XSL样式单解析器,样式单的类型是text-xsl类型text-xsl可以在文档contacts.xsl中找到23XML的名字空间背景由于XML对互操作性的支持,每个人都可以创建属于自己的XML词汇不同的开发者会用相同的元素来代表不同的实体作用为XML文档元素提供了一个上下文允许开发者按一定的语义来处理元素为什么引入NS(命名空间)讨论24XMLNS例子<?xmlversion=1.0?><hamburgersxmlns:purchase=http://fastfood.org/franchise/pricesxmlns:sales=http://fastfood.org/customer/prices><hamburgerlowfat=dreamon><name>CowBurger</name><description>Greasyandgood.</description><purchase:price>0.99</price><sales:price>2.99</price></hamburger></hamburgers>25XSL(ExtensibleStylesheetLanguage)背景用标准的DOMAPI来实现XML数据的交互,是十分单调乏味的如想找到所有满足某些条件的元素,或转换为简单的HTML表格,必须手工书写代码遍历整棵树来寻找目的为标准化及简化人们完成这些任务所需做的工作26食品的例子XML文档?xmlVersion=1.0?食品食品脂肪含量=低名称月饼/名称描述中秋节食用的传统食品/描述价格2.99/价格/食品食品HTML文档htmlbodyh1食品/hlo1li月饼,中秋节的传统食品,2元/li/o1/body/html27XSL文件?xmlVersion=1.0?xsl:stylesheetxmlns:xsl=http://www.w3.org/TR/WD-xslxsl:templatematch=/选取了当前结点的所有食品子结点htmlbodyhlhamburgers/hlxsl:for—eachselect=hamburgers[@lowfat=dreamon]标识出符合给定条件的结点lixsl:value-ofselect=name/,xsl:value-ofselect=description/,xsl:value-ofselect=price/取结点中各个元素的值/li/xsl:for—eachbodyhtml/xsl:template/xsl:stylesheet28XSL用途增强了互操作性XML数据转换为HTML从一种XML格式到另一种XML格式之间的转换开发人员不用为了描述某种类型的数据而采用通用的词汇某个人向你的系统发送了一篇XML文档,而你的系统不认识它所采用的XML词汇只要进行一次简单的XSL转换就可以得到自己熟悉的词汇29文档类型定义DTD目的定义XML文档结构,即其中的元素、属性以及元素之间关系的定义了文件中的元素能用什么名字,能放在什么位置,应该怎样组合可以检测XML文档的结构是否正确例如描述一组表,其中每个表又可以包含若干个项DTD中应该有语句:!ELEMENT表(项)+!ELEMENT项(#PCDATA)生成的表:表项管乐/项项弦乐/项项器乐/项表30DTD引用内部引用包含在XML文档的前导说明部分如?xmlversion=1.0encoding=GB2312standalone=yes?!DOCTYPE根元素名[元素描述]文档体…外部引用作为一个外部文档被引用如?xmlversion=1.0encoding=GB2312standalone=no?!DOCTYPE根元素名SYSTEM外部DTD文件的URL文档体…SYSTEM指一个作者或组织所编写的通用的DTD或是!DOCTYPE根元素PUBLICDTD名称外部DTD的URLPUBLIC指由权威机构制订的、提供给特定行业或公众使用的DTD31DTD中ETD(元素类型声明)作用声明所有有效的文档元素结构!ELEMENT元素名元素内容描述类型空元素类型!ELEMENT元素名EMPTY使用空元素标记,元素中没有内容ANY元素类型元素中可以包含任何内容父元素类型元素中可以包含子元素在DTD中通过正则表达式规定子元素出现的顺序和次数混合元素类型!ELEMENT元素名(#PCDATA|子元素名1|子元素名2|…)元素中可以包含文本文本之间可以有选择地插入子元素,子元素出现的顺序和次数不受限制32XMLSchemaDTD缺点采用了非XML的语法规则不支持数据类型扩展性较差XML模式己经渐有取代DTD的趋势拥有比DTD更强大的功能用于更精确和有效地描述XML文档结构33XML模式的优点一致性直接借助XML自身的特性利用XML的基本语法规则定义XML文档的结构不必再利用一种特定的形式化的语言扩展性引入了数据类型、命名空间在基本数据类型基础上用户可自己扩展数据类型互换性利用模式能够书写XML文档并验证文档的合法性对不同的模式进行转换,以实现更高层次的数据交换规范性利用元素的内容和属性来定义XML文档的整体结构基于XML,更具有规范性34数据类型用途为ElementType和AttributeType指定数据类型基本数据类型(10种)entity,entities,enumeration,id,idref,idrefs,nmtoken,nmtokens,notation和string扩展数据类型bin.baSe64,bin.heX,boolean,char,date,dateTime,dateTime.tz,fixed.14.4,float,int,number,timetime.tz,i1,i2,i4,r4,r8,ui1,ui2,ui4,uri,uuid35XMLS元素类型基本格式ElementTypecontent={|empty|textOnly|eltOnly|mixed}dt:type=datatypemodel={open|closed}name=idreforder={one|seq|many}“/ElementType取值及含义(略)36XMLS属性类型基本格式Attri

1 / 85
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功