第五章信息资源描述的元数据方案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

5信息资源描述的元数据方案5.1元数据概述5.1.1元数据的由来数字化资源的飞速增长,造成两个方面的问题:1、传统的复杂的数据描述与标引难度增加;2、搜索引擎查全率高于查准率低。见搜索案例5.1.2元数据的定义(教材200)是关于数据的数据,也是结构化的数据。用于描述数据的内容(what)、覆盖范围(where,when)、质量、管理方式、数据的所有者(who)、数据的提供方式(how)等信息,是数据与数据用户之间的桥梁;5.1.3元数据的功能1、支持资源发现2、组织数字信息资源3、支持资源的互操作4、支持数字识别5、支持存档和保存5.2元数据的分类5.2.1元数据有种类对于元数据的种类有不同的分类方法。一般分为描述性元数据、管理型元数据、结构性元数据、保存性元数据等等。a)描述性元数据(IntellectualMetadata),用来描述、发现和鉴别数字化信息对象,如MARC、DC,它主要描述信息资源的主题和内容特征。b)结构性元数据(StructuralMetadata),描述数字还信息资源的内部结构,如书目的目录、章节、段落的特征。c)存取控制性元数据(AccessControlMetadata),用来描述数字化信息资源能够被利用的基本条件和期限,以及这些资源的知识产权特征和使用权限。d)评价性元数据(CriticalMetadata),描述和管理数据在信息评价体系中的位置。还可以分为管理性、描述性、保存性、技术性和实用性元数据。5.2.2从复杂程度分(教材202)一级、二级、三级5.3元数据的结构内容结构句法结构语义结构5.4都柏林核心元数据1994年在NACA和OCLC联合会议上由StuartWeibel、EricMiller等提出的,后来由DCMI负责维护的一种元数据标准。其基本方案是包括15个“核心元素”的集合。(参见教材207)如何使用元数据?元数据最基本的功能是通过数据元素集定义资源对象的各类属性,这些属性的大量实例可以表达为关系型数据库中的表,或者以XML等形式进行置标,从而能够利用数据库系统或各类应用软件进行管理。元数据的置标利用置标语言(例如HTML/XML/RDF/XMLs/RDFs/OWL等)将元数据方案形式化,提供机器处理的规范表达,就是元数据置标。(参见教材211DC的应用)5.5MARCMARC是机器可读目录的简称。它是美国国会图书馆提出的著名的机读目录发展计划,于1964-1968年期间研制,1969年正式发行MARC磁带。目前大多数国家都是MARC的用户。我国1979年开始订购MARC,收藏于北京图书馆。为了做到数据共享,必须将文献数据生成标准化的文档。没有文献数据的标准化,就没有文献管理的自动化。ISO2709,即《文献工作——文献目录信息交换用磁带格式》是在MARCⅡ格式的基础上产生的。参考这一国际标准,我国于1982年制定了相应的国家标准,即《文献目录信息交换用磁带格式》(GB2901-82)。文献数据的标准化,就是参照有关的国际标准和国家标准,生成符合标准的文献数据文档。中国机读目录CNMARC(教材228)中国机读目录格式:0---标识块1---编码信息块2---著录信息块3---附注块4---款目连接块5---相关题目块6---主题分析块7---知识责任块8---国际使用块9---国内使用块5.6其他元数据(略)5.6.1WETS5.6.2MODS5.6.3EAD5.6.4GILS5.6.5PICS5.7元数据的互操作有时间的互操作就是采用了不同的元数据方案的系统之间互相传输、共享和利用元数据的能力。主要是指元数据的数据格式、内容和语法的互操作能力。元数据映射利用特定转换程序对不同元数据元格式进行转换,称为元数据映射(MetadataMapping/Crosswalking)。目前已有大量的转换程序存在,供若干流行元数据格式之间的转化,例如􀂄DublinCore与USMARC;DublinCore与EAD􀂄DublinCore与GILS;GILS与MARC􀂄TEIHeader与MARCFGDC与MARC也可利用一种中介格式对同一格式框架下的多种元数据格式进行转换,例如UNIverse项目利用GRS格式进行各种MARC格式和其它记录格式的转换。格式映射转换准确、转换效率较高。不过,这种方法在面对多种元数据格式并存的开放式环境中的应用效率明显受到限制解决元数据互操作性的另一种思路是建立一个标准的资源描述框架,用这个框架来描述所有元数据格式,那么只要一个系统能够解析这个标准描述框架,就能解读相应的Metadata格式。实际上,XML和RDF从不同角度起着类似的作用。XML通过其标准的DTD/Schema定义方式,允许所有能够解读XML语句的系统辨识用XML_DTD/Schema定义的Metadata格式,从而解决对不同格式的释读问题。RDF定义了由Resources、Properties和Statements等三种对象组成的基本模型,其中Resources和Properties关系类似于E-R模型,而Statements则对该关系进行具体描述。RDF通过这个抽象的数据模型为定义和使用元数据建立一个框架,元数据元素可看成其描述的资源的属性。进一步地,RDF定义了标准Schema,规定了声明资源类型、声明相关属性及其语义的机制,以及定义属性与其它资源间关系的方法。另外,RDF还规定了利用XMLNamespace方法调用已有定义规范的机制,本章完练习:利用DC练习提取和标识文献中的元数据。教材252

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功