第三章信息组织的技术标准学习要求•主要内容:本章主要介绍信息组织的技术标准基本知识,传统信息组织技术标准和网络信息组织技术标准。•掌握:MARC格式及其特点;元数据含义、元数据类型、元数据作用、元数据格式和创建;DC的元素和限定词;DC的设计原则和句法;•了解:ISBD和AACR2;MARC格式起源;SGML、HTML、XML、DTD;元数据应用;DC的扩展;TEI、VRACore3.0、FGDC数字地理空间元数据标准。第三章信息组织技术标准传统信息组织技术标准信息组织的技术标准概述章节简介网络信息组织技术标准3.1信息组织的技术标准概述信息组织技术标准及意义1信息组织技术标准类型2•信息组织技术标准信息组织的技术标准都是围绕着各类型和各种载体的数据或信息的内容和形式特征描述与标引的的技术和方法的规范和统一为目的的。只不过数字信息环境和社会信息化中,更多地依赖计算机和通信技术,所以,必须与其相关标准相协调,使其能够反映出数字信息对描述、链接、交换、查询、互操作等方面的技术统一和协调的要求。3.1.1信息组织技术标准及意义•信息组织技术标准的意义3.1.1信息组织技术标准及意义信息组织的标准是信息组织工作的基础在建设信息资源库时,统一标准非常重要,它直接影响到资源库的制作质量和查询效果,特别是对信息资源的定义和描述过程中,执行有关标准才能保证信息组织的规范性和有效性。信息资源的标准化和规范化是实现图书馆资源共建共享的前提和根本保障。WEB上的元数据的各种标准太多,标准间互不相容,且仍在制定,都柏林核心有望成为国际标准。数字图书馆各自采用自己的标准和方法,情况不容乐观,但开始了标准化的研究3.1.2信息组织技术标准类型信息组织技术标准网络信息组织技术标准传统信息组织技术标准传统信息组织技术标准是针对传统的信息资源的加工组织,如纸质文献信息,很多标准经过多年实践完善,已经成为各国都遵循的成熟的国际标准。如ISBD、AACR2、MARC等。网络信息组织技术标准是针对日益扩展的网络信息而制定的信息组织标准。如置标语言、元数据等。3.2传统信息组织技术标准著录标准1机读目录23.2.1著录标准1、国际标准书目著录(ISBD)(1)背景概况《国际标准书目著录》是为了实现文献著录的统一和规范而制定的一套供各类型文献著录用的国际标准。目的:A、使不同来源的数据交换成为可能B、可以跨越语言障碍,帮助人们解释书目记录C、使书目数据转换为电子格式更为容易ISDB的发展和维护工作是由国际图图联书目控制部的编目组负责承担的3.2.1著录标准英文简称英文全称中文译名说明ISBD(G)GeneralInternationalStandardBibliographicDescription《国际标准书目著录(总则)》1977年第1标准版,1987年第2版。2004修订版。ISBD(M)InternationalStandardBibliographicDescriptionforMonographicPublications《国际标准书目著录(专著出版物)》1971年推荐本,1974年第1标准版,1987年第2版,2002年修订版。ISBD(S)InternationalStandardBibliographicDescriptionforSerials《国际标准书目著录(连续出版物)》1974初版。1977年第1标准版,1987年第2版。2002被ISBD(CR)取代。ISBD(CM)InternationalStandardBibliographicDescriptionforCartographicMaterials《国际标准书目著录(地图资料)》1977年第1标准版,1987年第2版。2004修订征求意见稿。ISBD(NBM)InternationalStandardBibliographicDescriptionforNon-BookMaterial《国际标准书目著录(非书资料)》1977年公布,1987年第2版。由于正在考虑一体的ISBD,修订工作推迟表:ISBD体系结构一览表3.2.1著录标准英文简称英文全称中文译名说明ISBD(A)InternationalStandardBibliographicDescriptionforAntiquarianMaterials《国际标准书目著录(古籍)》用来著录1801年以前出版的专著,1980初版。1991修订2版。ISBD(PM)InternationalStandardBibliographicDescriptionforPrintedMusic《国际标准书目著录(乐谱)》1980初版。1991修订2版。由于正在考虑一体的ISBD,修订工作推迟ISBD(CF)InternationalStandardBibliographicDescriptionforComputerFiles《国际标准书目著录(计算机文件)》1990从ISBD(NBM)分出初版。1997由ISBD(ER)取代。ISBD(ER)InternationalStandardBibliographicDescriptionforElectronicResources《国际标准书目著录(电子资源)》1997根据ISBD(CF)修订初版。2004修订征求意见稿。ISBD(CP)InternationalStandardBibliographicDescriptionforComponentParts《国际标准书目著录(析出文献)》1988初版。2003年在IFLANET发布。表:ISBD体系结构一览表3.2.1著录标准(2)体系结构A、在文献著录规则的编制体例上,ISBD采用了总则与分则相结合的方式,形成了一整套完整的文献著录规则;B、ISBD遵循“客观描述”的著录原则,即依据受编文献本身的情况如实著录;C、ISBD明确规定了获取著录信息的来源,保证了对同一种文献著录的信息采集具有一致性;D、ISBD还规定了各个著录项目、著录单元项目的内容、次序及其著录用标识符。3.2.1著录标准3.2.1著录标准(1)背景概况AACR2是在现代编目理论指导下,紧密配合ISBD而产生的一部最为著名的编目条例。它的制定为英语世界的文献编目工作提供了标准化工具,对世界编目事业的标准化起到了重要的推动作用,也为各国编目规则的制定树立了典范2、AACR2(《英美编目条例》(第2版))3.2.1著录标准贯彻标准化原则坚持著者原则实行统一标目原则(2)AACR2(《英美编目条例》(第2版))编制原则(3)AACR2结构和内容AACR2是一部综合性的著录条例,它不仅适用于普通图书,也适用于连续性出版物及各类型文献。AACR2全书共分19章,由三部分组成。第一部分为“著录”,共13章,依据ISBD的各分则,规定了各类型文献的著录项目、著录项目的顺序、标识符号的使用以及著录方法等。第二部分为“标目、统一题名与参照”,共6章。这一部分对检索点的选取、个人著者与机关团体标目、地理名称、统一题名和参照的著录分别做出了明确规定。第三部分是在书末所附的4种附录。3.2.1著录标准3.2.1著录标准ISDB和AACR2与我国文献著录AACR2对我国图书馆的西文文献著录工作起到了统一、规范的作用。2005年,参照《国际标准著录规则》(ISBD)和《英美编目条目规则》(AACR2)的最新版,《中国文献编目规则》(第二版)完成修订并出版。这次的修订主要面向信息化、面向世界、面向社会需求,实现与国际书目情报顺利交流,使中文书目数据为全世界所共享。•机读目录(MARC)机读目录通常称(Machine-ReadableCatalogue,MARC)译为“机器可读的目录”为机读目录,它是以代码形式和特定格式结构记录在计算机存贮载体上,能够被计算机识别并编辑输出书目信息的目录形式。3.2.2机读目录可变格式可变长字段的记录格式;•采用目次方式;每条MARC记录分3个区:它们是头标区、目次区和数据区;物理记录和逻辑记录的关系。MARC总体结构特点3.2.2机读目录(1)UNIMARC(2)USMARC1977年,IFLA为了统一各国机读目录格式,主持制定了《国际机读目录格式》(UniversalMARCFor-mat,简称UNIMARC)。许多国家都使用UNIMARC格式作为国际机读书目记录交换的格式。USMARC是美国国会图书馆的机读目录通信格式,它的前身是MARCII格式。USMARC格式与国际标准化组织制定的“文献目录信息交换用磁带格式”ISO2709的规定一致,只不过在其字段标识和内容项目上略有不同。3.2.2机读目录(3)CNMARC中国机读目录格式《WH/T0503一96》,通常称为CNMARC。它是由国家书目机构编制的,由中华人民共和国文化部于1996年发布的文化行业标准。主要用于中国国内图书情报部门和其他国家书目机构间的书目信息交换。CNMARC格式是以UNIMARC为依据的,凡是UNIMARC中定义的字段适合于中国出版物的有关规定都予以保留,并补充了中国出版物特有而UNIMARC中没有的字段定义。3.2.2机读目录记录头标区地址目次区数据字段区记录分隔符0标识块1编码信息块2著录块3附录块4连接款目块5相关题名块6主题分析块7责任者块8国际使用块9国内使用块CNMARC记录结构3.2.2机读目录3.3网络信息组织技术标准置标语言1元数据2都柏林核心元素集3其它元数据简介4(1)标准通用置标语言(SGML)标准通用置标语言(StandardGeneralizedMarkupLanguage,SGML)是,是ISO组织于1986年发布的ISO8879国际标准。实际上是一种通用的文档结构描述置标语言,主要用来定义文献模型的逻辑和物理类结构。它是适合书目、文献全文、电子文献及多媒体信息进行描述的一种新的标准,它使得信息的描述独立于系统,独立于语种,结构与内容分开,充分地实现了信息的共享。3.3.1置标语言置标语言(markuplanguage),是一种用文本添加标记的语言。置标:就数据本身的信息对数据进行编码的方法。•超文本置标语言(HTML)HTML是由SGML派生的实例置标语言,不能作为定义其它置标语言的元语言。HTML是一种用来制作超文本文档的简单标记语言。用HTML编写的超文本文档称为HTML文档,它能独立于各种操作系统平台(如UNIX,WINDOWS等)。生成一个HTML文档主要有以下3种途径:手工直接编写(例如用你所喜爱的ASCII文本编辑器或其它HTML的编辑工具);通过某些格式转换工具将现有的其它格式文档(如WORD文档)转换成HTML文档;由Web服务器(或称HTTP服务器)一方实时动态地生成。3.3.1置标语言•可扩展的置标语言(XML)可扩展的置标语言(ExtensibleMarkupLanguage,XML),是W3C组织于1998年2月发布的标准。W3C组织制定XML标准的初衷是,定义一种互联网上交换数据的标准。W3C采取了简化SGML的策略,在SGML基础上,去掉语法定义部分,适当简化DTD部分,并增加了部分互联网的特殊成分。所以XML也可以作为派生其它置标语言的元语言。3.3.1置标语言•文件类型定义(DTD)DTD规定了一个语法分析器解释一个“有效的”XML文件所需知道的所有规则的细节。这个规则可以非常简单,仅仅列出所有有效的元素,例如元素、标记、属性、实体;也可以非常复杂,不但列出这些元素,还指出这些元素之间的内在联系。我们可以把DTD看作一个或多个XML文件的模板,这些XML文件中的元素、元素的属性、元素的排列方式/顺序、元素能够包含的内容等,都必须符合DTD中的定义。XML文件中的元素,即我们所创建的标记,是根据我们应用的实际情况来创建的。3.3.1置标语言3.3.2元数据•元数据含义•元数据法“元数据(Metadata)”就是“关于数据的数据”,是对数据进行组织和处理的基础。元数据法就是对信息单元及其集合进行规范描述从而形