信息组织第三章信息组织的技术标准第一节第二节第三节一、信息组织技术标准及意义1、信息组织技术标准的含义:2、信息组织技术标准的意义:3、数字信息资源组织的现状:4、首要任务:第一节信息组织技术标准概述1)标准:为在一定的范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则或特性的文件。该文件经过协商共同制定,并必须通过一个公认的机构批准2)标准化:在一定的范围内获得最佳秩序,对实际的或潜在的问题制定共同的和重复使用的规则活动的过程。包括制定、发布、实施标准的过程。3)标准化的实质和目的:实质是通过制定、发布和实施标准,达到统一;目的是获得最佳秩序和社会效益。4)技术标准:对标准化领域中需要协调统一的技术事项所制定的标准。5)信息组织技术标准的定义:协调统一信息组织中涉及技术的标准。传统的标准侧重情报文献的编辑、出版、收集、著录、标引、数据加工、检索、交换、和传播流通等领域的标准的制定、实施。从计算机信息技术和传统文献信息管理的角度,都有许多国际和国家范围内的技术标准。网络环境下,须将两者联合、创新、发展,使其协调。)无论何时其信息组织的技术标准都是围绕信息或数据进行的,目的在于为描述和标引其内容特征和形式特征提供规范和统一。1)是信息组织工作的基础。信息组织在信息管理活动中,起着承上启下的作用。其中标准的统一直接影响到资源库的质量和效果。2)执行有关标准才能保证信息组织的结果规范性和有效性。是信息资源共建共享的前提和根本保障•了解国际标准化组织情报文献工作标准化技术委员会(ISO/TC46)数字化信息资源的信息组织工作也要按照标准进行,并且是国际标准。当前数字信息资源组织的现状:元数据是网络信息的重要组成部分,但存在以下问题:1)没有统一的管理机构。2)各行业自定标准,导致标准太多。3)存在互不相容的标准。面对数字信息资源的组织,要对元数据规范化、标准化,在众多标准中认定或制定一个国际通用的信息描述标准为好。如:DC数字档案馆建设过程中标准化的意义?二、信息组织技术标准类型1、按标准研究对象范围分:1)基础标准:术语、符号等。2)产品标准:如镜像站点数据库标准。3)方法标准:建库时信息描述的标准。4)安全与环境保护类标准:与信息组织有关的标准是信息安全标准。2、传统文献信息工作的两个标准体系:1)ISO情报文献工作标准化委员会的技术委员会的体系。六类标准相互平行的体系2)我国情报文献工作技术标准体系。三个层次构成一个体系3、国内外信息技术标准:计算机技术标准、电信技术标准、通讯技术标准等。计算机技术标准中有关于数据库的标准,如:中科院的“科学数据库核心元数据标准2.0版”、“科学数据库生态研究元数据标准1.1版”、“科学数据库大气数据元数据标准1.0版”、“科学数据库建库文档规范1.0版”与信息组织有关,但仅在全国范围内的中科院各研究所为管理信息或数据建库时使用。4、以信息环境划分:1)传统信息资源组织的标准:没有过时,没有被取代,已成为国际通用的成熟标准。如ISBD、AACR2、MARC等2)网络信息组织标准:也称为信息编码标准,如一些信息描述的元数据。ISBD,MARC3)信息编码:为编码对象(指事物或概念)赋予有一定规律性的、易于计算机和人识别与处理的一个或一组有序的符号。如:MARC、DC、置标语言等。4)信息编码的目的:设定编码对象的惟一标识以提高信息处理的效率,便于信息的交流,实现信息资源的共享,促进信息的利用。回目录第二节传统信息组织的技术标准(包括著录标准和机读目录)一、著录标准1、国际标准书目著录(ISBD)标准:1)主要目的:使不同来源的数据交换成为可能;跨越语言障碍,帮助人们解释书目记录;使书目数据转化为电子格式更容易。2)组成:(54页的表)体系结构的特点:采取总则和分则相结合的方式;遵循客观描述的著录规则;明确规定了获取著录信息的来源;规定各个著录项目、著录单元项目的内容、次序以及著录用的标识符2)方法:(56页的表、57页的解释)3)应用:(60页的举例)2、中国书目著录标准(卡片式)WORD文档)•索书号著录标目.正题名[一般类型标识]=并列题名:其他题名信息/第一责任说明;其他责任说明.-版本说明/与版本有关的责任说明.-文献特殊细节项.-出版地:出版者,出版年(印制地:印制者,印制年)登录号文献数量及其单位:图及其他形态细节;尺寸+附件.-(丛编正题名=丛编并列题名:丛编其他题名信息/丛书责任说明,丛编的国际标准书号;丛编号.附属丛编名)附注项国际标准书号(附加说明):获得方式Ⅰ.书名Ⅱ.责任者Ⅲ.主题词Ⅳ.分类号•化工设备机械基础.第一册,制图/《化工设备机械基础》编写组编.-2版,修订版.-北京:石油化学工业出版社,1978(西安:科学技术出版社,1988重印)•182页;26cm+光盘.-北京:北京青苹果电子出版物公司,1988•ISBN7-114-11316-X:RMB48.00•Ⅰ.化...Ⅱ.《化...Ⅲ.Ⅳ.•I207.41苏小妹三难新郎/四川人民出版社编.―[成都]:编•S763者,1982•153页;19cm.-(农村文化艺术小文库;第六辑•古代白话小说丛书/人民文学出版社编,ISSN8891-•2001;4)•140511~ISSN8891-2005:RMB16.00•140512Ⅰ.苏...Ⅱ.四...Ⅲ.白话小说-古代-中国-丛书•Ⅳ.I207.4•补充中国文献编目规则(第二版)•《档案著录规则》二、机读目录:是以代码形式和特定格式结构记录在计算机存储载体上,能够被计算机识别并编辑输出书目信息的目录形式。1、起源:1)历经6年。2)世界普及。2、MARC格式及其特点:1)字段设置:①字段:是由字段标识符标识的被定义的字符串,可包含一个或多个子字段。子字段:字段内被定义的数据单位。②设置内容:书目记录所需描述的、信息所有的内、外部特征。③主要特点:字段数量多、字段内容详尽、字段作用强大。2)标记符号:①字段标识:用于识别各个字段的三位数字。从001~999,第1位表示功能、第2位表示种类、第3位表示种类细分。②子字段代码:由两个字符组成的代码,用以识别可变长字段中不同得子字段。第1位是$、第2位是字母或数字,如$a、$f、$1、$4。③子段指示符:用以描述或指示可变长字段一些定义的的代码。④子段和记录分隔符:一个字段或一个记录结束时的符号。3)MARC总体结构的特点:①记录格式既设置可变长子段又设置固定长字段。②采用目次方式节省计算机进行数据值比较时间、提高处理速度。③每条记录分4个区。④物理记录和逻辑记录有交叉关系,经常出现一字块存放多个记录,或一记录被分存于两个或两个以上字块中的现象。物理记录是字块(每个字块长度是4096个字节)、逻辑记录是实际描述后形成的信息记录。可变格式可变长字段的记录格式;•采用目次方式;每条MARC记录分3个区:它们是头标区、目次区和数据区;(数据区又由控制区和可变区构成)物理记录和逻辑记录的关系。MARC总体结构特点3、几种主要的MARC格式:1)UNIMARC格式:①定义。②作用。③格式。(71页)2)CNMARC格式:①解释:中国机读目录格式。②用途:用于中国国内图书情报部门和其他国家书目机构间的书目信息交换。③与UNIMARC的关系:依据UNI.制定,又结合中国书目实际。④设置:功能块、字段。(74~75页)⑤举例:(76页)其数据结构记录头标区地址目次区数据字段区记录分隔符0标识块1编码信息块2著录块3附录块4连接款目块5相关题名块6主题分析块7责任者块8国际使用块9国内使用块CNMARC记录结构不太清楚,参见WORD文档•记录头标区地址目次区数据字段区记录分隔符0标识块1代码信息块2著录块3附注块4款目连接块5相关题名块6主题分析块7知识责任块8国际使用块9国内使用块•205206~8215225230•题版资载丛计•名本料体编算•与说特形说机•责明殊态明文•任字细说字件•说段节明段特•明说字征•字明段字•段字段•段•$a$c$d$e•文献数量及其尺附•单位子字段他寸件•子子子•段段段实例•00100315189900520090326105819.0010a7-80702-358-9dCNY358.00(全16册)100a20060104d2006emy0chiy50ea1010achi102aCNb220000105ayz000yy106ar2001a奥林匹克全书b专著e奥林匹克运动竞赛项目f丁华民主编9chushijuexue210a长春c吉林文史出版社d20062252a中华典藏书系46101001003187127690aB821-49v47010a丁华民c(文学)4主编9linan905aTSGb0064143dGeD534.1•头标区001003151899处理时间性00520090326105819.0ISBN010a7-80702-358-9dCNY358.00(全16册)处理数据100a20060104d2006emy0chiy50ea作品语种1010achi出版国别102aCNb220000编码数据105ayz000yy形态特征106ar题名责任2001a奥林匹克全书b专著e奥林匹克运动竞赛项目f丁华民主编9chushijuexue出版发行210a长春c吉林文史出版社d2006丛编项2252a中华典藏书系总集46101001003187127中图分类690aB821-49v4人名等同7010a丁华民c(文学)4主编9linan馆藏信息905aTSGb0064143dGeD534.1CNMARC著录举例:(001)记录号:019922891记录状态:n记录类型:a书目级别:m层次等级代码:0010(ISBN):$a7-5037-1101-9$b$dRMB29.80(091)统一书号:(100)入档日期:19940927出版日期类型:d日期1:1978日期2:1988读者对象:em#政府出版物:y修改记录:0编目语种:chi正题名文种:ea101著录语种:1#$achi(若译文$c)(106)文字资料的形态特征:r(110)内容特征:z会议文献:02001#$a化工设备机械基础$h第一册$i制图$f《化工设备机械基础》编写组编205##$a2版$b修订版210##$a北京$b石油化学工业出版社$d1978$e西安$g科学技术出版社$h1988215##$a182页$d26cm$e光盘(300##$a附有光盘)6060#$a化工设备$x设备机械6060#$a制图$x化工设备$x设备机械690##$aTQ05$v4版71102$a《化工设备机械基础》编写组$4编801#0$aCN$bhbu$e19940927$m$n905##$aCN$b理科库$dTQ05$eH123$h183622891三、置标语言:形象的讲,是一种用来给文本添加标记的计算机语言。置标:就数据本身的信息对数据进行编码的方法。对于信息组织来说,置标语言是记载信息特征的工具。(一)标准通用置标语(SGML):1)定义:是一种通用的文档结构,主要用来定义文献模型的逻辑结构和物理结构。。2)适用范围广泛,如书目、文献全文、电子文献、及多媒体信息。它使得信息的描述独立于系统、独立于语种、结构和内容分开,实现共建。但其本质不是用来描述信息的语言,而是一个标准,在此基础上再产生相关的标准。如xml3)作用:①定义文档模型的逻辑和物理结构。②是适合各种信息进行描述的一种新的标准。③使信息的描述独立于系统、语种,结构与内容分开以利信息共享。④作为国际标准,为创建结构化、可交换的数据库提供了工具。⑤可将来源不同的原始资料组装在同一个文件中。⑥可利用文件格