ICS01.140.40A19备案号:中华人民共和国新闻出版行业标准CY/TXX—XXXX出版内容资源标识的原则与方法Principlesandmethodsforpublishingcontentresourceidentifier(报批稿)2010-12-152010-XX-XX发布2010-XX-XX实施中华人民共和国新闻出版总署发布CYCY/T××—2010I目次前言.........................................................................III引言..........................................................................IV1范围.........................................................................12规范性引用文件...............................................................13术语和定义...................................................................14出版内容资源标识原则与方法...................................................25出版内容资源标识符设计原则与结构.............................................36标识符的应用示例.............................................................4附录A(资料性附录)出版领域标识符介绍..........................................6附录B(资料性附录)出版内容资源中图片、音频、视频标识介绍......................7附录C(资料性附录)《中图法》的主要组成部分说明..................................8参考文献........................................................................8CY/T××—2010III前言本标准按照GB/T1.1—2009的规定编制。本标准由中国新闻出版研究院提出。本标准由全国新闻出版标准化技术委员会归口。本标准起草单位:中国新闻出版研究院、中国大百科全书出版社、中国版本图书馆(新闻出版总署条码中心)、中国标准化研究院、人民教育出版社。本标准主要起草人:龚莉、邢瑞华、王渝丽、周长青、田野、刘玲、李中等。CY/T××—2010IV引言信息技术的广泛应用,加快了出版业数字化进程,使出版物基本建立了相应的数字化文档。但由于缺少元数据标准,导致了同一出版资源对应多个数字化文档及多个标识符的现象发生。这既影响了出版资源的流通,也不利于标识符功能的开发与利用。解决这一问题,成为研制本标准的主要目的。实现对出版内容资源的唯一标识,还面临着以下问题:a)各种媒介出版内容资源的描述。由于缺少出版元数据标准,数字化文档与被描述资源之间的一对一关系尚未在跨系统的环境中确立。b)出版内容资源的经营,在订购、交易和管理等方面已建立了数字化文档,并已基本实现了计算机化和网络化运行。但由于缺少出版内容资源的唯一标识,跨系统的资源发现、定位与获取,还面临着障碍。出版内容资源的唯一标识符是解决在行业范围内出版资源与其数字化文档的一对一关系问题的重要途径,本标准在本系列标准其他标准的支持下,为出版资源及其数字化文档的唯一标识提供规范,以达到支持出版资源的共享和利用之目的。CY/T××—20101出版内容资源标识的原则与方法1范围本标准规定了出版内容资源的标识原则与方法。本标准仅限于定义出版内容资源标识符的结构和组成成分,有关标识的其他内容不属于本标准。本标准适用于从事出版活动的组织、机构和个人,对出版内容资源进行的标识活动。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T5795-2006中国标准书号GB/T9999-2001中国标准连续出版物号ISO15836:2003都柏林核心元数据元素集ANSI/NISOZ39.84-2005数字对象唯一标识符语法ANSI/NISOZ39.56-1996连续出版物及文献内容数字对象唯一标识符3术语和定义CY/T××××确立的以及下列术语和定义适用于本文件。3.1出版内容资源publicationresource经过编辑加工,以文字、图形、图像、声音、视频或其他符号形式表现的内容,可供阅读、欣赏,可以再开发、利用的资源。3.2出版内容资源标识符publishedresourceidentifier由字符串构成,以前缀加后缀方式组成的出版内容资源标识。例如:URI、DOI、ISBN、ISSN等。3.3标识对象objectidentifier数据标准化对象中,能够以标识符标识的想法、抽象概念或事物。3.4标识符前段码prefix由标识系统管理者核发给注册者或注册代理者的代码,用于配置出版内容资源标识符。3.5标识符后段码suffix由注册者或注册代理者提供的字符串,与前缀结合,共同确定被注册出版内容资源的标识符。3.6标识符结构identifierstructureCY/T××—20102符合一定规则的数字和字母的组合。3.7标识体系identifiersystem由相互作用的多个标识组成的标识出版内容资源的整体。4出版内容资源标识原则与方法4.1出版内容资源标识体系出版内容资源标识体系的构成包括4个部分,即由字符串构成的标识符、描述标识对象的元数据、标识符的解析系统和标识体系运行与管理的规则。4.1.1标识符4.1.2描述标识对象的元数据被标识的对象的属性信息,由标识对象的原始注册系统提供,是为了提高标识符使用效率,开发标识符的各种相关应用服务的重要手段。标识符本身是无意义的识别符,而关于实例属性的相关信息,例如名称、分类、知识产权、经营管理等,则是由标识实例的元数据提供的。4.1.3标识符的解析系统标识体系的重要组成部分,是实现标识符的可操作性和互操作性的基础。在出版内容资源的管理与服务环境中,标识符仅是计算机及网络自动化建立数字文档与物理实体间关联的入口字段,若没有解析系统,标识符仅起到标识对象的作用,而失去了标识符最具价值的部分。4.1.4标识体系运行与管理的规则标识体系运行与管理的一系列政策和方针。包括标识符前缀的分配与管理,以及后缀的结构和约定,标识元数据的构成、定义及扩展规范,解析系统的功能开发及利用规则,以及标识体系各个部分之间协调的策略等。本标准不涉及标识元数据、标识系统和标识规则的内容,它们属于其他标准,但与本标准内容相结合,才能构成出版内容资源的标识体系。4.2出版内容资源标识对象出版内容资源包括:已经被唯一标识的可独立应用的出版内容资源、没有被标识的可独立应用的出版内容资源、对可独立应用的出版内容资源进行唯一标识的系统等3个方面。4.2.1已经被唯一标识的可独立应用的出版内容资源的最小应用单元a)由物理介质承载的作品、作品集合及作品片断。b)以网络为基础出版的作品、作品集合及作品的片断。c)出版资源一对一的数字化文档。4.2.2没有被标识的可独立应用的出版内容资源已出版的由物理介质承载的作品及作品集合,例如,年画、台历、一首歌曲等。4.2.3出版内容资源标识a)出版内容资源的加工、流通与相关服务机构。b)出版内容资源作品注册、版权保护与监管机构。c)出版内容资源公益性服务机构。4.3出版内容资源标识方法标识方法要考虑出版内容资源一般属性信息和特殊属性信息,建议采用一个符合正式标识体系的CY/T××—20103字符串及数字组合作为资源的标识符。标识符由前缀和后缀组成:a)前缀包括唯一标识命名授权及行业/系统/地区/机构命名授权等。b)后缀采用现有国际编码体系(ISBN、ISSN、ISRC„„)和相关的管理码段;特殊内容标识可根据我国出版业情况自行设计,例如:作品、作品类型、作品集合、作品片段、课件、课元„„c)根据出版物元数据利益相关人的需求,嵌入设计的码位和码号。例如,出版社、元数据供应商、批发商、书商、国家图书馆等。5出版内容资源标识符结构以前缀加后缀方式组成出版内容资源标识符,包括内容有标识符与其他标准的关系,例如:前缀采用DOI,或OID;后缀采用现有国际编码体系;特殊内容标识可根据我国出版业情况自行设计,例如:作品、作品集合、作品片段、知识元、课件、课元„„5.1出版内容资源标识符的结构本部分标识符结构,由前缀(6位字母数字)和后缀(固定结构不定长字符串)构成,两段之间用分隔符“/”隔开,其形式如图1所示。图1出版内容资源标识符结构5.1.1出版内容资源标识符的前缀前缀包括唯一标识命名授权及行业/系统/地区/机构命名授权,例如:采用URL(统一资源定位符)、DOI(数字对象唯一标识符),或OID(对象标识符)。前缀与后缀之间用字符“/”隔开。前缀与国家标识符方案接轨,其管理与分配遵循国家标准。5.1.2出版内容资源标识符的后缀5.1.2.1后缀的组分结构后缀的结构根据出版资源特点设计,其管理与分配由出版资源标识系统管理者负责。后缀的合法字符,符合ANSI/NISOZ39.84-2005的相关要求,具体码位根据出版物需要而定。出版资源标识符后缀由两个组分构成:第一组分为系统已有唯一标识符,由不定长字符串组成。第二组分为系统代码(管理段),由两段或两段以上字符数字组成,表示作品属性和系统类型(参××××××/ׄ„ׄ„后缀分隔符前缀CY/T××—20104见附录A)等,每段由若干位数组成,由机器顺序给出,不足部分以“0”补齐。其编码长度根据需求可扩展,结构如图2所示。注:A代表ISBN、ISSN、ISRC、ISMN、ISWC等(包括曾用的标准书号);B代表作品的属性;C代表其他代码组分。图2出版资源标识符后缀编码结构5.1.2.2后缀的表示方法a)后缀采用已有的唯一标识符字符串。b)后缀中已有的唯一标识符,应选取相关国际标准或国际通行的标识符方案(参见附录A)。c)后缀中已有的唯一标识符,应选取出版物本身定位的代码,以保证其属性的唯一性。属性包括作品的类型、章节、最小应用单元、版次、参与者等。d)出版内容资源与其数字化文档的对应关系应处于同步状态,以保证解析后资源的可获得性。e)出版内容资源与其数字化文档的对应关系描述规范。6标识符的应用示例出版内容资源的标识应用于出版、发行、图书管理、资源内容开发及版权保护,具体示例如下。6.1出版社应用示例出版物包括:图书、报纸、期刊、音像制品、电子出版物、缩微产品、网络出版物、手机出版物、数字复合产品、MPR出版物等。6.1.1图书。标识采用ISBN国际标准书号,共计13位数,见GB/T5795-2006。例如:XXXXXX(前缀码)/ISBN9787108034403(标准书号)M(专题出版物/普通图书)I210.2(学科分类)。6.1.2期刊。标识采用中国标准连续出版物号,共计13位数,GB/T9999-2001。6.1.3音像制品标识采用音像制品的国际标准编码ISRC,共计12位数,参见附录A。6.1.4音乐作品采用国际标准专用标识,例如:乐谱ISMN,视听读物ISAN,录音ISRC。6.1.5出版资源内容。包括文字、图片、音频、视频等(参见附录B)。××××××/„„„×××···×××···„„CBA分隔符后缀前缀系统已有唯一标识符组分系统代码组分CY/T××—20105a)文字(包括文本文件)标识采用html、可扩展置标语言(XML)、pdf、PPT、L