ICS 01.140.40A19CY中华人民共和国新闻出版行业标准CY/T102.3—2020代替CY/T102.3—2014新闻出版数字内容对象存储、复用与交换规范第3部分:对象一致性检查方法Specificationofpressandpublicationdigitalcontentobjectstorage,reuseandexchange—Part3:Objectconformanceexaminationmethod2020-11-16发布2021-02-01实施国家新闻出版署 发布CY/T102.3—2020I目次前言..................................................................................II 引言.................................................................................III 1范围................................................................................1 2规范性引用文件......................................................................1 3术语和定义..........................................................................1 4一致性检查内容......................................................................2 4.1完整性检查......................................................................2 4.2符合性检查......................................................................2 4.3有效性检查......................................................................2 4.4准确性检查......................................................................2 5一致性检查方法......................................................................2 5.1语义检查方法....................................................................2 5.2信息包验证方法..................................................................3 6特殊约束条件检查....................................................................3 6.1预定义术语取值检查..............................................................3 6.2属性一致性关系检查..............................................................3 7对象信息包验证......................................................................4 7.1信息包结构验证..................................................................4 7.2数据文件校验...................................................................10 7.3对象实例关系校验...............................................................12 附录A(资料性)PUBO模型约束示例......................................................13 A.1PUBO昀大基数约束示例..........................................................13 A.2PUBO昀小基数约束示例..........................................................13 A.3PUBO基数约束示例..............................................................14 A.4PUBO属性并存关系示例..........................................................14 A.5PUBO属性同值关系示例..........................................................14 参考文献..............................................................................16 CY/T102.3—2020II前 言本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。本文件是CY/T102《新闻出版数字内容对象存储、复用与交换规范》的第3部分。CY/T102已经发布了以下部分:——第1部分:对象模型;——第2部分:对象封装、存储和交换;——第3部分:对象一致性检查方法。本文件代替CY/T102.3—2014《数字内容对象存储、复用与交换规范第3部分:对象一致性检查方法》,与CY/T102.3—2014相比,除结构调整和编辑性改动外,主要技术变化如下:a)修改了本文件的适用范围,由适用于图书单一出版物类型扩展为适用多类型出版物;b)修改了信息包结构验证,其内容包括:将CY/T102.3—2014中对ORE资源图文件的位置和文件名的验证修改为对PUBORDF实例文档的位置、文件名以及文件内容的验证;存档信息包结构验证的内容中,将CY/T102.3—2014中关于ORE资源图文件位置的验证,修改为对PUBORDF实例文档位置的验证;c)删除了CY/T102.3—2014中“资源图验证”的内容;d)修改了数据文件校验,其内容包括:在保留CY/T102.3—2014中对数据文件内容校验的基础上,增加了对数据文件一致性、位置和冗余方面的校验;e)增加了对“对象实例关系”的校验;f)修改了附录A中PUBO模型约束示例的内容。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由全国新闻出版信息标准化技术委员会(SAC/TC553)提出并归口。本文件起草单位:北京大学、中宣部机关服务中心(中宣部信息中心)、北京拓标卓越信息技术研究院、中国科技出版传媒股份有限公司。本文件主要起草人:王文清、陈鹏飞、刘成勇、刘勇、张沫、南志弘、陆新民、关涛、张志、姜磊、郭昱锦。本文件及其所代替文件的历次版本发布情况为:——2014年1月首次发布为CY/T102.3—2014;——本次为第一次修订。CY/T102.3—2020III引 言随着互联网技术的发展和数字加工与出版相关技术的逐步成熟,传统的新闻出版机构陆续应用信息技术开展数字出版。在数字加工与出版过程中,图书、期刊等出版内容资源不仅包括可交付印刷或电子出版与服务的各类媒体对象(如整书或篇章的PDF文件,以及期刊某期及某论文的PDF文件等)、排版或加工过程中产生的媒体对象(如排版设计源文件等),还包括封面、目次、元数据、各类内容主体、各类辅文(如参考文献、摘要、术语表等)数字内容实体构件。对于这些出版内容资源,需要建立一个新闻出版领域统一的数字内容对象模型,以系统地表示和记录资源的内容结构、特征、表现形式、载体方式以及资源之间的关联关系,并能按不同粒度进行相关数据的封装、存储、复用与交换。近年来,在出版内容资源的知识表示与建模领域,受应用需求的驱动,国内外相关行业及企业标准应运而生。2017年11月,《数字内容对象存储、复用与交换规范》系列国家标准的起草工作正式启动;2020年3月,该系列国家标准正式发布,为出版内容资源本体的建立奠定了模型基础。以GB/T38371.1—2020《数字内容对象存储、复用与交换规范第1部分:对象模型》等3项推荐性国家标准为基础,结合新闻出版行业出版内容资源的加工及应用要求,本标准的制订需求提上日程。在本标准的起草过程中,起草组对多项现行国家标准、行业标准及工程标准进行了调研,同时参考了大量国内外数据标准和模型,从对象模型、对象封装、存储和交换以及对象一致性检查等多个方面给出一套统一的行业标准,以实现新闻出版领域对出版内容资源的规范化表示,消除数据复用和交换障碍,降低资源管理和利用成本,推动出版内容资源的融合和深入利用。CY/T102.3—20201新闻出版数字内容对象存储、复用与交换规范第3部分:对象一致性检查方法1范围本文件规定了出版内容资源对象的一致性检查内容、一致性检查方法、特殊约束条件检查和对象信息包验证等。本文件适用于新闻出版行业有关数字内容资源的内容检查。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其昀新版本(包括所有的修改单)适用于本文件。GB/T38371.3—2020数字内容对象存储、复用与交换规范第3部分:对象一致性检查方法CY/T102.1—2020新闻出版数字内容对象存储、复用与交换规范第1部分:对象模型CY/T102.2—2020新闻出版数字内容对象存储、复用与交换规范第2部分:对象封装、存储与交换3术语和定义GB/T20000.1界定的以及下列术语和定义适用于本文件。3.1一致性conformance满足规定的要求。[来源:GB/T19333.5—2003,3.8]3.2一致性检查conformanceexamination满足规定要求的相关检查。[来源:GB/T38371.3—2020,3.2]3.3对象一致性检查objectconformanceexamination对数字内容对象的语义关系以及用于交换的对象信息包结构等方面进行的满足规定要求的相关检查。[来源:GB/T38371.3—2020,3.3]CY/T102.3—202023.4基数约束cardinalityconstraint对实例属性的出现次数进行限定的约束方式。[来源:GB/T38371.3—2020,3.4]3.5取值约束valueconstraint对实例属性的取值进行限定的约束方式。[来源:GB/T38371.3—2020,3.5]4一致性检查内容4.1完整性检查出版物数字内容对象及其相关资源数据的完整性检查包括:a)对象模型逻辑结构完整性检查:对象模型是否完整表述出版物数字内容对象的语义关系,对象实例是否完整,以及对象实例是否完整包括必备属性等;b)信息包完整性检查:对对象实例信息包中的必备文件(及文件目录)的存在性进行检查。4.2符合性检查出版物数字内容对象及其相关资源数据的符合性检查包括:a)对象语义符合性检查:对象模型是否符合约束条件、推理规则的检查等;b)信息包符合性检查:PUBORDF实例文件中的