版式电子文件长期保存格式需求目次前言II引言III1范围12规范性引用文件13术语和定义14版式电子文件长期保存格式应满足的需求24.1格式开放24.2不绑定软硬件24.3文件自包含24.4格式自描述24.5显示一致性24.6持续可解释24.7稳健24.8可转换34.9利于存储34.10支持技术认证机制34.11易于利用35测试与评估3前言本标准由安徽省档案局(馆)提出。本标准由国家档案局归口。本标准起草单位:安徽省档案局(馆)、北京北大方正技术研究院有限公司。本标准主要起草人:李学香、黄玉明、王学武、周建武、胡华平、邓晓文、段丽琼、吴彬松、华婷、陈姗姗、朱霖露。引言版式电子文件是一种用页面化的形式固定呈现文本、图形、图像等信息的文件。出于交换、发布、存档目的,越来越多的电子文件被制作或转换为版式文件。本标准基于长期保存和利用的需求确定版式电子文件应具有的格式特征,为制订版式电子文件格式标准,开发相应的制作、阅读、打印等软件提供依据。保证电子文件的长期可读、可解析、可理解。版式电子文件长期保存格式需求1范围本标准明确了版式电子文件长期保存格式的特征。本标准适用于各级各类档案馆、机关、团体、企业事业单位和其他社会组织遴选归档保存版式电子文件格式,也适用于版式电子文件格式标准的制订与相关软件开发。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T16964.1-1997信息技术字型信息交换第1部分:体系结构GB/T18894-2002电子文件归档与管理规范ISO14721:2003空间数据和信息传输系统开放档案信息系统参考模型(Spacedataandinformationtransfersystems-Openarchivalinformationsystem-Referencemodel)ISO15489-1:2001信息与文献文件管理第1部分通则(Informationanddocumentation-Recordsmanagement-Part1:General)3术语和定义GB/T18894-2002和ISO15489-1:2001界定的以及下列术语和定义适用于本文件。3.1版式电子文件fixed-layoutelectronicrecords内容信息被排版在预定义页面中,具有显示一致性的版面固定的电子文件。3.2长期long-term虑及技术变化(包括支持新载体、新数据格式)和用户群体变化对典藏信息影响的足够长的时间段。这个时间段延伸到无限未来。[ISO14721:2003]3.3长期保存long-termpreservation用一种可靠的、科学合理的方式长期(3.2)维护电子文件真实、完整、有效的行为。3.4字体font具有同一的基本设计的字形图像集合。如:黑斜体。3.5字形glyph一个可辨认的抽象的图形符号,它不依赖于任何特定的设计。[GB/T16964.1-1997,定义3.12]3.6光栅图像rasterimage由一组按栅格图案排列的像素形成的图像。3.7矢量图形vectorgraphics以给定方向与长度数值的线表示的图形。3.8稳健robustness表现在容错、格式兼容和避免数据缺失等方面的能力。4版式电子文件长期保存格式应满足的需求4.1格式开放4.1.1有公开发表的相应标准和技术规范。4.1.2格式标准和技术规范简洁明了,页面描述语言不应仅为少数厂商认知和掌握。4.1.3没有专利和许可的限制。4.1.4厂商中立。4.1.5有与产品无关的专家组、标准化组织和产业联盟等维护和支持该格式。4.2不绑定软硬件4.2.1被多种操作系统和硬件平台支持。4.2.2文件的阅读不依赖于特定的阅读软件。4.2.3使用与设备无关的颜色规范实现准确打印和再现。4.3文件自包含4.3.1文件呈现的全部信息完全自包含。4.3.2文件中必须包括全部字体的字形描述信息或嵌入字体程序信息。4.3.3文件中还应包括光栅图像、矢量图形、颜色信息等其他需要呈现的信息。4.3.4文件的呈现不依赖于外部对象。4.3.5当文件或文件中的部分信息由模拟源转换而来时,有编码保存其重要属性的能力。4.4格式自描述4.4.1设置规范的元数据集(可以与国际、国内相关标准建立映射),以文本方式(通常为XML)内嵌于文件中,用于描述文件和对象的属性特征,并易于提取和检索。4.4.2文件中应声明遵循的格式标准和版本。4.4.3文件中允许封装用户自定义的元数据。4.4.4文件中的字符对象应声明编码标准。4.4.5文件有必要且充分的结构信息和语义信息,用于解析数字对象。4.5显示一致性4.5.1固定呈现文件页面、章节、段落、字体、图形、图像、色彩等,呈现效果不因软硬件平台和阅读软件变化而变化。4.5.2禁止由条件触发的显示或打印的内容。4.5.3禁用音频、视频等多媒体对象。4.5.4禁用交互式表单和内部可执行代码。4.5.5当使用某些技术将导致显示、打印不一致时应禁止使用,如透明、隐藏和开放式印前接口(OPI)等。4.6持续可解释4.6.1允许用户对文件和文件中的对象添加注释,注释应符合4.5规定。4.6.2不允许设置口令保护。4.6.3禁止对文件或文件中的对象实施加密。4.6.4文件中运用的算法应该是公开的算法。4.6.5文件中引用的字体和运用的算法不应是知识产权保护对象。4.7稳健4.7.1文件格式稳定,版本升级更新有序,前后兼容。4.7.2设置有效的容错机制。4.7.3不采用有损压缩、子采样、缩减采样或者其他任何有可能改变文件内容或降低原始数据质量的操作。4.8可转换4.8.1支持其它格式与版式电子文件长期保存格式相互转换。4.8.2支持过时的版式电子文件长期保存格式转换为新的版式电子文件长期保存格式。4.9利于存储4.9.1格式紧凑,数据结构合理,数据占用字节数少。4.9.2支持在一个文件中容纳大量对象和数据。4.9.3具有聚合能力,可以把几个相同格式的文件聚合到一个文件中。4.10支持技术认证机制4.10.1支持数字签名。4.10.2使用的数字签名被多种操作系统和硬件平台支持。4.10.3数字签名的全部信息完全自包含,包括签名日期、摘要算法、签名算法、签名值、证书信息等。4.10.4数字签名必须视觉呈现。4.10.5呈现数字签名的电子印章、手写签名等必须自包含。4.11易于利用4.11.1支持增值服务,方便提取数据的子集,如分割页面、提取文本串、图像等。4.11.2支持全文检索。4.11.3文件中包含的文本信息符合自然阅读顺序。5测试与评估依据本标准制订版式电子文件长期保存格式和开发软件产品,必须按相关规定经过测试和评估后,才能确认与本标准的一致性