1电子文件元数据标准(征求意见稿)1.范围本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。2.编制目的2.1对文件及相关实体进行标准化描述;2.2实现不同机构、不同系统之间文件及信息的互操作;2.3为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;2.4为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。3.规范性引用文件下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GB/T2659-2000世界各国和地区名称代码GB/T2260-2002中华人民共和国行政区划代码GB/T11714-1997全国组织机构代码编制规则GB/T9704-1999国家行政机关代码编制规则GB2312-1980信息交换用汉字编码字符集基本集GB/T4880-1991语种名称代码GB/T4880.2-2000语种名称代码第2部分:3字母代码GB/T4881-1985中国语种代码GB/T3792.1-1983文献著录总则GB/T13959-1992文件格式与代码编制方法GB/T15418-1994档案分类标引规则GB/T3760-1995文献叙词标引规则GB/T9704-1999国家行政机关公文格式GB18030-2000信息技术信息交换用汉字编码字符集基本集的扩充GB/T18894-2002电子文件归档与管理规范GB/T7156-2003文献保密等级代码GB/T19667基于XML电子公文格式规范DA/T12-1994全宗卷规范DA/T13-1994档号编制规则DA/T18-1999档案著录规则DA/T19-1999档案主题标引规则DA/T22-2000归档文件整理规则DA/T1-2000档案工作基本术语2中办发[1996]14号中国共产党机关公文处理条例国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知ISO15489信息与文件—文件管理ISO23081-1信息与文献—文件管理流程—文件元数据-总则ISO23081-2信息与文献—文件管理流程—文件元数据-概念与实施问题ISO14721空间数据和传输系统—开放档案信息系统—参考模型ISO11179信息技术--元数据元素的规范与标准化ISAD(G)档案著录规则(总则)W3CNamespacesinXMLXML的命名空间(Namespaces)4.术语与定义下列术语和定义适用于本标准。4.1通用术语4.1.1业务系统Businesssystem将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。如:电子政务系统、办公自动化系统等。4.1.2电子文件管理系统ElectronicRecordsManageSystem(ERMS)为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。电子文件管理系统包括:档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。4.1.3实体Entity指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。比如:人、物体、事件、想法、过程等等。4.1.4文件实体Recordentity在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。可以是单份文件,也可以是文件的集合。4.1.5责任者实体Agententity对文件的信息内容负有责任的个人或团体。4.1.6业务实体Businessentity指业务过程中对文件进行处理与管理的一系列活动。4.1.7关系实体Relationshipentity描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。34.1.8电子文件元数据ElectronicRecordsMetadata描述电子文件内容、背景和结构信息及整个管理流程的数据。4.1.9元数据集Metadataschema规定和描述标准元数据集元素以及元素间相互关系的框架。语句集为元数据元素提供正式的结构(句法)和语义(定义)。4.1.10元数据结构Metadatastructures元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。元数据结构体现元数据扩展的方法与机制。元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。4.1.11元数据语义MetadataSemantic元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。4.1.12元数据句法Metadatasyntax句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。从标准、开放、互操作角度,采用标识语言对元数据集进行描述。本标准采用XML语言对元数据集进行描述。4.1.13编码体系EncodingScheme编码体系有助于对元素修饰词值的理解。这类体系包括控制词表及正规的符号或解读方式。值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。4.1.14信息总体InformationPackage电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。封装是指创建的一个由电子文件及其元数据组成的自我包含的实体。信息总体便于对电子文件的独立理解,支持并长期保证电子文件的真实性、可靠性和完整性,同时提供电子文件与其形成背景之间的可靠而有意义的逻辑联系。电子文件封装入信息总体,该文件可以存在于任何存储或操作环境中,因其包含了嵌入其中的有关开始和过程的所有细节,包括那些用于存取、传递和表述文件的细节。信息总体需要将元数据捕获的多个点包含进文件,因为文件的处理历史像其最初的捕获元数据一样至关重要。本标准采用ISO14721《信息技术--元数据元素的规范与标准化》定义的封装技术,定义了信息总体的封装格式,包含维护真实性的技术机制。信息总体封装格式(EncapsulatingFormatforInformationPackage-EIP)见附录B。.4.1.15信息总体固化FixityofInformationPackage电子文件元数据与其文件一样,需要受真实性规则、规范或标准的控制,以保证电子文件具有可信性,这种控制称为元数据固化。本标准采用数字签名技术来进行信息总体的固化。44.2数据模型概念4.2.1属性Attribute物体或实体的特征。4.2.2类别Class:对具有相同属性,操作,方法,关系和语义的对象集的描述。4.2.3概念数据模型/概念模型Conceptualdatamodel/conceptualmodel通过数据模型对现实世界进行抽象地表达。5.总则电子文件形成、捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中都需记录在元数据中,并应保持连续、一致,以确保电子文件的真实性、完整性与有效性。为实现电子文件全过程管理与监控,电子文件及其元数据与结构稳定、定义良好的元数据标准相一致,特制定本标准。本标准的制定遵循国际文件管理的系列标准规范:按ISO15489《信息与文件—文件管理》规定的文件管理过程要求定义电子文件管理元数据,采用ISO/TS23081《信息与文献—文件管理流程—文件元数据》定义的电子文件管理元数据概念模型、实体及关系模型;采用ISO14721《空间数据和传输系统—开放档案信息系统—参考模型》定义的信息包(SIP、AIP及DIP)数据模型,实现电子文件内容、背景、结构信息的封装,以确保在分散与集中管理过程中电子文件的真实性、完整性、有效性,确保电子文件在不同应用系统间的安全传输;采用ISO14721定义的数字信息长期保存模型,实现电子文件的长期保存与利用。本标准支持元数据值的再利用、元数据元素的互操作及可扩展性和模块化。元数据来源于机构文件处理方案、主题词表或关键词表、编码方案、电子政务系统、办公自动化系统、电子文件管理系统、档案管理系统、E-mail系统、网站。6.元数据概念模型文件管理业务系统的各个流程,需要通过元数据实现对文件或档案的管理。元数据最主要的用途之一是用来描述业务系统中实体。关键实体如下:文件实体:文件本身,不管是单份文件还是文件集合体;责任者实体:业务环境中的人或组织结构;业务实体:业务办理。根据元数据类型,可将元数据分为下列几类:关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。5电子文件元数据模型的建立是以文件连续体理论为基础的。文件实体、责任者实体和业务活动实体,是用元数据帮助确保文件真实性、完整性和有效性,实施档案化管理必须充分关注的要素。文件作为交流、传递、贮存、利用信息的工具,其生成、处理、运转必然与文件责任者处理某项事务相关。对该事务的办理,形成文件的业务活动,构成了文件的来源..。这种业务活动构成了文件的背景。责任者作为文件的形成和处理者,为业务活动或事务处理活动的实施者。作为业务活动的主体,责任者与业务活动的推进息息相关,人们的业务活动自身也是划分为一定层次并且与相关文件群体(文件集合)的层次相对应。从微观到宏观区分为以下层次:1)事务处理:即处理每一件具体事务的业务活动,在这种业务活动中形成的文件一般情况下可以构成一个文件组合(案卷)。2)业务活动:即处理某种类型事务而进行的职能活动,有可能是由某个机构的一个职能部门进行;也可能该职能活动属于某个相对独立的业务活动项目,是其中的一个子项目。在这种职能活动中形成的文件,往往构成全宗内的一个类别(系列)。3)业务职能:即具有相对独立性的业务活动过程。其中以主体为核心的,是由一个立档单位进行的全部业务活动,在该项业务活动中形成的全部文件往往构成一个主体全宗;以客体为核心的相对独立而又具有相当规模的业务活动,则是围绕着该客体而跨立档单位进行的,所形成的文件一般情况下可以构成一个客体全宗。人们进行的业务活动,同时也决定了文件所拥有的和将要拥有的各种有机联系。除了在处理同一项业务活动过程中形成的所有文件相互之间......的联系以外,还有:业务活动与文件的联系;业务活动承担者(即文件形成者和处理者)与文件的联系。它们是与文件的形成产生过程同步共生的。因此,(由业务活动承担者进行的)“业务活动”所诱发形成的“与文件有关的各种有机联系”是文件来源信息的重要组成部分,因而也是文件背景信息的重要组成部分。业务文件管理业务人(责任者)文件政策法规创建被利用执行控制赋予职责执行整合于说明职责执行情况况被记录于记录、管理、使用图1主要实体及其相互关系67.电子文件元数据集(Metadataschema)7.1电子文件元数据元素简表7.1.1文件实体(RecordEntity)1.1文件层级(RecordCategory)1.2文件标识(RecordIdentifier)1.3文件题名(RecordTitle)1.4文件分类(RecordClassification)1.5文件主题(RecordSubject)1.6文件摘要(RecordAbst