电子文件专题讲座一、电子文件概述随着信息技术的不断发展,办公自动化在各级各类国家机关、社会组织、企业、事业单位中日益普及,计算机辅助设计(CAD)和计算机辅助制造(CAM)应用于科研、工业领域,电子数据交换(EDI)、电子商务(EC)在国内外贸易中广泛应用,形成了大量的电子文件。二、电子文件的概念电子文件(ElectronicRecords)是指在数字设备中产生,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机系统阅读、处理,并可在通信网络上传送的文件。完整的电子文件包括内容、背景和结构三要素。国际档案界电子文件专家认为,完整的电子文件由文件内容信息与元数据组成,并形象化地将文件与元数据比作信的内容和信封,文件是用元数据封装起来的对象,元数据加上文件内容就构成了有证据作用的文件。三、电子文件元数据的含义和作用1、元数据含义。信息技术界中的元数据有多种。电子文件元数据是关于文件的背景信息和结构,满足电子文件管理需求的特殊元数据。它是描述电子文件数据属性,并对其进行定位和管理、同时有助于数据检索的数据,是一种有效的信息资源组织和管理的工具,是一种编码体系。概言之,元数据是对文件的内容、背景、结构信息等进行描述动态扩展的电子目录。2、元数据的作用。可从三方面来认识:(1)构建信息发现机制,即检索机制。元数据能够动态地获取电子文件管理的各项信息。面对海量信息资源管理,借助基于资源组织和发现的描述型元数据,快速发现并获取特定的信息单元。(2)维护信息可识读性。元数据具有静态映射功能,可以完整地记录电子文件的原始状态,还能够系统地映射出电子文件的生成环境,数据产生的软硬件环境,数据结构,类型,打开方式等信息对象的附加相关信息,即保存元数据的元素项。只有在获取数据对象的同时也获取这些附加的说明信息,被检索到的数据单元才是可理解的、可读的。(3)保障数字信息的真实性、凭证性。信息单元的变迁历史和操作记录的信息是管理元数据的元素项,元数据能够提示文件生成的行政管理环境,为数字信息单元真实性和凭证性提供了重要的佐证。四、电子文件的种类1、按电子文件的信息存在形式分类。可分以下8种文件:(1)文本文件(Text),或称为字(表)处理文件,是指使用文字处理软件生成的,由字、词、数字或符号表达的文件。(2)图形文件(Graphic)是指根据一定算法绘制的图表、曲线图,包括几何图形和把物理量如应力、强度等用图标表示的图形等等。(3)图像文件(Image)是指使用数字设备采集或制作的静态画面,如用扫描仪扫描的各种原件画面,用数码相机拍摄的照片等。(4)视频(影像)文件(Video)是指使用视频捕获设备录入的数字影像或使用动画软件生成的二维、三维动画等各种动态画面,如数字影视片、动画片等。(5)音频(声音)文件(Audio)是指用音频设备录入或用编曲软件生成的文件。(6)数据文件(Data)又称为数据库文件。是指在事务处理系统中单独承担文件职责,或者作为文件的重要组成部分出现的数据库数据对象。(7)命令文件,亦称计算机程序(Program)是指为处理各种事务用计算机语言编写的程序,是一种计算机软件。它的形成过程一般是由程序员编写“源程序”输入计算机,通过相应的编译程序编译后执行,有些还要经过连接程序才能执行。(8)多媒体文件(Multimedia),包含上述两种以上信息形式的文件为“多媒体文件”这种文件使用多媒体技术制作,具有较复杂的结构,必须使用多媒体计算机复现。2、按文件的功能分类。可分为主文件和支持性、辅助性、工具性文件。主文件是指表达作者意图、行使职能的文件。支持性文件是指生成和运行主文件的软件,如文字处理软件、表格处理软件、图形软件,多媒体软件等。辅助性、工具性文件是指在制作、查找主文件过程中起辅助、工具作用的文件,如计算机程序类文件(命令文件)往往附带若干辅助设计文件、图形文件,数据库往往附带若干辅助数据库和相应的索引文件、备注文件等。3、按文件的生成方式分类。可分为计算机系统中直接生成的原始文件和将纸质或其他载体(如胶片)文件重新录入生成的转换文件。五、电子文件的特点与以往各种形态的文件相比,电子文件的主要特点包括:1、电子文件信息对硬软件及标准体系的依赖性。电子文件的制作、处理,以至归档后的全部管理活动都必须借助于计算机系统才能实现,不兼容的计算机和应用软件生成的文件在交换使用时会遇到很大困难。当生成一份文件的软件、运行该软件的操作系统和硬件更新换代以至与原系统不兼容时,需要保存老的系统,或者进行一系列适应新系统的转换、迁移工作,才能确保该份文件的可读性和可管理性。在计算机系统处理文件,其正常的运作、管理都是建立在一套标准化体系之上的,如文件制作生成要有代码标准,其存储要有机读载体的格式标准、信息压缩存储的标准,其传输要有网络通讯协议标准,其查找要有检索语言标准等。其严格程度和对系统的要求,是纸质文件运作的标准化体系远远达不到的。2、电子文件信息内容与载体形式之间具有可分离性。电子文件的信息与其形式或载体不是牢固不可分割的,可以不以确定的格式存在和表示,相同的信息可以在表现时呈现多种形式、格式。由于这种特性,对电子文件归档的完整性要求是内容要件和形式要件“二维归档”。3、信息的不稳定性。造成电子文件信息发生变化的主要原因有:第一,信息可以脱离特定载体而存在,载体对它的“束缚”没有了,计算机系统中信息的相对独立性使人们对信息的增删更改十分方便,动态文档中的数据不断地被自动更新或补充。第二,电子文件载体性能的不稳定性有可能造成文件中信息的改变。第三、电子信息技术的发展,新的信息编码方案、存储格式、系统软件的不断出现更是对电子信息稳定性的巨大冲击,要求将原文件迁移到新的技术环境之中,迁移过程中信息的损失、变异也是不可避免的。4、信息的可重用性。一是存储起来的信息可以被反复调取、使用;二是对所存信息整体进行拆分,或提取信息的属性,并使之与具有某种共同属性的信息建立关联、组配使用;三是通过网络基础和协同系统(集群技术),不同的人或设备可以同时对同一文件进行操作:四是通过数据挖掘等方式可以对结构化文件中蕴含的信息进行分析和调用,以发现数据资源库数据中的信息规律。5、电子文件形成系统的异构性。异构性是指是系统的数据处理与描述方式多样化,不一致。形成电子文件的系统性质、功能及功能实现方式是多种多样的,建设单位的业务特色、工作环境差异、技术系列的差异、开发者的技术擅长等,都会导致具体系统的概念定义、功能定义、结构方式、技术路线、技术构成等多方面的异构性。解决异构性问题的主要方法是数据处理方式和描述方式的标准化。6、电子文件管理流程的变化性(1)时间变化:归档、鉴定、著录环节提前;著录将贯穿于电子文件的编制、处理、归档、迁移、利用等整个生命周期。(2)内容变化:A、简化:实体整理仅为对脱机保存的磁盘、磁带、光盘的简单归类。B、复杂化:信息整理、鉴定、著录。C、集成化:归档与检索的集成、逻辑归档工作与检索工作的集成、归档与鉴定的集成、保护与其他流程之间的集成。(3)顺序变化:由串行向并行、线性向非线性变化。六、电子文件管理目标与原则1、电子文件管理的目标(1)保障电子文件的真实性。电子文件的真实性是指文件内容、结构和背景信息经过传输、迁移等处理后依然保持不变,与形成时的原始状态一致。真实性是保证电子文件行政有效性和法律证据性的基础,是电子文件反映历史面貌,构成社会价值,得以作为社会记忆长久保存的前提。(2)保障电子文件的完整性。电子文件的完整性包括三个方面的含义,一是作为记录社会活动真实面貌的具有有机联系的电子文件及其他形式的相关文件数量齐全;二是每一份电子文件的内容、结构和背景信息没有缺损;三是与主文件相关的支持性、辅助性、工具性文件齐全。(3)保障电子文件的长期可读性原则。电子文件的可读性是指文件经过存储、传输、压缩、加密、媒体转换、迁移等处理后能够以人可以识读、可以理解的方式输出,并保持其内容的真实性。电子文件的可读性是其存在和保存价值的基础,如果文件不能顺利读出,文件中的信息便成为“死信息”,再有价值的东西也失去了存在的意义。2、电子文件管理的原则(1)前端控制原则。前端控制是现代文件、档案管理理念的重要内容,它以文件生命周期理论为基础,把文件从形成到永久保存或销毁的不同阶段看作一个完整的过程。在这个过程中,文件的形成是前端,处理、鉴定、整理、编目等具体管理活动是中端,永久保存或销毁是末端。前端控制则是对整个管理过程的目标、要求和规则进行系统分析、科学整合,把需要和可能在文件形成阶段实现或部分实现的管理功能尽量在这一阶段实现。在已经建立了电子文件管理系统的地区和机构,电子文件是在系统中生成和运转的,电子文件管理过程的前端就延伸到了系统设计阶段,前端控制的形式也部分转移到系统功能的设计之中,尽可能把文件生命周期各个阶段的管理要求设计在系统之中,以功能合理的文件管理系统作为管好电子文件的先决条件。前端控制是实现电子文件全程管理的重要保障,其必要性主要体现在以下两个方面:第一,前端控制是确保电子文件真实可靠、完整安全、长期可读的有效策略。第二,前端控制是优化管理功能,提高管理效率的科学理念。电子文件管理系统不应是对手工管理流程的简单模拟,而应该本着更科学、更合理、更有效的原则对以往的文件、档案管理进行“业务流程重构”,以便减少乃至消除文件、档案管理全程中各个管理环节的重复、疏漏,从而达到功能合理,效率最高。(2)全程管理原则。根据电子文件的特点和管理要求,必须建立一个完整的管理体系,对电子文件从产生到永久保存或销毁的整个生命周期进行全程管理。(3)集成管理原则。集成管理是对管理要素的科学重组,是全程管理思想的延伸和深化。包括文件流内部管理活动的集成、文件流与业务流的集成、文件流与其他信息流的集成三方面。七、电子文件的鉴定电子文件鉴定工作的内容具体包括:鉴别、内容与技术状况的鉴定、处置、记录等环节。(一)电子文件的鉴别工作鉴别工作就是确定哪些信息是文件,从而需要判断其价值。鉴别是电子文件鉴定的新内容,是鉴定工作的第一步,也是鉴定工作顺利开展的基础和前提。鉴别的任务是将文件从非文件信息中挑选出来,其实质是明确机构形成电子文件的需求,即机构需要形成哪些电子文件。(二)电子文件的内容鉴定步骤:1、制定电子文件保管期限表;2、将电子文件保管期限表纳入管理系统并予以维护;3、鉴定归档前的文件;4、鉴定保管期满文件。(三)电子文件的技术鉴定技术鉴定的任务即检查电子文件的技术状况,判断电子文件有用程度是否具有实现的可能,以明确电子文件的利用价值是否处于可利用的状态(技术分析或技术鉴定),是对电子文件的各方面技术状况进行全面检查,包括对文件信息真实性、完整性、可读性分析以及对文件载体性能的检测。1、真实性鉴定。鉴定电子文件的真实性,主要是认定文件是否就是当时当人当事形成的,可以将真实性理解为“原始性”。就电子文件软硬件依赖性所造成的真实性问题,可采取以下措施。第一,分析机构内各类电子文件中哪些组成要素能确保文件长期的真实性;第二,根据预先确定的标准格式和模板编辑文件;第三,对于某些文件可将该文件转换成非数字形式,如缩微等;第四,对文件的迁移进行记录,这是文件著录中的重要内容。2、完整性鉴定。分为检查文件要素和检查要素集中手段两个方面。前者是指利用有效的技术手段,对照元数据模型,检查一份文件各个要素是否完备,包括可视的和不可视的部分。后者是指分析联系一份文件各个要素的手段是否有效,这些手段包括超级链接、置标语言等。3、可读性鉴定。可读性鉴定是电子文件技术鉴定的重要内容,目的在于确认电子文件中的内容可以正常读出,没有丢失和差错。为此,不仅需要确认文件在形成时的可读状态,同时需要分析其是否具备日后多次无差错读出的技术性能。主要包括四方面的工作:第一,检查与电子文件相配套的软件、相关电子文件(如数据比较复杂的关系型数据库的相关数据库)、文字材料是否齐全、完整。对于加密文件,保存时如果由于特殊需要未予解密,还需检查其记录密码是否保存下来。第二,检查电子文件的信息存储格式