电子文件管理工作福建省档案局监督指导处黄燕芳22019/10/24主要内容一、电子文件概述二、电子文件管理的通用要点三、基于信息系统环境下的电子文件归档流程32019/10/24一、电子文件概述(一)电子文件的概念(二)电子文件的特点(三)电子文件的种类一、电子文件概念(一)电子文件的概念和管理核心1.电子文件的定义指机关、团体、企事业单位和其他组织在处理公务过程中,通过计算机等电子设备形成、办理、传输和存储的文字、图表、图像、音频、视频等不同形式的信息记录。---《电子文件管理暂行办法》Page4档案界目前所称的电子文件:可以归档并成为电子档案的文件。电子档案:归档后的电子文件。档案数字资源=电子档案+档案数字副本+档案电子目录+其他52019/10/24电子文件的属性电子文件是一种数字信息,由电子计算机等数字设备生成和处理的,其信息用二进制数字代码记录和表示。电子文件是文件的一种类型,具有文件的各种属性,特别是具有特定的要素、作用和效力。62019/10/24电子文件的构成要素电子文件内容背景信息文本结构内容(三)电子文件的构成要素电子文件由内容、背景与结构所组成,背景信息与结构信息统称为元数据。Page81.内容内容是表达行为主体的思想、意图及措棕对象(客体)的过程、结果的信息,通俗的说就是文件内容信息。2.背景背景是证明文件形成与办理过程和文件之间相互关系的信息。一般包含以下内容:(1)文件的形成机构及其他相关责任人;(2)与文件有关或曾经有关的其他机构;(3)文件履行机构职责与目的;(4)文件的形成时间;(5)与文件有关的其他时间;(6)机构职能所体现的文件价值与重要性;(7)曾与文件有过关系的文件产生与保存系统;(8)该文件与其它文件和资料间的关系;(9)对该文件有影响的法律、协议、实践、程序、计划、条件与默契等。背景信息直接与电子文件的真实相关,比如收发文批办单上的内容就是背景信息。Page93.结构结构是指电子文件内容信息的组织表达方式,如文字的段落安排,电子文件使用的代码、数据结构、格式,以及载体、附件等方面的信息。结构直接与电子文件的可用相关,是确保电子文件在长期保存过程中始终可以被理解和被利用的重要内容。Page10电子文件的管理不是单纯的对内容信息的管理过程,实质上是对电子文件内容信息、背景信息及结构信息综合管理的过程。需要强调的是,电子文件元数据的管理是电子文件管理领域非常重要的一个环节,元数据直接关系到电子文件的真实、完整、可用和安全,不可小视。92019/10/24(二)电子文件的特点1、系统依赖性2、信息的非人工识读性3、信息存储的高密度性4、信息与特定载体之间的可分离性5、信息的易变性和可操作性102019/10/241、系统依赖性电子文件从生成、传输到存储都是通过计算机实现的。设备发生故障或系统瘫痪,电子文件将被损坏以至丧失。电子文件对其他设备环境的不兼容性。不同软件环境形成的电子文件难以实现格式转换。出于安全保密需要,人为地进行复杂而独特的编码加密或信息拆分处理,更加大了电子文件的系统依赖性。112019/10/242、信息的非人工识读性电子文件是以数字化信息形态存在的,它把可识别的文字、图形等传输到计算机中转换成二进制数字编码,人工不能直接识读。电子文件载体上记录的数字信息往往进行过压缩编码、加密等处理,必须由相应的计算机软硬,将载体上的数字编码序列读取出来,转换成人能识别的形式,显示在屏幕上或打印到纸上,人们才能知晓其内容。122019/10/243、信息存储的高密度性电子文件的存储密度大大高于以往各种人工可识读的信息介质,而且随着技术的进步,电子文件介质的存储密度还将继续加大。应用信息压缩技术,光盘存储文字、图像文件的能力可增加数倍甚至更多。3.5英寸软盘(1.44MB)-70万汉字CD-R光盘(650MB-1GB)-3亿至5亿汉字DVD光盘(4.7G)-20多亿汉字存储介质综合比较参考表蓝光光盘≧25G≧5.3元低0.21元32MB/s37MB/s高高复杂简单简单介质名称单体容量单价附属设备成本成本/GB理论传输速度实际读取速度实际写入速度数据存储难度存放条件要求检测方式迁移难度恢复难度可靠性SATA3企业级硬盘3T700元低0.23元750MB/s130MB/s100MB/s低中简单简单简单约114年LTO5磁带1.5T925元高0.62元140MB/s低中复杂无简单30年SATA3固态硬盘128G450元低3.8元750MB/s300MB/s100MB/s低低简单简单简单约171年档案级DVD-R(16倍速)4.7G25元低5.3元21MB/s高高复杂简单复杂20年2016/7/21202019/10/24132019/10/244、信息与特定载体之间的可分离性可以在不同的载体上同时存在或相互转换。电子文件没有固定不变的字迹和载体,其内容存储的位置不是固定的。可以通过网络传给远方的一个或多个接收者。142019/10/245、信息的易变性和可操作性电子文件与载体的可分离性,也造成了电子文件在被传递或更换至其它载体时,存在着被改动而不被察觉的可能。存储载体性能的不稳定性有可能造成文件中信息的改变。新的信息编码、存储格式、系统软件的不断出现更是对其稳定性的巨大冲击。可以利用已存在的文件信息做其它事情。152019/10/24(三)电子文件的种类按电子文件的载体分:常见的就是磁记录文件、光学记录文件。磁记录文件主要就是以磁带、磁盘、磁卡等为载体的文件。光学记录文件主要就是光盘等。162019/10/24电子文件的种类按电子文件的信息存在形式,其实也就是平时所说的按格式来分,主要有:文本文件数据文件图形文件图像文件声音文件影像文件多媒体文件172019/10/24文本文件亦称为字(表)处理文件,它是指使用文字处理软件生成的,由字、词、数字或符号表达的文件。用不同文字处理软件编辑的文本文件一般不能交换使用,纯文本文件(TXT)不包括格式代码,在使用中不受计算机硬件和软件类型的限制。182019/10/24文本电子文件以公文处理单应以OFD、PDF、PDF/A版式文档格式归档保存和留痕稿用WPS、RTF、DOC等同级国家综合档案馆认可的格式归档保存。文本文件的类别代码T192019/10/24数据文件亦可称为数据库电子文件,它主要包括两类,一是含有数据的电子表格文件;二是数据库电子文件,一个数据库由若干记录组成,一个记录由若干字段(数据项)组成。不同的数据库之间通常需要通过转换程序才能进行信息交换。一般来说,数据文件应能够以DBF文件格式或通过XML文档进行数据交换。数据文件的类别代码D202019/10/24图像文件图像文件是指使用数字设备采集或制作的画面,如用扫描仪扫描的各种原件画面,用数码相机拍摄的照片等。不同格式的图像文件不能任意进行交换使用。图像电子文件以JPEG、TIFF、RAW、PDF为通用文件格式。图像文件的类别代码I212019/10/24图形文件图形文件是指根据一定算法绘制的图表、曲线图,包括几何图形和把物理量如压力、强度等用图标表示的图形等等。它是以图画的形式表示数据内在联系的图表、曲线图等,通常计算机辅助设计(CAD)和一些技术图纸用数字图形表示。图形文件类别代码G222019/10/24影像文件影像文件是指使用视频捕获设备录入的数字影像或使用动画软件生成的二维、三维动画等各种动态画面,如数字影视片、动画片等。影像文件有不同的格式或标准,播放时需要使用相关的设备和程序。影像电子文件以MPEG、AVI为通用文件格式。影像文件类别代码V232019/10/24音频文件音频文件是指用音频设备录入或用编曲软件生成的文件。音频文件的音质越好,文件所占存储空间也就越大。音频电子文件以WAV、MP3为通用文件格式。音频文件类别代码A242019/10/24多媒体文件多媒体文件是指包含两种以上信息形式的文件,这种文件使用多媒体技术制作,具有较复杂的结构,必须使用多媒体计算机复现。多媒体数据同样以MPEG、AVI为通用文件格式。多媒体文件类别代码OPage5电子文件的根本特性:原生性电子文件具备的性质:载体唯一,内容原始、真实和完整,是唯一原件传统载体文件的数字化副本不是电子文件;用于纸质文件起草工作的电子版不是电子文件。这两类数据不是电子文件!2电子文件的管理核心必须确保:真实、完整、可用和安全。----《电子文件管理暂行办法》(厅字〔2009〕39号)Page6真实电子文件的内容经过传输、压缩、格式转换等处理后依然保持不变,即始终与原始生成状态保持一致。电子文件的内容包括全文信息和元数据。完整包括两层含义,即电子文件内容的完整性和电子文件所依赖的计算机系统的完整性。电子文件内容的完整性指的是电子文件的全文信息和元数据无缺失,电子文件所依赖的计算机系统的完整性指的是可供电子文件读取使用的计算机软件和硬件装配正确且无缺损。可用指电子文件的全文信息和元数据可以正确读取和展示,包括数据的可识别性、存储环境的可靠性、载体的完好性和兼容性等。安全指电子文件生成、传输、存储和备份的可信赖环境,确保电子文件在传输、存储和迁移的过程中不会遭受删除、篡改和破坏,且不会被非授权获取。电子(文件)档案管理原则•真实性(Authenticity)•文件的真实性主要是指文件形成符合单位的工作职责,文件和档案管理形成、接收、传输、保管和处置的全过程都在受控的环境中进行,其每一步都遵循相关的管理办法和流程,并对其进行记录。同时能证明没有可以绕过受控环境对文件进行操作的可能。符合单位职责全过程受控全过程记录没有不受控操作可能2016/7/2137电子(文件)档案管理原则•可靠性(Reliability)•文件的可靠性是指文件的内容可信,可以充分、准确地反映其所证明的事务、活动或事实,在后续的事务或活动过程中以其为依据。文件应在事务处理或与其相关的事件发生之时或其后不久形成,且由经办人或由业务活动设备形成。内容•内容可信•反映事件原貌依据•文件被引用•文件被执行背景•经办机构人员•办理时间、地点2016/7/2138电子(文件)档案管理原则•完整性(Integrity)•一份文件的完整是指文件是齐全的,并且未加改动。•应防止文件未经授权而改动。应用系统应做好以下控制:文件形成之后可对文件进行哪些添加或注释,在何种条件下可授权添加或注释,及授权由谁来负责添加或注释。任何授权的对文件的注释、增或删都应明确标明并可跟踪。文件齐全无非法改动完整性2016/7/2139电子(文件)档案管理原则•可用性(Useability)•可用性是指文件能够被定位查找、检索、呈现或理解。文件的可用性还体现在:显示文件的背景信息,以便于理解创建和使用这些文件的业务活动的全貌;建立同一(或者类似)事由文件之间的有机联系,以便于快速定位浏览这些相关文件。显示文件内容显示背景信息显示关联文件2016/7/2140(二)电子文件的产生系统(1)OA(办公自动化系统);(2)ERP(企业资源计划系统);(3)CAD(计算机辅助设计系统);(4)CAM(计算机辅助制造系统);(5)CAT(计算机辅助测试系统);(6)CAPP(计算机辅助工艺设计系统);(7)CAI(计算机辅助教学系统);(8)GPS(全球定位系统);(9)GIS(地理信息系统);(10)E-MAIL(电子邮件系统);(11)EDI(电子数据交换);(12)EC(电子商务系统);(13)EG(电子政务系统);(14)数码照相与摄像及多媒体系统;(15)A/D(模-数转换系统,如扫描设备和光学字符识别软件OCR)。Page7电子文件产生的系统决定着电子文件的特征属性和元数据,影响着电子文件管理软件的开发及其文档一体化管理流程的设计。电子文件的归档方式2种方式:在线归档和离线归档。Page17在线归档指在计算机网络上进行,不改变原存储方式和位置而实现的将电子文件的管理权