第六章档案信息资源建设第一节电子文件接收电子文件接收是指将具有保存价值的电子文件向档案管理部门迁移的过程。一、电子文件接收机制数字档案馆从建设开始,就应按照其功能要求来研究确定电子文件的接收范围、入馆标准及技术方法,并根据档案接收范围,建立起科学、通畅的电子文件接受机制,配备必要的技术手段,从源头上保证数字档案信息的真实、完整、可用。档案行政管理部门应与电子文件形成单位建立法定或者固定的移交、接收关系,从有利于国家、形成单位、社会大众出发,为形成单位的电子文件确定归属与流向。电子文件应经过立档单位档案人员整理、鉴定,符合移交规范后方能向数字档案馆移交。二、电子文件接收范围1、接收的内容。数字档案馆接收电子文件的范围与纸质文件大体相同,应参照纸质文件归档移交范围的有关规定制订电子文件接收范围,原则上符合档案价值要求的、各种形式、各种类型的电子文件均应依法纳入进馆范围。电子文件在形式上包括文本文件、图形文件、图像文件、音频文件、视频文件、数据库文件、网页文件和其他各种类型。2、接收的对象。党政机关、人民团体、国有企事业单位及其他组织机构形成和保存的对国家和社会有价值的档案,都可列入接收范围。由于数字档案所占用空间狭小,接收范围可以适当扩大。各单位形成的反映重大事件、重要活动、重大变化的电子形式的记录,均可列入数字档案馆的接收范围。3、接收文件的构成。列入接收范围的电子文件必须同时收存其元数据等,即电子文件必须与其规范、齐全的元数据一并移交,在移交接收制度中,要详细开列移交文件的内容范围及其元数据模型,以便设计、运行系统时遵照执行。对于非专用格式的电子文件,除接收其主文件外,还需要收存其制作、阅读所需的支持性文件。三、电子文件接收时序电子文件向档案馆的移交接收可以分两步进行:登记备案和移交进馆。1、登记备案。立档单位向档案馆报告其形成的、属于移交范围的电子文件的管理状况,由档案馆进行备案监控,档案馆根据需要对特别重要的电子文件在移交前就进行备份。登记备份是对电子文件实施全程管理,及时采集元数据的有效举措。2、移交入馆。立档单位根据移交制度向档案馆实际提交电子文件的过程。电子文件的移交接收可分为实时和定期移交两种。实时接收是指立档单位电子文件生成和办理完毕后,随时向数字档案馆(电子文件中心)移交的过程。定期接收是指各单位将整理归档完毕后的电子文件在本单位保管一定时间后集中向数字档案馆移交的过程。定期接收的优点是移交的电子文件均经过系统整理,可以保证电子文件的有机联系和系统性、完整性。四、电子文件接收途径移交接收有在线移交和离线移交两种方式。受网络环境限制以及在线办理接收程序不够完备的限制,可以离线接收为主;随着网络环境的发展以及在线安全认证体系的完善,应逐步过渡到以在线接收为主要形式。1、在线移交。是指立档单位将拟移交的电子文件信息按照规定的格式和规范通过网络提交给档案馆,由档案馆接收保存的移交方式。2、离线移交。是指立档单位将拟移交的电子文件信息集中下载到可脱机保存的载体上,向档案馆递交载体的方式。五、电子文件接收要求数字档案馆应有一套电子文件接收进馆的标准。各立档单位应按照电子文件的进馆标准对移交的电子文件进行整理加工。1、格式规范。电子文件的格式包含电子文件的页面版式,如文头、发文字号、正文、落款、发文日期、印章等,和电子文件的存储格式。为便于管理和利用,数字档案馆在接收电子文件前,应规定同一类型电子文件的标准格式。2、元数据要求。电子文件元数据是指描述电子文件内容、背景和结构信息及整个管理流程的数据。数字档案馆接收电子文件应遵循国家省颁布的电子文件元数据方案。3、真实性、完整性和可用性要求档案馆对移交入馆的电子文件必须进行真实性、完整性和可用性检验,并由责任人签署审核意见,检验和审核结果填入电子文件移交、接收检验登记表。电子文件移交时检测的内容包括硬件环境的有效性、软件环境的有效性、信息记录格式、有无病毒感染等。4、其他要求对通用软件产生的电子文件,应同时移交其软件型号、名称、版本号和相关参数、手册、说明资料等,专用软件产生的电子文件原则上应转换成通用型电子文件,如不能转换,接收时则应连同专用软件一并收集。电子文件管理系统运行过程中涉及电子文件处理的有关参数、管理数据等应作为电子文件的元数据一并移交。电子文件移交入馆后必须存储到符合保管期限要求的耐久的脱机载体上,一式3套,一套封存保管,一套供查阅使用,一套异地保存。电子文件存储载体的优先顺序为:只读光盘、一次写光盘、磁带、可擦写光盘、硬磁盘等,不得使用软磁盘作为馆藏电子文件长期保存的载体。对套用统一模板的电子文件,在保证能恢复原形态的情况下,被套用模板作为电子文件的元数据移交。移交入馆的电子文件必须按规定核定密级和保管期限。移交的电子文件按类别代码相对集中,存储电子文件的载体或装具上应贴有标签,标签上应注明载体序号、全宗号、类别号、密级、保管期限、存入日期等,载体应设置成禁止写操作的状态。加密的电子文件,移交入馆后必须解密存储。立档单位应将移交后电子文件在其原载体中保存至少1年。第二节传统档案数字化传统档案数字化是通过各种设备将不同载体形式的传统档案转换成数字档案的过程。档案数字化是数字档案馆建设的重要任务,也是现阶段档案数字资源的重要来源和途径。一、档案数字化目的与要求1、档案数字化的目的(1)提高档案信息的利用效率(2)保护历史档案(3)规避安全风险(4)提高库房使用率2、档案数字化的基本要求规范性要求。所有数字化的档案信息必须按照规定的技术模式、文件格式和工作标准进行数字化,以避免因存储格式和软件平台的不同而不断转换,造成资源浪费和时间延误,降低信息传输与共享的效率。安全性要求。第一要确保档案原件的安全。第二,维护档案信息的保密性。真实性要求。在档案信息的数字化过程中,必须严格维护数字化档案信息内容的原真性,最大限度地保留档案信息的原始面貌,避免由于技术原因造成档案信息的失真,对数字化档案信息的真实性起到了“固化’’作用。效率性要求。合理控制拟数字化档案的范围、采取最优化的技术方案、实现档案数字化工程的专业化和社会化。二、档案数字化工作的组织建立数字化工作领导小组,明确安全责任,设立档案划控小组、数字化加工小组、技术保障小组、安全保密小组等工作小组等工作机构,要吸收信息化部门、业务部门、技术部门、管理部门、保卫部门、后勤保障部门等专业人员。项目开工后10日内,向省级档案行政管理部门进行项目备案。数字化加工一般采取自主加工和委托加工两种方式进行:1、自主加工是档案馆自行配备数字化加工设备,自行组织人力开展数字化加工。2、委托加工是将应数字化的档案,委托专业公司实施加工。对投标单位进行资格、资历、技术、经历审查,与中标单位签订项目合同、保密协议,并督促中标单位制定种类规章制度,加强对人员的管理。三、数字化档案文件格式的选择1.文件的保真度“忠于原文”是档案数字化的基本要求。数字化可以看成是对档案内容的“拷,贝”,这种改变信息表达方式的拷贝过程极易造成内容的失真。为此,在选择文件格式时首先要考虑其保真程度。严格地说,任何格式的数字文件都存在不同程度的信息失真,关键是这种失真度是否在可允许的范围。2.文件的大小数字档案文件通常需要长久保存,其累积空间将十分惊人。为此,在选择文件格式时必须将文件的大小作为一个重要考虑因素。同一档案在数字化时采用不同的文件格式,所占用的存储空间相去甚远。3.与软硬件平台的相对独立性文件格式根据其对软硬件环境的依赖性可分为“应用软件专用格式”和“中间转换格式”两种。应用软件专用格式是某种应用软件在运行过程中为其数据对象自行规定的记录格式,与其软硬件平台相联系,对其生成环境具有很强的依赖性。中间转换格式是按照跨应用软件、跨软硬件平台要求而设计的。中间转换格式具有较大的兼容性,档案数字化应尽量选择中间转换格式。4.通用性文件格式必须考虑用户软硬件环境对所用文件格式的支持程度。选择通用性较强的文件格式会得到更多用户环境的支持,便于众多应用系统的开发者实现对该种文件格式的兼容或支持,从而增加其流行度。反之,具有技术专利的文件格式通用性必然受到限制。5.标准化程度文件格式的产生源于三种情形:配合特定应用软件及其软硬环境而制定的格式(应用软件专用格式);计算机相关厂商为占领或规范市场而推出的文件格式(以中间转换格式居多);国际性组织或协会为规范、统一起见推出或推荐的某种文件格式,或者对某类格式作出的某些技术规范格式。6.数字化档案的用途文件格式的选择还受制于数字化工作的目的和性质,目的不同所选的数字文件格式有可能不一。为提供查阅利用而数字化对数字文件原真性的要求要比为保管和出版而数字化低的多,假如数字化的对象是纸质档案,前者可选择JPEG或PDF格式,而后者可优选TIFF格式。四、纸质档案的数字化纸质档案数字化是采用扫描仪或数码相机对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。1、纸质档案数字化处理的流程相比于档案目录信息的录入存储,档案全文的数字化工作要复杂得多,必须建立起一套工作流程和技术规范。纸质档案数字化的基本环节包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。2、纸质档案数字化扫描仪的选配扫描仪是图像信号输入设备。扫描仪有平面扫描仪和滚筒式扫描仪二大类,平面扫描仪使用光电耦合器件CCD,一般用于普通幅面档案的扫描;滚筒式扫描仪使用光电倍增管,性能高于GCD类扫描仪。档案数字化系统应根据扫描速度方面的要求配置1台或多台自动进纸的中、高速扫描仪,若干台平板扫描仪。平板扫描仪通常幅面为A4、A3两种,由于纸质档案多为普通文档,大幅面的照片、图片并不多(工程图纸除外),所以A4、A3幅面的扫描仪基本满足需要。扫描仪的功能要通过相应的软件来实现,选购扫描仪时要关注配套软件的品种及其说明材料。3、纸质档案数字化的加工管理软件纸质档案数字化系统,除了配备硬件设施外,还需要配置调度、运行这些硬件设施以完成档案数字化工作的软件。纸质档案数字化系统需要用到的软件有两类:系统软件(包括操作系统、数据库管理系统等平台)和应用软件(在软硬件平台的基础上实现数字化流程的文档扫描、图像处理和数据存储等软件程序)。流程式纸质档案数字化系统。包括系统注册、原文扫描、图像编辑、消蓝去污、图像拼接、档案著录、档案查询等功能模块。并应力求符合以下要求:适应不同规模的制作环境开发不同的版本;适用不同类型的纸张,兼容各种档次的扫描设备;提供高效的扫描录入和图像处理功能;提供完善的质量保障和工序流程管理,实现标准化和规范化的生产;基于大型数据库管理系统,如ORACLE、SQLSER\/ER等。五、照片档案的数字化照片档案数字化与纸质档案数字化在工作原理、实施方法和操作过程方面是基本一致的照片档案的数字化应遵循《照片档案数字化技术规范》的要求。以下就其不同于纸质档案的方面作简要说明。1、照片档案数字化对象的选择照片档案包括底片、相片(习惯称为照片)和文字说明三部分。照片档案数字化应尽可能选择底片作为扫描母版,扫描出来的图像色彩及细节的保真度高。缺点是必须使用专门的底片扫描仪或者在常规扫描仪上加装透扫适配器,对扫描设备的要求比较高。2、照片档案数字化方式的选择照片档案的数字化可以采取用扫描仪扫描输入和用高档数码相机对其进行翻拍录入两种模式。扫描输入是照片档案数字化最通用的方法,所需设备简单,操作过程也比较简便,并适用于各类照片档案的数字化处理。翻拍录入过程虽然比较快捷,但要配置辅助照明设施,拍摄过程中对变焦、曝光等的调控要求较高,拍摄难度比想象中的大。3、照片档案扫描分辨率的选择分辨率越高,扫描照片越清晰,存储空间越大,扫描所需时间也越长。但当扫描分辨率高于一定值后,照片质量不会有明显提升,反而会陡增存储空间,并且延长扫描时间。因此,在设定扫描分辨率时,要在分辨率与图像大小之间认真权衡,区分是底片扫描还是相片扫描,综合考虑被扫描照片的尺寸、原照片的图像质量、利用性质及其还原输出