数字化加工技术层面

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1、档案数字化简介所谓纸质档案数字化,是指采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程,是档案信息从纸质载体向磁盘、光盘等数字载体上转移的过程。由于档案本身具备的真实性这个特点,因此在档案数字化采集过程中,采用扫描或拍照的方式,保障其真实性,与此同时采用光栅图形的形式进行永久存储,从而保障其原始性。由于档案本身是历史的产物,在不同历史时期,其采用的存储介质不同。即便是同样采用纸质的形式进行存储,不同年代纸介的质量不同,随着时间的推移,纸质档案存在老化、腐烂等情况,因此,在纸质档案数字化采集的过程中,要求针对不同年代、不同纸质的档案,进行不同扫描参数设置,从而达到最好的采集效果。由于档案数字化工作的最终目的是,人们能够通过信息网络快速的检索和利用档案。因此,针对档案的数字化过程,除了档案原件本身需要进行数字化采集工作外,档案的编目信息(包括案卷级和卷内级目录)也需要进行采集著录工作。以便信息系统可以根据条件进行检索。另外,历史的档案目录多为手写,很难采用现今比较流行的OCR文字识别技术,因此,为保障档案目录的准确,需要人工的进行条目的著录采集工作。档案数字化工作本身并不是简单的纸质档案扫描。其存在许多问题有待解决,具体如下:1、历史档案数量庞大,需要多人长期的辛勤工作方可完成。因此,档案数字化长期的多人协调和衔接工作,是需要认真思考和面对的问题。2、档案数字化工作既然是人工去作,难免出现错误。因此,针对每一份档案的纠错(查错、改错等),将成为档案数字化工作最重要的组成部分,如果数字化采集的数据不能为信息系统所利用,则意味着档案数字化工作的失败(即便扫描了很多份档案,非常辛苦)。3、档案数字化工作返工,这是数字化工作中经常会遇到的问题,任何单位都不可避免,只是返工的数量和工期是可控制的。造成档案数字化工作返工原因很多,数字化工作中产生的错误只是一方面,还包括数据存储参数的改变、档案保管办法的改变、硬件设备的损坏等许多方面因素。4、档案的安全,包括纸质档案的加工安全和电子档案的存储安全。国家档案法中明确指出任何人不得私自修改(涂改)、损坏、销毁档案,因此在档案数字化过程中,针对档案采集设备要严格考量,禁止使用能够造成纸质档案损坏的任何采集设备(滚筒扫描仪容易撕纸)。另外,在纸质档案的交接与归还过程中要严格把关,防止数字化加工后的档案文件缺失。目前的档案数字化行业,是伴随着档案事业的发展而兴起的一个新兴行业,其发展速度之快令人难以想象,但就其本身的信息化程度和现代化管理水平而言却严重滞后。这种发展的不平衡如果持续下去,将会为这个行业的长期发展带来很大的影响。2、档案数字化加工环节根据《纸质档案数字化技术规范》(DA/T31-2005)标准所规定,同时结合这十几年的档案数字化项目经验,为保障档案数字化的加工质量和效率,将档案数字化加工环节划分三大操作集合,分别为基本加工环节集、安全保障环节集、质量检查环节集。档案数字化加工工序图如下:基本加工环节集:主要是指那些档案数字化工作中,必须进行的操作环节。主要包括:档案整理(编页号、拆卷)、档案扫描、条目著录、数据挂接、打印案卷及卷内目录、档案装订、数据备份(光盘制作)。安全保障环节集:主要是指围绕纸质档案的加工安全,而定义的加工环节。主要包括:档案领取、档案归还、档案登记(上架)。质量检查环节集:是指针对各加工环节完成的纸质或电子档案的检查工作。主要包括:图像质量检查、著录条目校对、挂接校对、纸质案卷抽查。档案数字化完整的加工环节包括:档案领取\归还、档案登记(上架)、档案整理(编页号、拆卷)、档案扫描、图像优化处理、图像质量检查、条目著录、著录条目校对、数据挂接、挂接校对、打印案卷及卷内目录、档案装订、数据备份(光盘制作)、纸质案卷抽查。3、各加工环节详细描述各工序详细描述如下:领取档案:数字化加工人员到档案室里批量领取档案的过程,该工序标志着档案数字化工作的开始。数字化加工人员和档案保管人员,双方要认真核对领取档案的数量、时间,确认无误后双方人员要在“档案交接登记单”签字确认。归还档案:数字化加工人员将数字化制作完成的档案,批量归还给档案室的过程,该工序标志着档案数字化工作的结束。数字化加工人员和档案保管人员,双方要认真核对归还档案的数量、时间,确认无误后双方人员要在“档案交接登记单”签字确认。序号领取时间起始案卷号终止案卷号卷数领取人提供人领卷核查情况归还时间接收人还卷核查情况12006.11.2500101010张三老师老师22006.11.2501102515张三老师老师32006.11.2502604620张三老师老师档案登记:是指将刚刚领取的档案登记在册的过程,同时将该领取的档案编入到数字化加工序列之中,为后续的加工任务分派和加工进度控制奠定基础。登记信息比较简单,一般包括案卷的编号、总页数和时间信息。此过程可以通过两种方式来实现,第一种方式是著录登记信息到Excel中,打印出登记册交给工程管理人员,由工程管理员进行动态的工作调派。第二种方式是著录登记信息到网络中的工作单中,以“下单”方式(“工作流方式”)将登记的案卷信息发送给工程管理人员。此档案登记环节的定义,取代了以往在领取每卷的档案盒中插入“错误单”的方式,大大提高了一卷档案的监控力度和整体工程的进度掌控的精确度,同时减少了不必要的浪费。档案整理:是指针对档案案卷,按传统组卷或简化组卷方式,进行重新排序和编写页号的过程。该档案整理环节的定义并非“广义”上的档案整理。该环节所产生的页码错误,将档案扫描等后续环节中被查出。档案扫描:将纸介档案扫描的计算机的过程。主要技术指标有扫描分辨率(Resolution),亮度(Bright),对比度(Contrast),图像压缩方法(Compress),文件存储类型(FileType),文件存储路径(FilePath);图像处理:将扫描产生的图像文件进行优化处理的过程,是提升电子档案质量的重要过程。主要操作包括:扫描质量检查、图像去黑边框、图像去小斑点、图像纠偏、图像切边、图像拼接、拆分等操作。其中“扫描质量检查”又称“一查”,是图像处理人员通过观察来判断扫描图像,是否扫描压纸、压字,是否存在“扫描变形”,是否亮度、对比度不够档案不清晰肉眼很难辨别等;如出现此类情况,交给扫描人员重新扫描。图像检查:是对图像优化处理操作完成的图像,进行检测的过程。该过程又称“二查”,主要针对图像处理操作后的图像是否完整、是否对扫描图像进行了清晰化、规整化操作,页号是否连续,有没有出现扫描、处理丢页的情况等。如出现上述情况,根据情况类型交给扫描或处理人员重新操作。条目著录:根据档案信息管理平台定义的档案目录结构,通过人工著录的方式,进行条目数据采集的过程。在此过程中经常会产生错别字、项目级或案卷级或卷内级目录关联错误等。同时,该环节是影响档案数字化工作整体速度的重要环节之一。该环节错误率高,将使后续的差错和改错环节难度增大。条目校对:是指检查出条目著录环节中产生的错误,同时加以改正的过程。该环节中又称“三查”,主要针对错别字和目录关联错误进行纠正。数据挂接:是指将扫描产生电子档案图像数据与著录的条目数据,进行一一对应匹配的过程。数字化人员通过人工或自动的两种方式,将实际档案原件的存放路径(绝对路径或相对路径)信息,记录到该著录条目的“原文路径”字段中,这样档案管理信息系统便可以通过获取该“原文路径”字段的内容信息,来加载档案扫描原件,以供用户浏览、利用。挂接校对:是指将扫描产生电子档案图像数据与著录的条目数据一一对应匹配结果的校对过程。为保障挂接数据准确,需要人工的“一条”与“一页”的比对,没有其它捷径。只能在数据的加载方式上,来提高校对效率。在此校对过程中,操作人员可以发现“页号编写错误”和“数据著录错误”或“丢著录记录”等现象,并及时的加以纠正。数据备份:主要通过两种方式,一是通过光盘刻录方式进行数据永久备份;二是通过数据复制到现有的“磁盘阵列机”进行数据备份;光盘刻录方式,根据国家对电子档案数据离线备份要求:a、在光盘的根目录下必须存放光盘数据目录信息数据库文件,并可以使用“通用”数据库软件打开、浏览、检索;b、在光盘的根目录下必须存放关于光盘数据存储信息描述的“说明文档”;c、电子扫描数据存放于光盘的根目录下指定的“子目录”下。档案装订及目录打印:是指针对数字化加工完成的纸质档案案卷,用打印出的目录纸张,来替换掉原始的手写目录,然后根据该门类档案的装订要求,将零散的纸质档案重新组装成卷的过程。在此过程中经常会发生“页面乱序”情况,因此要求装订人员按照“打印”的新目录顺序去排序,然后再去装订。案卷抽查:主要是由工程负责人员(项目管理人员),针对装订完成案卷进行的“抽查”或“排查”的过程,是档案数字化加工中最重要的“检查环节”。此环节的细致程度越高,最终用户验收通过的几率越高。

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功