档案数字化解决方案1立项背景在市县级政府各部门中,国土资源局(原土地管理局)是设立较晚的一个部门,然而国土资源部门目前承担的管理职能,使其产生了大量的各类档案需要管理。传统县级国土资源档案管理采取手工方式,档案的接收、整理、鉴定、保管、利用、编研等工作都主要以手工为主,这中间包括建立全引目录本、索引卡等。这种方式工作效率较低,国土资源档案得不到充分利用。部分国土资源部门的档案管理信息化采用了一般的条目管理方式的方案,这种方式对于纯粹的档案管理来说促进了档案管理的现代化,但对于国土资源部门来说,大量的档案是通过办事流程产生的,与以档案馆档案管理模式开发的档案管理系统在模式上存在显著的不同。另外现有的地籍系统、土地利用系统和土地交易系统的数据分散三个独立的系统中,数据格式多样,给土地归档工作带来了不便,急需把各个部门各个系统的相关数据进行同一归档管理。所以建立优质、高效、具有国土资源特点的档案管理信息化系统,建设国土资源局数字档案室,不仅从根本上解决传统手工作业方式所带来的诸多问题,而且能更好的促进我县国土资源局信息化建设的快速发展,保障土地档案信息的有效管理利用,还为今后逐步建立国土电子政务系统打下良好的基础。2核心任务和根本目的国土资源局数字档案室建设的核心任务是档案信息的数字化。一方面将现有档案,包括各种纸质档案、照片档案、声像档案等进行数字化处理;另一方面收集整理工作过程中形成的大量的电子文件档案,这种收集可以是文本、图形、图像、声音、视频等各种形式。并将档案信息与国土资源局的办公业务相关联,同时实现档案库房温湿度的自动监测。数字档案室建设的根本目的是利用虚拟化的网络优势、智能化的检索手段和先进的GIS技术,将档案信息进行集中统一管理,实现档案和图形的相互查询,方便、准确、及时地提供系统的档案信息资源,真正实现档案信息资源的共享,提高工作效率,加快我局的信息化建设。3建设意义建设国土资源局数字档案室的意义十分重大,将彻底改变传统的业务档案管理模式,充分利用信息化技术来提高国土资源局的业务档案管理水平,更好的为国土资源局的业务人员、办公人员、相关企业、个人提供服务。主要表现在如下几方面:1、国土资源档案管理模式的改变建立数字档案室,将改变原有的手工业务档案管理模式,采用电子化的业务档案管理模式,简化了流程,提高了档案管理人员的工作效率;大量的业务信息从业务系统中直接归档,减轻了他们的工作压力和难度;使档案管理人员从纯粹的档案管理中解脱出来,把工作重心放在如何利用好这些国土档案资源上来,做到职能从管理向服务及研究过渡。2、国土资源档案存储模式的改变建立数字档案室,将大大减少对纸质资料的查询,实物档案可以采用真空封存等技术来保管,降低了珍贵的纸质档案遭到破坏的可能性,减少了保存实物档案的经济成本。3、国土资源档案查询模式的改变建立数字档案室,可以直接使用档案管理系统对国土档案进行查询,也可以通过接口将档案查询集成到业务系统(如:OA系统/地籍系统)中,可以跨系统对国土档案资源进行访问,大大扩大了档案查询途径及查询效率,提高了档案的利用率。4项目的组织与实施4.1项目组织结构根据数字档案管理信息系统的特点和要求,为保证该工程项目能够按期、顺利、高质量的完成,成立了一些专门机构来管理、实施及监督项目的进度和质量。4.1.1项目管理层项目管理层的主要任务包括:1)组织各专业技术队伍,明确技术责任与实施方案;2)编制工程技术规范,计划进度,质量标准;3)负责组织各专业技术人员优质按时完成工程任务;4)确定各技术专业验收测试标准和验收测试人员;5)组织现场测试环境和完成各项技术指标测试;6)编写工程测试报告和工程验收报告;7)组织并完成系统开通运行等各项工作;4.1.2项目实施层设项目总监一人,负责监督项目的实施情况;项目设项目经理一人,对项目全权负责;下设七个小组,分别为需求组、设计组、数据组、编码组、测试组、文档组、服务组,各小组按项目流程协同工作,确保项目正常实施。各小组的职责和任务分别为:1)需求组:在项目实施前期完成项目的详细需求分析。2)设计组:在需求分析的基础上制定项目概要和详细设计方案。3)数据组:负责系统开发所需试验数据的整理、转化等工作。4)编码组:在详细设计的基础上进行软件的代码编写工作。5)测试组:软件开发过程中对软件进行整体的测试工作。6)文档组:负责项目实施过程中所有文档的整理、归类等工作。7)服务组:项目结束前期负责对我局工作人员进行培训和满意度调查等工作。4.2档案扫描实施方案4.2.1扫描过程管理加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。可采取相关参与人员签订安全保密协议书的方式。4.2.2整理登记纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。4.2.3扫描流程纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、装订、数据挂接等。档案整理、分类提卷档案信息数据库数据录入数据校对档案拆分档案扫描电子文件图像处理质量检验质量复检批量挂接库房档案整理、装订总质检档案归还光盘制作4.2.4档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。4.2.5目录数据准备规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。4.2.6区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描原稿。4.2.7拆除装订在装订物影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害,不允许裁切档案纸张。4.2.8页面修整破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。4.2.9扫描范围登记制作并填写待扫描纸质档案交接登记表单,详细记录待扫描档案盒号,案卷文件的起始页号和页数。4.2.10档案扫描4.2.10.1扫描方式(1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。(2)扫描时应根据纸质档案的材质选择相应的扫描设备,保证档案不受损。纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式,纸张状况好的档案可采用高速扫描方式以提高工作效率。(3)扫描时保证放纸端正、不压边、不漏扫、错扫、严格确保图像质量。4.2.10.2扫描色彩模式(1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值,以扫描后的图像清晰、完整,档案内容信息与档案原件一致为准。(2)页面为黑白两色,并且字迹清晰、不带插图的档案.可采用黑白二值模式进行扫描。(3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。(4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。对于年代久远、字迹模糊、纸张颜色和文本反差不大、斑迹较大等情况的档案采用灰度或24位彩色二种方式扫描。图纸、照片根据情况分别进行黑白、灰度或彩色扫描。有红色公章的材料采用24位彩色扫描。4.2.10.3扫描分辨率(1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。(2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择大于或等于150dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。(3)需要进行OCR汉字识别的档案,扫描分辨率建议选择大于或等于200dpi。4.2.10.4扫描登记填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。4.2.11图像处理4.2.11.1图像数据质量检查(1)对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。(2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。(3)文件漏扫时,应及时补扫并正确插入图像。对案卷中漏编的页面进行合页处理,确保扫描好的影像页数与原案卷页数一致。(4)扫描图像的排列顺序与档案原件不一致时,应及时进行调整。(5)同页有两个以上文件,需分别扫描或图像分割处理,并进行合页处理。(6)填写相关表单,记录质检结果和处理意见。4.2.11.2纠偏对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。4.2.11.3去污对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边、等应进行去污处理,还有去线孔等。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。4.2.11.4图像拼接对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。4.2.11.5裁边处理采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。图像处理后保证图像信息与原档案内容完全一致,不删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等。扫描的页面内容基本居中显示,不出现明显偏左或偏右现象。不准出现页面内容残缺或将其它页面信息扫入本页的现象。每页影像左右端正度控制在3度以内,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像进行旋转还原,以符合阅读习惯。不出现图像的一部分出现倾斜或扭曲而影响阅读的现象。厚的案卷装订线较近边角的档案内容会产生扭曲现象,需保证正文能看清楚。去污:在保证文件内容完整的前提下,影像页无扫描过程中带来的污斑,无黑边,外观达到清晰、平直、干净。对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等进行去污处理。处理过程中应遵循在不影响可读性和可理解性的前提下展现档案原貌的原则,由于档案本身因陈旧、破损或不洁等造成页面上有污点的,如果在页面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。保证扫描图像字迹清晰、颜色恰当,不宜过浅或过深,不出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,档案原件存在斑迹变质、颜色过浅、过深或深浅不一致,保证档案原件能辨认的扫描图像也必须可以辨认。纸张太薄或字体颜色过浓,扫描时倒映反面文字,文字上的污点无法去污时,保证正文文字可以看清楚。4.2.12图像存储4.2.12.1存储格式一般采用PDF格式存储,以文件为单位生成PDF文件,一个文件对应一个PDF文件,一份案卷对应一个或多个PDF文件。一个项目、工程、案卷分别对应一个文件夹,一个项目文件包括一个或多个工程文件夹,一个工程文件夹包括一个或多个案卷文件夹,一个案卷文件夹包括一个或多个PDF文件。4.2.12.2扫描件的命名纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。或以文件在案卷中的顺序号命名。4.2.13装订扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。装订不能损害档案原件。装订时应按原有顺序装订,案卷不掉页、左边和底边整齐,保持拆卷前的原貌;装订后由甲方负责检查,不符合要求的退回重新装订,要求一次性完成装订。并认真做好档案页码、页数的登记。4.2.14数据挂接实现档案数字化转换过程中形成的目录数据库与扫描件的挂接。以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录