纸质档案数字化技术规范介绍2009年4月丹东市文书立卷改革暨档案数字化工作培训班主要内容一、《规程》基本情况二、纸质档案数字化技术规范三、照片档案数字化技术规范四、声像档案数字化技术规范一、基本情况1、编制的原则和依据2、研究、起草过程3、数字化范围1、编制原则系统性原则档案信息是国家信息化建设工作的一个组成部分,档案的数字化也是档案信息管理工作的一个方面,技术规范的制定应符合国家信息化建设有关技术要求,保证可持续性发展。1、编制原则通用性原则应基本满足国内正在进行的档案数字化工作,对档案数字化的结果数据要给予较明确的指标要求,以保证数据的通用交换能力。1、编制原则先进性原则在制定过程中对目前比较常见的档案数字化技术进行论证评估,同时也要对新出现的技术进行研究。基本思路是肯定成熟技术,探讨新技术发展态势,适当进行指导。1、编制原则实用性原则作为技术规范首先要把握宏观指导原则,对于档案数字化具体实施步骤、方法,应给予较明确的规范要求,以及在加工过程中所需的技术参数给与较明确的指标要求,提高本规范的实用效果。1、编制原则适度性原则就是合理地确定一些需要统一的技术范围和技术指标。范围过大或者过小,指标水平过高或过低,都会对标准的实施效果产生不良影响。编制依据GB/T18894–2002电子文件归档与管理规范DA/T18-1999档案著录规则DA/T22-2000《归档文件整理规则》档发[2001]6号档案管理软件功能要求暂行规定DA/T31—2005纸质档案数字化技术规范2、研究、起草过程丹东市档案馆从1993年开始进行档案的数字化的工作,对纸质档案、缩微胶片档案、照片档案、工程图纸、电影胶片等多种载体的档案进行了数字化转换,有一定的实践经验,有针对性的对各种载体数字化的技术参数进行了反复试验、比较,取得了较科学、合理的技术参数。并参考了国家档案局的相关标准和规范,借鉴了兄弟单位的研究和实践成果。3、数字化范围纸质档案纸质档案包括文书档案、专门档案等门类。3、数字化范围文书档案文书档案数字化范围包括永久和长期保存的重要的文件正本。3、数字化范围文书档案文书档案适用涉密数据制作环境要求的范围1密级文件,包括绝密、机密、秘密的文件材料。2上级机关颁发的不易公开的文件材料。3本机关党组(或实行党委制的党委)、行政领导会议记录。4本机关或本机关汇总的统计报表。5人民来信、来访材料及本单位处理人民来信、来访形成的记录。3、数字化范围文书档案文书档案适用涉密数据制作环境要求的范围6本机关党员、干部、职工名册。7涉及司法、监察、纪检及组织人事工作中对有关人员违纪违法的调查与具体审理处理情况形成的文件材料。8本机关及本机关办理的干部、工人的转移工资、行政、党、团、工会组织介绍信及存根。9本机关财产、物资、档案等的交接凭证、清册。10下级机关报送的不易公开的文件材料。3、数字化范围专门档案本机关形成的,可以对社会提供利用的、利用率较高的专门档案应数字化。3、数字化范围照片档案1本机关召开的工作会议、业务会议、表彰会议、代表会议等形成的照片。2上级领导、社会著名人物来本机关检查、视察、指导工作形成的照片。3本机关历届领导人的照片。4本机关主办或承办的重大活动的照片。5本机关重要外事工作形成的照片。6本机关获得的省级以上各种荣誉(如奖状、锦旗、奖杯等)翻拍形成的照片。3、数字化范围录音录像档案1本机关召开的工作会议、业务会议、表彰会议、代表会议等形成的录音、录像带。2上级领导、社会著名人物来本机关检查、视察、指导工作形成的录音、录像带。3本机关在职能活动中主办或承办的重大活动的录音、录像带。4本机关重要外事工作形成的录音、录像带。5本机关发生的重大事件、事故形成的录音、录像带。6新闻媒体报道本机关的信息、新闻报道。二、纸质档案数字化技术规范主要内容基本原则基本工作流程基本技术参数技术实现方法成果管理二、纸质档案数字化技术规范基本原则是使档案信息资源准确方便快捷地提供利用;使可以公开的档案信息资源得到共享,以满足社会各界对档案利用的需求。二、纸质档案数字化技术规范数字化对象的确定原则1)符合国家法律法规的原则:符合国家档案开放规定。2)价值性原则:属于归档范围且应永久或长期保存的、社会利用价值高的。二、纸质档案数字化技术规范基本环节档案整理目录建库档案扫描图像处理图像存储数据挂接数据质检和验收数据备份成果管理二、纸质档案数字化技术规范过程管理1、应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。2、在数字化工作的同时建立起完整、规范的加工记录。即各个环节均应进行详细的登记,并及时整理、汇总,装订成册(形成加工档案)。(一)档案整理1、目录数据准备2、拆除装订3、区分扫描件和非扫描件4、页面修整5、整理登记6、档案装订(一)档案整理1、目录数据准备按照《档案著录规则》(DA/T18)、DA/T22-2000《归档文件整理规则》和《丹东市文书档案目录数据库结构和交换标准(试行)》等标准的要求,规范档案中的目录内容。(一)档案整理目录数据准备一是确定档案目录的著录项、字段长度和内容要求;二是修改错误或不规范的目录内容,如案卷名、文件名、责任者、起止页号和页数;三是没有目录的档案按照原件内容建立目录。(一)档案整理2、拆除装订不去除装订物影响扫描工作的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。(一)档案整理3、区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:重份的文件,有正式件的文件可以不扫描原稿。(一)档案整理4、页面修整对纸张破损严重、无法直接进行扫描的档案,应先进行技术修复。如折皱不平的原件应先进行压平或烫平,再进行扫描。(一)档案整理5、整理登记详细记录档案整理后每份文件的起始页号和页数,(一)档案整理6、档案装订扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持卷内档案的完整,档案的排列顺序不变,做到准确、无遗漏。(二)档案扫描1、扫描方式2、扫描色彩模式3、扫描分辨率4、扫描登记(二)档案扫描1、扫描方式根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描仪进行扫描;纸张状况好的档案可采用高速扫描已进行扫描,以提高工作效率。(二)档案扫描2、扫描色彩模式黑白二值----页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。灰度模式----页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。彩色模式----页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。(二)档案扫描3、扫描分辨率采用黑白二值、灰度、彩色几种模式进行扫描时,其分辨率一般建议选择≥200dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。(二)档案扫描4、扫描登记认真填写相关登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。(三)图像处理1、图像数据质量检验2、补扫3、纠偏4、去污5、图像拼接6、裁边7、图像处理登记(三)图像处理1、图像质量检验对档案漏扫、图像偏斜度、清晰度、失真度等进行检查。发现不符合质量要求时,应对图像进行相应的处理。发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。(三)图像处理2、(补扫)对操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新进行扫描。发现文件漏扫时,应及时补扫并将图像插入正确位置。(三)图像处理3、纠偏对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。(三)图像处理4、去污对图像中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。(三)图像处理5、图像拼接对大幅面档案进行分幅区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的完整。(三)图像处理6、裁边处理对采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。(三)图像处理7、图像处理登记记录质检结果和处理意见。(四)图像存储1、存储格式2、图像文件的命名(四)图像存储1、存储格式1)采用黑白二值模式扫描的图像文件,用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,用JPEG格式存储。存储时的压缩率的选择,应保证图像清晰可读,尽量减小存储容量为准则。(四)图像存储TIFF格式(TagImageFileFormat标记图像文件格式)通常用来描述产生于扫描仪的数据,被用于专门存储灰度值、二值的标准格式。(四)图像存储JPEG格式(JointPhotographicExpertGroup联合图像专家组)是一种“有损”压缩的文件格式,已经成为非专业数字照像和在互联网上应用的标准格式。(四)图像存储2)提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。(四)图像存储2、图像文件的命名1)纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。如:72-1-101-12)多页文件可用该档号建立相应文件夹,按页码顺序对图像文件命名。(五)目录建库1、数据格式选择2、档案著录3、目录数据质量检查(五)目录建库1、数据格式选择目录建库应选择通用的数据格式。所选定的数据格式应符合《丹东市文书档案目录数据库结构和交换标准(试行)》的要求。(五)目录建库2、档案著录按照《档案著录规则》(DA/T18)和DA/T22-2000《归档文件整理规则》和《丹东市文书档案目录数据库结构和交换标准(试行)》的要求进行著录,建立档案目录数据库。(五)目录建库3、目录数据质量检查采用人工校对或软件自动校对的方式,对目录数据库的质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应进行修改或重录。(六)数据挂接1、数据汇总2、数据关联3、数据挂接4、数据挂接质量检查5、核对登记(六)数据挂接1、数据汇总将已形成的目录数据与图像数据,通过进一步核实数据,检查文件名、页数、文件数、档号的唯一性等,及时进行汇总。(六)数据挂接2、数据关联要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同。(六)数据挂接3、数据挂接通过编制程序或借助相应软件,实现目录数据与相关联的图像的自动挂接。(六)数据挂接4、数据挂接质量检查对图像文件与目录数据的挂接质量进行检查,核对目录与图像文件对应是否准确,发现不合格的应及时进行修改。(六)数据挂接5、核对登记填写相关登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。(七)数据验收1、数据抽检2、验收指标3、验收审核4、验收登记(七)数据验收1、数据抽检1)以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。2)一个全宗的档案,数据验收时抽检的比率不得低于5%。(七)数据验收2、验收指标1)目录数据与图像文件挂接错误,或目录数据、图像文件出现不完整、不清晰、有错误等问题时,质量标记为“不合格”。2)一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。合格率=抽检合格的文件数/抽检文件总数×100%(七)数据验收3、验收审核验收“通过”的结论,必须经分管