数字化档案室系统方案二〇〇九年九月目录第1章方案概述...............................................-3-第2章系统架构与优势.........................................-5-2.1系统架构.................................................-5-2.2系统优势.................................................-6-第3章总体设计方案...........................................-8-3.1软件系统.................................................-8-3.1.1系统软件.............................................-8-3.1.2扫描加工软件.........................................-9-3.1.3数字化网上档案管理软件..............................-13-3.1.4CEB版式格式转换子系统................................-18-3.2硬件系统................................................-20-3.2.1硬件拓扑结构........................................-20-3.2.2硬件设备配置建议....................................-21-第4章技术特点..............................................-23-4.1支持各种档案标准........................................-23-4.2支持存储管理多种类型档案................................-23-4.3支持可定制的编目体系....................................-23-4.4支持跨类型档案库的关联..................................-24-4.5支持跨库检索............................................-24-4.6支持全文检索及多种检索方式..............................-24-4.7支持数字化与传统管理方式并存............................-24-4.8支持传统案卷与以件为单位的双轨制档案管理模式............-25-4.9支持对不同种类信息资源的集中管理........................-25-方正博通数字化档案室方案-3-第1章方案概述按照东莞市数字化档案室建设指引要求,进一步提高机关单位和镇(街)档案室的档案管理和数字化处理工作水平,以适应电子政务发展需要。我们提供方正博通数字档案管理平台方案,为东莞市数字化档案室建设,提供数字化公文档案一体化管理应用的具体解决方案。随着档案的现代化管理、数字化应用建设重要性的不断提升,许多政府机关、军队、企事业单位,尤其是专业的档案管理单位面对大量的文书、图片、照片、视音频等资料的档案管理,都显得无所适从。传统的档案管理系统大多都只是侧重在于文书档案、电子公文档案的计算机辅助管理,对图片、照片、视音频以及办公过程中需要归档的公文等其他形式的数字化档案没有提供相应的支持(或相对较弱),方正博通数字档案管理平台采用方正博思内容管理平台作为基础数据管理平台,利用方正博思对各种类型数字档案管理的优势,同时结合传统的档案管理业务,构造了一个既能同时管理数字化档案、图书资料,又能够对传统档案管理提供支持的数字化档案管理系统平台,这就是方正博通数字档案管理平台。方正博通数字档案管理平台提供面向档案馆和档案室两种产品方案,档案馆方案适用于国家各级综合档案馆;档案室方案适用于各级政府机构,公检法、国家科研、教育等机关、事业单位的档案处(室)、机要室、保密室等立档单位。整体设计理念方案整体设计理念贯穿档案“三个一体化”的建设,即:“文档一体化”“馆室一体化”“馆网一体化”“文档一体化”顺应国家电子政务建设要求,实际应用中,各级政府机关、军队、企事业单位重要工作内容就是日常的收文、办文和发文。电子政务中的办公自动化系统、业务系统、科研系统建设主要实现文件管理的高效运作,提高行政管理水平和业务管理能力,面向针对文件创建和文件处理过程。档案管理在一方正博通数字化档案室方案-4-定程度上是文件处理环节的延续,对归档的文件进行进一步管理,其在有价值公文的长期保管,价值挖掘,信息开发方面发挥着重要作用,同样在电子政务建设中不容忽视。尤其是新时期电子文件的大量形成,要求档案同样能够管理电子文件,并最终形成电子档案。因此文书、档案共同构成档案信息资源的整体,为资源的形成、开发与利用在国民经济中扮演着重要角色。文档一体化应用模型参见下图所示。(图示:文档一体化模型)“馆室一体化”强调档案管理的系统性、规范性,各级档案管理机构应该遵循统一的管理流程和规范,实现上级档案馆和各立档单位在管理上的“上下统一,步调一致”。在上级档案馆与政府机关、企事业单位的立档单位之间开辟通畅的信息上传下达通道。“馆网一体化”将档案管理的价值提升到信息共享与信息服务高度。档案业作为承载政务信息资源开发与利用的核心机构,通过对档案信息的挖掘,提升信息利用价值,使其成为各级政府政务公开、信息服务的工具,服务内外部用户,更好的为国家经济建设提供信息资源。方正博通数字化档案室方案-5-第2章系统架构与优势数字化档案室是立档单位集成现代信息技术及数字处理技术,通过网络化的档案信息系统收集、管理、利用数字化档案信息资源,建立档案目录数据库和全文数据库,并以网络为媒介提供利用服务的现代化档案室。方正博通数字化档案室系统是符合国家档案局关于《档案管理软件功能要求暂行规定》及《归档文件整理规则》的档案管理系统。覆盖了收发文单位至档案处(室)的文档流转全过程的生命周期。贯穿文档一体化管理理念,可以管理从纸制文件原件扫描、全文录入、电子文件自动归档处理、目录管理、编研、检索、全宗管理的全部环节。通过扫描加工软件和电子文件归档采集系统完成数字化档案创建过程,通过鉴定组卷子系统、档案管理子系统完成归档文件整理及提供档案利用服务的全部过程,通过档案移交模块支持将档案向档案馆自动移交。2.1系统架构方正博通数字化档案室系统囊括了相关职能部门向档案室(保密室)归档及档案管理、档案利用以及各立档单位档案室向上级档案馆移交档案的全过程。其应用目标是将日常数字化办公流程中的数字档案与传统介质形成的物理档案的数字化文档进行统一的管理利用。方正博通数字化档案室方案-6-图:方正博通数字化档案室系统结构图2.2系统优势支持国家档案局颁布的各项业务、技术和管理标准支持存储管理文书档案、音像档案、科技档案、照片、会计、实物档案等多种类型档案平台化产品设计,模块化组件,丰富的二次开发接口易于系统灵活扩展跨库检索和高效便捷的全文检索方式跨种类信息资源库的内容关联,实现跨公文、档案、图书、文献资料不同信息的关联检索开放的J2EE三层技术架构,支持跨平台、跨数据库运行,保护用户IT投资遵循XML数据交换规范和开放的元数据体系,易于系统扩展采用业界领先的内容管理技术、知识管理技术、全文检索技术,构建功能强方正博通数字化档案室方案-7-大可灵活定制的各类档案信息管理平台B/S模式客户端只需安装IE浏览器即可使用系统,便于网络查询和降低运维成本高保真多媒体图像压缩,提高电子档案网络查询效率无缝集成文字、照片、音视频档案专业数字化加工工具、全文检索工具和CEB版式文件转换工具方正博通数字化档案室方案-8-第3章总体设计方案东莞市数字化档案室总体建设应包括硬件系统和软件系统两方面。下面分别阐述软硬件系统设计方案。3.1软件系统方正博通数字化档案室软件系统主要由系统软件和应用软件构成,具体由以下部份组成:系统软件:①操作系统②数据库系统③应用服务器中间件应用软件:④扫描加工软件⑤数字化网上档案管理软件⑥全文检索软件⑦CEB版式文件转换软件3.1.1系统软件方正博通数字化档案室系统采用J2EE三层体系架构设计,支持跨平台、跨数据库运行。完全支持客户选择的服务器操作系统采用Windows2000Server或Windows2003Server;以及选择的服务器数据库采用MSSQLServer2000或MSSQLServer2005,或其它主流操作系统和数据库系统。由于机关档案室数据量和访问量不大,应用服务器中间件建议可采用免费的Tomcat,也可以在数据量、用户访问量大幅增长的情况下,选择Weblogic、Websphere等大型应用服务器中间件系统。方正博通数字化档案室方案-9-3.1.2扫描加工软件扫描加工主要采用以下关键技术:影像扫描和处理技术对纸质档案、缩微胶片等进行扫描数字化,支持批量扫描和自动命名功能,并可灵活调节扫描精度,满足后续处理和复制传播的需求。对影像进行版心定位、纠斜、去噪、阈值调整、自动提取和自动转换等功能。影像版面分析技术对扫描影像进行版面分析,形成版面区域和档案的内在关联,确定文字、图片区域,并提取常规标引内容,按照卷名、档号、年代等层次建立基本的档案文章结构;文字自动识别和智能校对技术采用先进的OCR文字识别引擎进行识别,,并依据质量规范实现文本的编改和校对处理采用智能化的逐字折校和聚类通校两种方式,在直接校对的内部还采用了先进的语义校对,极大限度地提高校对的效率和质量一般质量标准为文字错误率不超过0.03%,可通过工艺配置满足更高的质量要求结构化信息标引标注技术对后期文本进行结构化标引工作,包括字段提取等处理。特殊情况下,会根据要求定制来源、以及分类、专题等主题标引信息字库技术对于生僻字,采用补字造字方法,依据一定的编码标准形成规范字库1、纸制文档数字化加工子系统本系统主要包括方正博思文档扫描系统和方正锐思中文识别系统。方正文档扫描子系统主要提供四个部分的主要功能:文档扫描、文档管理、图像加工及文档著录、文档入库。方正博通数字化档案室方案-10-文档扫描包括文档扫描控制及扫描参数设置两个主要控件,如对全宗号、保管期限、年度、卷号、件号、页号以及扫描设备、参数调节等。文档管理包括根据档案的案卷标准,对建立的文档管理结构树进行管理。支持与档案目录数据自动挂接。文档管理结构树包括对全宗、保存期限、年份、卷号、件、页等七种档案属性进行管理,同时文档目录结构树是可以根据用户的需求调整以及各种增、删、改的操作。文档管理结构树具有的灵活的可定制性,增强了系统的扩展性。图:文档管理结构树方正博通数字化档案室方案-11-图像加工功能是文档扫描子系统中的图像处理部分,包含主界面上一些简单的图像处理操作,图像处理的工具按钮如图所示:在文档扫描子系统中还挂接了专业的图象处理工具,通过它可以将档案在保存过程中遗留的残痕,在保存原始性的同时进行有效的修复。数字水印功能是支持编辑和插入背景水印,水印可以是文字,也可以是图片。允许设置水印显示位置和透明度等参数。提交入库功能可与数字化网上档案管理软件无缝集成,数据直接上载到相应门类档案数据库。方正中文文字识别系统包括公文扫描图像的获取、公文图像版面分析、公文文字识别及编辑校对、半自动公文标引实现一次著录和公文上载几方面的功能。扫描图像的获取有两种获取图像的方法,一种是直接输入存储介质中已有的图像文件;另一方面是通过扫描图像获取。图像版面分析是对图像进行识别前的版面处理工作,目的是为识别作准备,包括画框、自动纠斜、旋转等操作。版面分析