移动公司某市营销中心文档影像系统实施方案建议书移动公司文档影像系统实施方案建议书-1-一、概述文档影像技术是随着计算机网络技术、数据库技术、影像技术、行为科学技术等多门类边缘学科的发展而逐步发展起来的新一代管理技术;文档影像是指以先进的影像技术为基础,配合相关的系统硬件,将纸面文档转换成电子影像文件;文档影像管理系统是指对经影像化处理的文档完成索引、查询、调阅、批改、存储等功能的一整套解决方案,通过方案的实施能有效的解决传统手工纸面凭证管理所无法解决的难题。移动公司文档影像系统实施方案建议书-2-二、目的通过建立文档影像管理系统,引入新一代的文档管理技术,为移动通信有限公司某市营销中心建立移动电话用户原始开户资料的影像资料库,以达到加强原始开户资料的管理、提高管理效率、降低管理成本、实现资料的快速查询及共享的目的。通过开户资料影像文档管理系统的建立,为日后移动公司其他地区的开户资料和内部的其它纸面文档的影像化管理树立一个参考范例。移动公司文档影像系统实施方案建议书-3-三、需求分析希望通过本项目的实施,对所有某市移动电话开户资料进行一次整理,将移动电话开户资料进行影像处理,文档影像的处理包括了开户资料的扫描、索引、保存、归档、查询等,具体需求如下:3.1.文档录入需求:目前移动公司某市营销中心需要处理的某市移动电话开户历史资料约100万份,若平均每份资料有2~4页,合约200~400万页纸需要录入文档影像系统以下以每份资料有4页来估计,预计2002年底的客户将达到150万,两项合计约600万页需要录入文档影像系统。3.2.归档需求:为方便以后查找原始单据,每批资料录入之前建立批号,录入后的资料放入对应编号的盒子或箱子送往仓库保管。这些编号将存入系统,在需要原始资料时可以尽快的查找它的位置。3.3.影像资料存储需求:2002年底的客户将有150万,预计将发展到500万。文档影像系统必须有足够的容量存储所有的单据影像并能提供安全的方案使这些资料保存20年。3.4.查询需求:系统能以电话号码成为依据,利用业务系统关系型数据库中资料作为查询的检索条件:客户姓名、手机号码、开户日期、证件号码等相关资料查询到用户原始单据的影像。能利用内部广域网实现在某市的各营业厅查询。3.5.流程需求:结合系统设备的特性和某市营销中心单据处理的具体要求,能提出科学的流程,使用较少的人手和较短的时间内完成现存的单据的录入。3.6.扫描要求:每日可扫描处理50000页以上的单据,因每一份用户的单据有3-4页,需通过分叶纸和条码技术将不同的用户单据分档。可双面扫描,扫描设备应有较强的容错性,能处理残破的单据,较少出现塞纸现象。3.7.存储要求:因平均每用户需录入4页单据,每页单据影像大小约50K字节,到2002年后移动公司的某市客户将有150万,所以系统存储容量必须大于500GB,并可以升级至1TG以上。并有足够容量的数据备份方案。移动公司文档影像系统实施方案建议书-4-四、文档影像系统介绍4.1.文档影像系统相关技术简介4.1.1图像扫描技术图像扫描技术是随着计算机的发展而出现的一种输入新技术。图像扫描仪能将各种文件档案,照片等资料以点阵图像的方式扫描输入进计算机,再由软件进行图像处理,文字识别,图文挡案管理等工作。扫描到计算机中的文档图像可以在屏幕上逼真地显示出来,也可以通过激光或喷墨打印机打印出来。因此,通过图像扫描技术计算机可以对各种文件档案进行原件扫描,原件显示和原件打印。目前广泛使用的平台式扫描仪能以黑白,灰度和彩色三种方式扫描,可针对不同原件由用户自己设定。——缺点:扫描速度慢,需要大量的人工干预。高速扫描仪是九十年代出现的新型专业扫描仪,主要针对大量文档的高速扫描。和普通平台式扫描仪相比,高速扫描仪有以下几个方面的特点:·扫描速度快,一般每分钟可扫描30~80页,最快的可达200多页,而平台式扫描仪每分钟在3页以下。·单、双面扫描:平台式扫描仪都只能单面扫描;如果文档两面都有内容,高速扫描仪可以一次同时扫描两面。·A3幅面,高速扫描仪最大扫描幅面可达A3。·黑白图像扫描质量高,高速扫描仪针对文字,图纸和图表档案扫描采用了特殊的二值化技术,使得它对黑白图像的扫描质量优于普通的台式扫描仪。·产品质量更高,使用寿命长。高速扫描仪可以连续扫描几十万页文档而不出故障,这样的扫描强度是普通平台式扫描仪无法比拟的。·价格高,购买普通平台式扫描仪一般只需几干元,而高速扫描仪需要十几万,甚至几十万元。高速扫描仪是专门针对大量文档扫描而设计的专业扫描仪。其高速度,高质量的扫描输入使得对大量文件档案的电子化工作变得轻松自如,而且电子化后的文档是原件存储,能够真实地再现原始稿件。4.1.2.软件开发技术移动公司文档影像系统实施方案建议书-5-文档管理软件负责电子化文档的扫描,压缩,存储,分类,查询,打印,备份和安全性管理等工作。其中对电子化文档的压缩和查询是整个文档管理软件的关键技术。文档压缩,计算机存储文档的原始图像需要较大的存储空间。以A4幅面的文字稿件为例,如果以200DPI扫描,存储一页文档图像大约需要450KB(未压缩)存储空间。使用图像压缩技术可以将之压缩5倍到50倍,文档内容越少,压缩倍数越大经过图像压缩后,一页A4幅面的文档存储量在4KB至100KB之间(根据扫描模式——黑白/灰度——确定大小)。文档查询,文档管理软件能够管理几百万甚至上千万页文档,如何快速地对这些文档进行分类查询是文档管理软件一项很重要的技术,基于微软Windows平台开发的文档管理软件采用多项界面查询新技术,使用户能很容易地查找到所需要的文档、并能根据需要随时打印出这些文档的复印件。除了文档管理功能之外,还可以实现电子邮件,Internet查询,工作日程安排以及工作流管理等工作。4.1.3.海量存储技术大量文档的存储管理离不开海量存储技术。目前主要采用MO,CD和DVD光盘库,光盘塔技术和外置磁盘阵列。4.1.3.1.CD-R,也就是常说的CD-ROM,一张CD盘片的存储容量为650MB。100张650MB的CD盘片可存储300万张A4文档原件。读CD盘需要为计算机配备CD-ROM驱动器。如果既需要读也需要写CD盘片,那就需要配备刻录机(CD-R)。4.1.3.2.DVD光盘库,是今后发展的趋势。5.25英寸盘片大于1.3GB的容量。目前的最小光盘库是100片。4.1.3.3.光盘塔是CD-ROM技术的扩展,一个光盘塔可同时装载几十片甚至上百片CD盘片,容量也在几十GB以上光盘塔内有若干个刻录驱动器,读写时光盘塔能自动将要读写的CD盘片放入刻录驱动器中。4.1.3.4.MO光盘库,是采用光磁介质,技术比较成熟,速度较快。每张盘的最大容量是5.2GB,支持可擦写、一次性写入(CCW)及LIMDOW(直接重写)等方式,使用比较方便,槽数由20至278不等,但盘片的价格略高。电子化文档原件管理需要配备海量存储设备。单机使用时可采用MO或只读CD设备,由人工选择插入盘片。网络共享使用时需要采用光盘库或光盘塔设备,实现移动公司文档影像系统实施方案建议书-6-文档原件的网络共享。4.1.3.5.外置磁盘阵列,采用硬盘的磁盘阵列的技术,技术成熟,读写速度最快,可以满足网络多用户的在线访问要求。不同于内置的磁盘阵列,与服务器的操作系统结合度不高,容量更大,扩充性更灵活,可以组合成SAN、ENS等存储网络。4.2.系统结构:系统结构如下图所示:4.3.系统硬件配置:4.3.1.高速扫描仪:COPISCAN8000系列产品是BELL&HOWELL最先进的文档影像产品。COPISCAN8000系列具有state-of-the-art进纸技术,这可以有效的消除其他扫描仪经常出现的塞纸现象。它支持小到名片大小,大到A3纸的文档在其上进行扫描。COPISCAN8000系列的扫描速度最快可达100页每分钟,并具有内在特征来保证图像的清晰易读性。8000系列是一种复式扫描仪,它可以同时进行双面扫描。不象其他复式扫描仪,8000系列的扫描速度不会受单面和双面的影响。8000系列具有一个增强的扫描软件,它提供易用及其它软件不可比的功能。它支持多页显示、图像增强、旋转、扭正及其他功能。它还允许用户通过重扫描、删除和重排页面等选项来进行模拟质量检查。FB系列扫描仪是Bell&Howell提供适应不同扫描要求的文档影像产品,包括横向进纸扫描速度为34页/分钟的500型,46DB数据库服务器文件服务器索引客户端扫描客户端Web服务器WindowsNTIIS远程查询WebBrowserWindows98影像系统Windows98影像系统数据库大容量存储设备文件管理器扫描仪扫描软件WindowsNTWindowsNT查询客户端Windows98影像系统移动公司文档影像系统实施方案建议书-7-页/分钟的1000FB型,和65页/分钟的2000S/D型。本系列内置全自动进纸器(ADF),能够处理最大达12x17英寸的纸张,而且不同厚薄,甚至是有折痕的纸张也能得到很好的处理。同时它的扫描平板,能自如地处理装订成册和破损的文件。4.3.2.数据库和图像服务器:数据库服务器用来存储索引数据。数据库服务器的核心是一个Oracle数据库,它用来存储所有图像的索引信息。图像服务器用来存储影像文档。图像通过扫描工作站上的扫描仪被扫描,他们在虚拟的QC过程中被下令提交时送到图像服务器。为了确保图像的完整性,服务器中的图像不能被删除和修改。数据库服务器我们的建议配置为PentiumIII800、512M内存、磁盘冗余。4.3.3.存储设备和备份设备:用于存储和备份影像文件,由于是海量数据,必须选用容量足够大和便于管理的设备,如磁盘阵列、CD/DVD库和MO库等。现通用的低端外部磁盘阵列有EMCCALRIION、PROCOMNETFORCE;CD/DVD库有CYGNETID100光盘库,MO库有MAXOPTIXMX6。4.3.4.条码打印机:Zebra条码打印机是性能最好的工业标准的打印机,Z4000可以满足24小时工作的需要。4.3.5.用户工作站:用户工作站是指在WINNT平台上运行思迅索图客户端程序的个人电脑。我们的建议配置为PentiumII、128M内存、10G硬盘。另外,大屏幕(20”或21”)高分辨率的显示器将有助于提高显示图像的质量。4.3.系统软件配置:4.4.1.索图软件:将通过对由高速扫描仪批量扫描生成的大量有逻辑关系的Tiff、BMP、GIF、JPG等格式的影像文件按用户自定义的数据格式,自动地或人工地建立索引、进行归档处理,从而实现对大批量客户或业务资料影像文件的存储、管理和查阅等功能。本系统为Client/Server结构,同时支持以浏览器为前端的三层Web结构。其主要功能有:快速索引、表单生成器、查询界面生成器、影像查看器、权限管理。4.4.2.一扫通软件:于系统前端的基于高速扫描仪的扫描仪驱动和条码、图像识别软件产品,支持任何品牌的扫描仪。对条码的识别率高达99%,给后面对图像文件移动公司文档影像系统实施方案建议书-8-的处理、建立索引和归档提供了良好的保证。对扫描图像处理的功能使用户可以调整图像质量。4.4.3.条码通软件:通过安装此选件,用户可以方便的从其现有数据库中提取需要的关键字,组成相关条码,并通过条码打印机打印出来。4.4.4.INTERNET图像查询网站软件包:通过安装INTERNET网上查询系统,用户可以在各个位置利用网上浏览工具(如IE,NETSCAPE),通过INTERNET查询所需要的资料,查询快捷方便。4.5.数据备份4.5.1.数据库备份:系统采用ORACLE数据库,占用空间主要的数据量是影像文件的索引记录。若以每个记录的大小是500B,150万份资料的数据库空间约是0.75GB,1000万份资料的数据库空间约是5GB。备份的方法有很多种,例如硬盘、MO、磁带机等。4.5.2..影像文件备份:若每页文档的影像文件大小是50KB,1000万页的空间是500GB,2000万页的空间