汉王OCR技术地税行业应用方案汉王OCR技术在地税部门应用方案一、背景概述:我国信息产业技术的不断发展,使得地税行业与IT的结合越来越紧密,各地税局日常工作的信息化成为地税局的首选,由于我国经济水平的不断提高,税收征管工作中的税单录入工作成为地税行业的一大难题,因此需要快捷、准确、高效地实现税单录入存档工作,提高办公效率,缩短税收征管时间,所有这一切都可通过日益完善的OCR技术加以解决。OCR技术的广泛应用,创造了巨大的社会价值,成为地税行业建立影像索引并替代人工录入工作的重要手段,地税票据业务电子化处理系统对提高地税行业的征管系统的效率,开展对外电子商务业务有很大促进作用。北京汉王科技公司凭借在OCR识别研发的技术优势,结合地税行业的特点,推出汉王OCR技术在地税行业的解决方案,汉王科技公司将永远致力于地税行业信息技术处理水平的提高,加快税收征管工作的步伐,同时提高税务票据档案管理的工作效率。二、OCR技术简介:OCR是英文(OpticalCharacterRecognition)的缩写,意为光学字符识别。通过光学扫描仪和计算机的配合,OCR软件将图象数据进行运算分类后,将图象数据转化为计算机内码。可以极大地减轻数据录入工作的强度、提高数据录入的速度。汉王OCR票据识别系统是OCR产品中最先进、应用效果最好的产品,具有强大的识别功能,同时可以提供表格数据之间的逻辑和算术运算关系,并针对表格形式设计了独特的处理功能,能够满足税务部门对数据的要求。税务部门将纳税人填写好的报表放到OCR扫描设备上,设备自动扫描读取数据,此OCR系统既可选择单张报表扫描识别,也可选择多张或多用户报表同时扫描识别。如果有填写不清楚的地方,系统会自动提示有误,并将此不清楚的字符的图像单独显示在屏幕上,有操作人员根据图像进行修改,无需重新查找该报表;如果出现运算错误或逻辑关系不对,系统可通过表内数据逻辑运算关系自动检查,并将错误提示出来,有操作人员进行修改,直至完全正确后,生成文本文件,输出到指定的目录。三、系统结构图:税务表格识别识别内容字符识别正确表格有错误表格表格制作表格定义表格扫描表格识别数据输出系统组成:汉王OCR地税行业票据识别系统(SDK),主要应用于税收征管系统,税务票据档案管理系统,个人所得税征收系统的税单识别录入,存档工作。(一)识别流程图:(二)工作流程:1、税务征管系统流程图:纳税人申报税务所税务档案数据处理中心稽查所税务档案业务科室税务档案光盘库税务档案库房办公室行政档案库邮寄录入邮寄OCR申报表录入图像扫描原始分析图像扫描原始文件错误手写体识别票据种类印刷体识别地税票据图像入库存储正确识别扫描人工介入识别2、税务档案系统流程图:四、汉王OCR在地税票据识别中应用:在地税的税收征管工作中,所得税管理处,营业税管理处,地方税管理处,等二十几种税单的录入工作量非常巨大,因此需要汉王OCR技术提供相应的方案来解决地税票据的识别录入问题汉王OCR技术录入速度快,准确率高。纳税人税务分局OCR录入订正邮寄的报表应用系统数据库文本数据手工录入税务所错误的报表更正的报表手工录入的表格档案录入光盘库图像档案汉王OCR地税票据识别技术主要应用于地税征管处,档案处,由各处相应的录入人员对各种税单进行录入,校对存档.例如对各种税收缴款书的识别录入,象车船使用税等。地税各征管处,档案处是各种税单录入量最大的机关,尤其是在地税档案处,要对大量税单进行录入,汇总,存档工作.所以更需要汉王OCR识别技术的得力帮助。汉王OCR技术主要是对定制表格的识别,手写数字,汉字,印刷体数字汉字的识别,而且识别技术一直处于国内领先地位.是国家863计划项目的重要组成部分。3、地税系统表格录入方式比较(见下图)运行环境:IntelPentiumⅡ266MH以上处理器简体中文win95/98/2000,Nt4.064M内存以上五、汉王OCR识别系统的优势在我国诉讼法规定的七种证据中,并不包括电子数据,电子证据的法律效力亦无明确规定,但可以肯定的是,因为容易伪造和篡改再加上由于人为的因素或环境和技术条件容易出错,电子证据一般不能作为直接证据,这意味着电子证据不能单独、直接地证明事实,即没有独立的证明力。而我国法律实行谁主张权利,谁负责举证的原则,当事人必须就自己所述事实向法庭提供。这就将使用电子数据而无原始凭证的当事人置于不利地位,使电子数据应用领域出现法律关系不稳定局面。企业投资技术要求操作安全性、准确性较大较高较复杂不安全磁盘上报需购买微机设备及磁盘、打印机税税务人员和纳税人员均需具备计算机相应知识需先将数据录入到计算机中,再复制到磁盘中纳税人计算机可能含有病毒,可能导致税务部门的计算机系统紊乱;且磁盘易损坏较大较高较复杂不十分安全IC卡申报需购买报税机(400-1200元左右)、IC卡税务人员和纳税人员均需了解报税机及IC卡、系统软件等知识录入及修改界面不十分友好,查询不方便因为数据存在IC卡里,一旦数据有错误,税务机关不能及时发现更正非常大较高较复杂不安全网上报税需购买专业微机、打印机、调制解调器等设备及相应的软件(几千--几万元),网络传输的费用也比较大税务人员和纳税人员均需了解计算机及网络相关知识纳税人需先录入数据,再通过网络传输;如果网络有问题,需多次重复传输因无法建立专用网络,用公用网络容易导致数据丢失非常小很低很简单较安全OCR每月只需投入表格费用(约几元钱)纳税人员只需了解表格的填写方法;税务人员只需了解OCR设备及相应软件的操作方法纳税人员需填写几张表格数据通过表格传递,有原始资料可查,数据的采集在税务机关进行,可充分保证其安全性汉王OCR技术正是合适的解决方案。汉王OCR技术是通过光学技术对字符识别,即通过光学扫描仪和识别软件相结合,将手写体数据信息进行录入与处理的一项技术。该技术事实上提供了由手写数据进入抽象的数字化处理空间的入口,数据信息源于手写单据,而最终在计算机系统中得到处理。当数据出现错误或丢失或是系统出现混乱时,可以参照作为原始凭证的手写单据重新处理,而不会出现无据可查的局面。六、合作方式:1、与各系统集成商签代理协议书。2、与客户实行嵌入式合作(SDK),汉王OCR技术可以嵌入地税征管系统中,也可以嵌入地税档案管理系统中。