基于数字结构特征的印刷体数字识别方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1论文题目:基于数字结构特征的印刷体数字识别课程名称:图像处理与分析学院:信息科学与工程学院①学生姓名:任磊专业:计算机应用技术学生学号:2013419职位:组长②学生姓名:李铁鑫专业:计算机应用技术学生学号:2013420职位:组员③学生姓名:高智专业:计算机应用技术学生学号2013423职位:组员指导老师:邵虹基于数字结构特征的印刷体数字识别1基于数字结构特征的印刷体数字识别任磊1,李铁鑫2,高智3(1.沈阳工业大学信息科学与工程学院研究生1316班计算机应用技术2013419;2.沈阳工业大学信息科学与工程学院研究生1316班计算机应用技术2013420;3.沈阳工业大学信息科学与工程学院研究生1316班计算机应用技术2013423)摘要:字符识别是模式识别研究的一个重要领域,通过无数人大量的努力,已经取得了丰硕的成果和发现。但是,针对具体和特殊应用的特点的字符识别仍然有很大的研究空间和价值。数字识别是光学字符识别的一个重要研究方向和组成部分,主要是指使用计算机来自动识别阿拉伯数字。一个有效的,可靠的,快速的数字识别系统同时具有很重要的商业用途。本文主要研究脱机的印刷数字的识别,提出了基于数字结构特征的印刷体数字识别方法。本文基于数字识别系统的六层模型(图像获取、图像预处理、图像二值化、数字分割和归一化、数字特征提取、特征分类器六个层次),研究实现每个阶段的算法。通过实验,将本文提出的方法和基于改进的左右轮廓特征的印刷体数字识别方法进行了对比。实验结果表明本文提出的识别算法拥有较好的精度,对噪声和字形变化具有很好的鲁棒性。关键词:印刷体数字识别;特征提取;模板特征匹配;数字结构特征PrintedNumeralRecognitionBasedOnDigitalStructureFeatureRenLei1,LiTiexin2,Gaozhi3(1.Shenyanguniversityoftechnologyinstituteofinformationscienceandengineeringgraduatestudentclass1316computerapplicationtechnology,2013419;2.Shenyanguniversityoftechnologyinstituteofinformationscienceandengineeringgraduatestudentclass1316computerapplicationtechnology,2013420;3.Shenyanguniversityoftechnologyinstituteofinformationscienceandengineeringgraduatestudentclass1316computerapplicationtechnology2013423)Abstract:Characterrecognition,isanimportantfieldofpatternrecognition,withthehelpofalotofeffortsmadebymillionsofpeople,hasachievedfruitfulresultsandfindings.However,inthelightofthecharacteristicsofconcreteandspecialapplicationofcharacterrecognitionstillhasalotofresearchspaceandvalue.numeralrecognition,animportantresearchdirectionandcomponentoftheopticalcharacterrecognition,ismainlyreferstousecomputertoautomaticallyidentifyArabicnumerals.Anefficient,reliable,fastnumeralrecognitionsystemalsohastheveryimportantbusinesspurpose.Thispapermainlystudiestheofflineprintednumeralidentificationandproposetheprintednumeralrecognitionmethodbasedonnumeralstructurecharacteristics.Basedonthesixlayermodelofnumeralrecognitionsystem.(Thissixlevelsimageincludingacquisition,imagepreprocessing,imagebinaryzation,numeralsegmentationandnormalization,featureextractionandfeatureclassifier.),researchandrealizethealgorithmofeachphase.Throughtheexperiment,themethodproposedinthispaperarecomparedwithandtheimprovedprintednumeralrecognitionmethodbasedoncontourfeaturesofleftandright.Theexperimentalresultsshowthattheproposedidentificationalgorithmhasbetterprecisionand基于数字结构特征的印刷体数字识别2robustnessforthenoiseandthefontchanges.Keywords:Printednumeralrecognition;Featureextraction;Matchingtemplatefeature;numeralstructurefeature0.引言计算机技术的不断发展,使人们的生活中出现了各种各样的自动化设备,这些人工智能,模式识别技术的应用给我们的生活工作带来了极大地便利,我们也越发离不开这些设备和技术。但是,广大学校和企业的研发人员和科技工作者还在不断努力,希望能够提供更多更好更方便的产品和技术。这些努力极大的推动了模式识别,人工智能,机器学习,数字图像处理等技术的发展。其中,字符识别系统是一个得到大量使用的模式识别应用,在我们的身边也可以说是无处不在,每个人都或多或少有所接触。通过大量的应用,字符识别技术也得到了很大的发展。光学字符识别技术(OpticalCharacterRecognition)主要是指对图片或者视频等上面的字符,通过将文档资料的图像文件转换成黑白点阵,然后通过软件将图像中的文字转换成计算机可以读取的文本格式,从而获取文字信息,以便其他文字处理工具进一步编辑加工的系统技术[1]。字符识别的出现,主要是为了解决高速的计算机处理和低速的人工输入之间的矛盾。人类文明发展到今天,已经积累了大量的文献资料和各种记录,但是计算机的出现只有不到一百年的时间,大规模的应用更是只有短短二三十年的历史,要用计算机来处理这些信息就不得不面对一个如何输入的问题。另外,即使是在今天,大量的信息仍然记录在纸上或者是印刷在各种物品上,如产品编号,车牌号码,将这些信息输入计算机来处理是一项费时费力的工作。这些问题矛盾成了信息化发展的一个瓶颈,解决这个问题的关键就是字符识别技术,字符识别作为一项将各种文字数据高速输入计算机的技术,是实现智能人机接口的非常重要的途径,得到了广泛的研究。根据字符识别时信号的输入形式,分为联机识别和脱机识别。联机和脱机识别的主要区别在于是否有笔划的信息,目前联机字符识别已达到较高的应用水平,很多智能手机都会有的手写识别系统就是一个联机的字符识别系统。但是,生活中应用比较广泛的还是脱机的字符识别系统,我们接触的大多的字符识别都属于此类。虽然,脱机字符识别已经有了大量的研究发现,但是针对具体和特殊应用的特点研究的字符识别仍然有很大价值。数字识别是字符识别的一个重要研究方向,主要是指使用计算机自动识别阿拉伯数字。一个有效的,可靠的,简单快速的数字识别系统具有很广泛的商业用途,它既可以作为一个完整的系统单独使用,也可以作基于数字结构特征的印刷体数字识别3为其他字符识别系统的组成部分。例如,对于各种产品上大量印制的数字编号,利用数字识别系统进行识别和记录,可以有效节约时间和人力;车牌识别系统在城市交通管理中越来越重要,而数字识别系统是车牌识别系统的重要组成部分;数字识别系统在智能安检系统,如身份证,出入证的识别都能发挥关键作用。还有其他诸如文档装换软件等等,数字识别系统都大有用武之地[2-3]。本文主要研究脱机印刷数字的识别。脱机印刷体数字识别有其不同于其他字符识别的特点,其结构相对稳定,形态变化简单。本文的主要研究目的在于研究利用这个特点,对脱机印刷数字识别的技术进行研究改进,实现一种可靠,快速的字符识别系统。1.国内外研究现状光学字符识别技术发展到今天,国内外都取得了很多成果,使用各种方法提高OCR的识别精度,速度,鲁棒性。文献[10]中采用统计网格所占比例做提取的特征,利用模板匹配算法分类识别数字;文献[11]的文字特征采用粗网格特征,这种方法对连续的数字识别具有一定的借鉴应用价值;文献[12]利用图像的矩特征,并使用神经网络的方法来识别字符,取得了较好的实验效果;文献[13]提出利用数字的圈和左右凹陷的结构特征来识别数字的方法;文献[14]利用字符的上横线特征等组合和模板特征匹配识别车牌数字;文献[15]提出了一种利用分级RBF神经网络的车牌数字识别方法;文献[16]利用中线特征,点特征等组合起来识别数字字符;文献[17]中作者分别使用反向神经网络和Adaboost的分类方法来识别车牌中的数字字符;文献[18]主要工作是研究了利用蚁群算法进化神经树的手写字符识别技术;文献[19]提出了利用梯度和曲率的方法来提高字符识别的效率;文献[20]用KNN的方法识别字符;文献[21-24]分别用不同的方法利用支持向量机解决字符识别问题,都取得了很高的识别率。还有很多不同方法和特征,都取得了较好的实验效果[25-27]。以上提到的算法都是针对字符识别的一些通用适用于很多情况的字符识别方法和特征。需要研究印刷体数字的结构特点提出新的解决方法,来提高印刷体数字识别的速度和精度。本文主要对脱机印刷体数字识别的方法进行研究。通常,对于一个数字识别系统,主要包含以下几个过程:数字图像采集,数字图像去噪,数字图像二值化,数字分割和归一化和数字识别。2.数字图像预处理2.1数字图像采集数字图像既可以通过联机的摄像设备采集,也可以通过已经保存的图像进行识别。本文采集的图像是利用相机拍摄的发票电子照片。从原理上说,分辨率越高,则保存的数字信息越多,数字的识别率也就越高,但是相应的计算量也就越大,时间越慢。基于数字结构特征的印刷体数字识别4印刷体数字识别的形态稳定且结构简单,所以识别过程所需要的信息量相对其他识别较少,利用相机拍摄取得的数字图像已经可以取得满足识别的要求。本文采集的图片来自全国统一启用的印有12位发票代码和8位发票号码的普通发票图片作为识别对象,如图2.1所示。由于该系统只进行印刷体数字的识别,所以对发票图片进行了截图处理。通过截图工具,截取了12位发票代码和8位的发票号码的图片。图2.1普通发票图片图2.212位发票代码和8位发票号码图片2.2数字图像预处理图像的预处理主要是指在图像二值化前对图像所进行的处理工作。由于采像环境的变化和采像设备的影响,图像会出现不同程度的分布有噪声和亮度不均匀的情况,这会严重恶化后面的二值化处理的效果。图像的预处理可以有效去除噪声,光照反射等情况的不良影响,增强图像中的有效信息。因此,选择适合的预处理方法将对后续的二值化和识别工作带来很大的便利。2.2.1图像去噪处理图像的噪声主要来自于图像的采集和传输过程中图

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功