6返修文档图像的处理方法的研究和应用

252513663
1 ℃
2020-01-12

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

需修改：太过于空洞，一点深度都没有，自己想添加一些东西都添加不进去，作者的要求很严格，控制字符数2500字符，请老师认真修改下，谢谢扫描文档图像的处理方法的研究和应用摘要：随着多媒体和互联网技术迅速发展，计算机已经渗透到人们生活的方方面面，基于传统纸质形式的信息保存和传递已无法满足人们的需求。本文对扫描文档图像的处理方法的研究和应用进行了分析和探讨。关键词：扫描文档图像处理鉴于电子文档有易于传输、方便检索、处理快捷、存储空间小等特点，电子文档越来越得到广泛的应用，例如网上阅卷、政府档案、医院病历、银行票据等行业都应用于此。因此，电子文档在迅速的改变着我们的日常生活，成为我们工作和学习中必不可少的一部分。1文档图像的获取将照射能量变换为数字图像的原理是通过将输入的电能和对特殊类型检测敏感的传感器材料相组合，把输入能源转变为电压。输出电压波形是传感器的响应，通过把传感器响应数字化，从每个传感器得到一个数字量。有三种主要的传感器构造分别是单成像传感器、条带传感器、阵列传感器。随着技术的发展，越来越多的行业需要处理和储存文档图像，为了让计算机能够处理图像，就需要图像数字化。现在获取文档图像的过程一般是通过高速扫描仪，数字照相机等数字化设备采集纸质文档信息传输到计算机系统中，这样不仅节省人力，而且提高了效率和准确率。在此过程中由于设备原因或者人为因素都会导致扫描后的文档图像变形或者倾斜，这将严重影响文档图像后续处理的准确性。因此有必要对扫描后的原始文档图像做噪声去除，倾斜校正等预处理。2文档图像预处理技术为了更好的满足文档图像的的版面分析理解和识别的要求，需要对原始扫描图像做一些预处理，文档图像预处理的结果好坏直接影响到后续处理的精确度，因此预处理是文档图像处理中关键的技术之一，相关的操作有二值化，去噪，倾斜校正等。2.1二值化由于经过扫描设备扫描得到的文本图像包含的信息量较大，我们对文本图像预处理时只需要其中一小部分信息，为了提高处理效率，需要将文本图像二值化，转换成为二值图像。二值化后的图像是图像中的文字和背景区分离，二值图像具有所需存储空间小、便于图像处理等优点。图像的二值化处理的关键步骤是阈值的确定，关于二值化的方法主要有自定义阈值法、otsu全局阈值法、局部阈值法。2.2噪声去除纸质文件通过扫描设备转换成电子文件时，由于纸质文件的厚度、光洁度以及纸质存放时间的原因会产生一定的噪声，噪声的存在影响了文本图像的质量，对后续的文本图像处理工作产生不良的后果。因此，为了在图像处理后能够得到理想的结果，需要对文本图像进行降噪处理，尽可能的还原图像的特征。传统的去噪方法有中值滤波、均值滤波、图像平滑处理另外还有数学形态学。根据处理的内容不同可分为三种：图像空间域降噪方法、图像变换域降噪法和边界噪声降噪。2.3倾斜校正目前主要的分析方法有投影轮廓法、连通域法、霍夫变换法、平行四边形法、最大方差的转移计数法、交叉相关性等。霍夫变换、矩形框调整算法、Radon变换，是目前最常用的方向校正算法，这些算法存在计算复杂度高和适应度差的缺点，Mojette变换是在Radon变换的基础上选取某些符合条件的特定的投影角度来实现的，该算法计算量小，适应度强，比较适合文本图像的方向校正。利用文本行之间的空白行特性，使用方向白游程，可估计文档图像的倾斜角度。Hough变换是常用的倾斜角度检测方法，为了降低计算复杂度，可以通过预先扫描文档图像，增加区域约束条件，从而提高计算的速度和稳定性。通过扫描字符轮廓并确定字符的最低点，结合矩方法估计文档图像的倾斜角度，可适用于中文、英文等。数学形态学可作为图像预处理手段，充分降低Radon变换估计倾斜角度的时间复杂度。由于文字在文档图像中特有的行或列的排列方式(水平或者垂直)，使得文本图像可以看成是具有周期性纹理的图像。傅立叶变换是检测周期性的有用工具，通过分析傅立叶变换后的能量频谱图可以检测出文本图像由文本线结构特征所引发的周期性，可通过能量谱图的分析方法检测倾斜角度，通过引入收敛方法提高倾斜角度的检测精度。3文档图像分析技术文档图像分析主要是根据几何特征将图像中类型相同的区域分割出来，形成单一的独立区域，文档图像的版面主要分为，文本版面、图像版面和文字图像混排版面。现有的版面分析的方法有三种：自顶向下的方法、自底向上方法、混合型方法。3.1自顶向下的方法该方法从版面的全局入手，将整个版面细分为几个属性不同区域，例如文本行、段落等，然后再根据需要进一步划分，直到全部划分完成，该方法有速度快、操作简单、效率高优点，但是首先需要文档图像的先验知识，对比较复杂的版面不能处理。常用的自顶向下文字检测算法主要有两种：（1）约束游程算法(CRL，ConstraintRunLength)该方法首先二值化图像，然后分别从水平和垂直两个方向上对处理后的文档图像进行扫描，如果扫描连续白像素获得的游程长度小于给定的阈值则将其替换为黑像素点（设置为零）。该方法在对于不同的区域,其阈值难以确定。（2）投影轮廓切分算法(PPC，ProjectionProfileCut)，该方法是从水平和垂直两个方向对区域进行投影，通过分析投影曲线选择切分点对区域进行分割,对分割后所得区域进行同样操作直至不能切分。该方法简单快速,但是这种方法只适用于非嵌入式矩形版面,对嵌入版面难以适用,且在页面存在倾斜时无法适用。通过分析投影曲线选择切点区域分割，所得到的区域，直到在分割操作之后不能进行相同的切点。该方法简单，快速，但这种方法只适用于非嵌入矩形布局，嵌入式布局难以适用，而在倾斜的存在不能适用的页时。3．2自底向上的方法该类方法刚好与自顶向下的方法相反，即从单个像素开始合并处理，形成较小的连通域，然后再进一步将相类似的区域合并，完成整个版面全部处理完毕，也就完成了图像的分割，该方法适应于比较复杂的文档图像，灵活性高，但是计算量大，比较耗时，区域的合并准则比较难以确定。目前，有三种比较主流的方法:(1)在几何特征的基础上利用K近邻簇类将相邻联通区域合并成文本行,再将多个文本行合并为文本块。(2)首先构建无向图,连通区域用无向图中的节点表示,连通区域之间的距离为无向图中边的权值,利用Krastal算法建立最小生成树,这样就可以获得文档图像中的字符、文本行和文本块等区域信息;(3)基于神经网络分析区分的连通区域,并将其合并为文本行。3.3混合型方法该算法主要将以上两种自顶向下和自底向上的方法结合起来,同时使用图像的全局和像素信息处理那些相对复杂的文档图像，从而产生更好的分割效果。4文档图像识别技术文档图像中包括文字、图片和表格等类型区域,对于特定的区域都有相应的处理分析,例如对文本区域进行字符识别、对图像区域进行压缩处理、对图形区域需要线条分析、对表格区域需要进行表格重构等处理,为了按上述类型对文档图像区域进行处理，需要进行文档图像中各类型区域识别。文档图像识别的方法主要有以下3种:1.基于统计模式识别的方法统计模式识别方法的基本过程是首先在线性空间中用特征向量表示模式样本，然后用训练样本按照事先确定的分类或学习算法进行训练,从获得的训练样本中提取出各个模式的统计特征,并以这些特征为依据确定分类规则。该类方法的缺点是计算量过大。2.基于纹理分析的方法图像的疏密度、粗细度，方向性以及一致性都是图像的纹理特征，通过分析图像纹理特征的不同区分各类内容，该方法可以忽略不同类型内容的特殊性,直接分析文档图像。该类方法的缺点是计算量大,且结果准确率不高。3)基于特征识别的方法该方法的主要思想是提取待识别区域中各类型特征,然后采用一定的判定策略对待识别区域所属类型进行判断。利用上面获得特征进行文本图像分类能得到了较好的效果。这些特征都有其优缺点,整合这些特征的优点进行分类识别可以达到较好的效果。结语本文主要介绍了文本图像获取、预处理技术、图像分析和图像的识别的相关技术。文档图像是一个比较特殊的文档图像既有文字信息又可能包含一部分图片，在OCR识别之前，文本行的分割就是它的基础。以上都属于文档图像的预处理的范围，可见文档图像预处理对后续工作的处理起着非常重要作用。[17]张政.书籍扫描图像几何畸变校正[J].软件导刊,2009,(11):217-218.[18]向世明,赵国英,陈睿,等.积厚文档扫描图像校正[J].计算机辅助设计与图形学学报,2005,17(1):42-44.[19]胡东红,汪浩,艾君,等.两种图像校正算法在实际应用中的比较[J].计算机工程与应用,2009,45(13):191-193.