龙源期刊网手写试卷分数求和器的设计与实现作者:王军等来源:《现代电子技术》2015年第08期摘要:该设计实现了一种新型的试卷分数求和器,利用摄像头直接获取手写试卷分数栏信息,实现分数求和功能且能够自动适应不同的求分栏数目。求和器首先利用摄像头对试卷实时采样并对其进行二值化、图像定位和图像分割等预处理,然后利用BP神经网络对分割出的字符进行数字识别,最后将识别出的数字加和显示在GUI界面中。实验表明,该求和器能够以较高概率实现对手写试卷分数的自动求和,具有较大的应用前景。关键词:手写试卷;分数求和器;图像处理;分值识别;BP神经网络中图分类号:TN919⁃34;G741文献标识码:A文章编号:1004⁃373X(2015)08⁃0022⁃04DesignandimplementationofAnovelscoresummersystemforhandwrittentestpaperWANGJun1,SUOYue2,XIAOZhen⁃dong1,ZHANGMin1,QIAOXiao⁃lin1(1.WeihaiBranch,HarbinInstituteofTechnology,Weihai,264209,China;2.SkyworthLCDCo.,Ltd,Shenzhen518000,China)Abstract:Anovelscoresummersystemforhandwrittentestpaperisproposedinthepaper.Thesummersystemacquiresthescoreinformationofhandwrittentestpaperbydigitalcamera,andthencanautomaticallyoutputthesummationandcanadapitselftodifferentnumberofscore⁃lines.Thesummerfirstlycapturestheimageoftestpaperbydigitalcameraandthenpreprocesstheimageincludingbinaryzation,imagepositioningandsegmentation.TheBPneuralnetworkisemployedtoaccomplishthescorevaluerecognitionbasedonthepreprocessedresult,andthenthesummationisdisplayedonGUIinterface.Theexperimentsbasedonrealsystemshowtheproposedscoresummersystemcanimplementautomaticsummationofhandwrittentestpaperinhighprobability.Keywords:handwrittentestpaper;scoresummersystem;imageprocessing;scorevaluerecognition;BPneuralnetwork0引言手写试卷分数求和工作量非常大且容易出错,找到一种能降低人为错误和提高效率的求和方法具有现实应用意义。本文主要研究试卷分数求和器的设计与实现,以期能设计出一种快捷、有效的试卷分数自动求和器系统,可减少人工工作量并能够提高效率。该分数求和器对批改好的手写试卷分数进行数字识别,然后自动计算出总分,能大大提高教师试卷批改的效率。龙源期刊网现在的试卷批改方法大体有两种:手工的传统方法,耗时长,同时有一定的错误率;利用炭对红外的电敏感性实现的电脑读卡法,需要专门的填写和专业的读卡设备,这种方法效率高、准确率高,但成本也高[1]。本求和器首先利用数字摄像头对手写试卷分数信息进行获取,然后利用手写体数字识别方法进行图像处理,以实现对手写的试卷分数自动求和功能。1图像信息处理本求和器系统组成框图如图1所示,核心是利用图像处理方法对摄像头获取的图像进行处理,实现分数求和。图1系统框图在图像信息处理中,求和器系统实现:利用摄像头实现图像采集、图像预处理、图像定位和图像分割。1.1图像采集图像采集利用Matlab的ImageAcquisitionToolbox工具箱。将摄像头固定在试卷上方,通过Matlab查询视频设备,直接调用摄像头,打开预览窗口,对试卷进行瞬时抓拍,并将所采集的图像进行存储。在本系统中需要采集的对象为手写试卷计分栏,图2所示。可以看出,在采集的图像中,有很多与分数无关的文字和线条。利用Matlab软件实现图像采集的流程图如图3所示。图2需要采集的对象图3图像采集流程图1.2图像预处理采集图像后,通过imread函数将图像读取为二维矩阵数据,然后对其进行灰度化、二值化、取反、规范化[2]等预处理,图4是将图2所示原始采集图像进行预处理之后的结果。龙源期刊网原图像灰度化及二值化后图像、取反后图像1.3图像定位要实现对分数的识别,需要对预处理后图像进行定位,通过定位确定分数图像的位置。在本系统中,图像的评分栏定位采用了摄像头定位与投影法相结合的方法,画出取反后图像的垂直投影及水平投影,如图5所示。图5取反后图像的水平投影及垂直投影对其投影分析可知,评分栏图像的横坐标约在60~370之间,纵坐标约在145~275之间。由于摄像头获取图像可能会存在些微的位置误差,因此,截取图像时将坐标范围适当扩大,选取了横坐标55~380之间,纵坐标在140~280之间,以此区间实现对从预处理图像中对评分栏进行定位,定位后的分数栏图像如图6所示[3]。图6定位后图像1.4图像分割在定位后图像中,根据评分栏进行图像分割实现不同题目的分数图像分离在本设计中具有非常重要的意义。本设计中的分割涉及到两次边框分割和一次字符分割。每一次分割均采用投影法,通过判断投影值选取图像的起止点,分割出所需图像[4]。第一次投影分割过程如下:首先画出图像的水平投影图,如图7所示。图7定位后图像的水平投影在评分栏图像的水平投影图上的横向从左侧到右侧依次检测每1个坐标的投影数值,将检测到的投影数值出现第1个大于等于150时,那么将这个投影数值所属的像素点即看做是第1行区域的上边界限。然后继续向右检测,将检测到的投影数值出现第1个大于等于150时,那么将这个投影数值所属的像素点即看做是第1行区域的下边界限。投影算法流程图如图8所示。图8图像分割流程图龙源期刊网所示图像分割流程,设计Matlab程序,实现对图像的分割,第1次分割后的图像图9所示。从图中可以看出,经过一次分割后,不同计分栏中的分数已经实现分离,但其中包含了不是分数的文字信息,如在图9中的第一张子图中出现汉字“分数”。图9第一次分割后图像与第1次图像分割同理,第2次及第3次分割也以此流程进行分割。第2次及第3次分割后图像如图10、图11所示。其中第3次分割的目的是若某一题的分数为两位数,则对图像进行第三次分割,将两位数字分割成单个的数字,为实现数字分数识别[5]做准备。图10第二次分割后图像图11第三次分割后图像进行三次分割后,对分割出来的图像进行特征提取,如图12所示,以便于后续的数字识别[6⁃8]。图12第三次分割后图像的特征提取2数字识别在本分数求和器系统中,基于特征提取结果,利用BP神经网络实现手写体数字的识别。2.1BP神经网络法手写体数字识别系统主要由训练过程与识别过程两部分组成,训练过程和识别过程两部分均包括预处理、特征提取和模式识别三部分。本课题采用BP神经网络方法对手写数字进行识别。BP神经网络又称误差反向传递神经网络,它是一种依靠反馈值来不断调整节点之间的连接权值而构建的一种网络模型[9]。它的整个体系结构分为输入层、隐藏层和输出层,其中隐藏层根据具体情况的需要,可以是一层结构也可为多层结构。BP网络属于前向神经网络,给多层网络的训练提供了比较有效的办法,加之多层前向神经网络能逼近任意线性函数,在科学技术领域中有广泛的应用,因此,该算法一直受到人们的广泛关注。2.2BP神经网络结构龙源期刊网将数字图像的特征向量作为神经网络的输入,所以神经网络的输入层神经元个数等于特征向量的维数,即70×50=3500个输入神经元。因为要识别10个数字,因此输出选择为10×1的矩阵,即输出节点数为10。当数字图像0~9输入神经网络后,在输出神经元对应的位置上为1,其他的位置为0。如果输人数字0,第1个输出神经元为1,其他输出神经元为0;如果输入数字1,第2个输出神经元为1,其他输出神经元为0;依次类推。建立一个前向BP神经网络函数,主要程序如下:net=newff(minmax(alphabet),[S1S2],{′logsig′′logsig′},′traingdx′);其中:minmax(alphabet)为神经网络对它的3500个输入元素的最大值和最小值的限制;alphabet为训练样本集合;[S1S2]为该神经网络的层结构;{′logsig′′logsig′}为该神经网络各层的转移函数,均设置为对数S型激活函数。训练函数采用traingdx,即梯度下降BP算法训练函数。最后通过train函数对目标样本进行训练,通过sim函数进行仿真,输出神经元最大值,即识别出的数字[10⁃13]。3系统实现实现手写试卷分数求和器的实际系统如图13所示,基于实际系统进行题数可选功能和报警功能的测试,对识别正确率进行了统计。图13实际系统3.1题数可选功能本系统具有题数可选择功能,七、八、九题均可,选择出要识别的试卷的题数,即可进行识别,并在总分处显示出总分。实现方法为:在GUI设计中,在GUI界面上放置三个按钮,分别命名为“七道题”、“八道题”、“九道题”,每个按钮内均包括第2次分割、第3次分割、识别及结果显示的程序语句,不同之处仅在于第2次分割时,所分割出的图片数不同,显示出的图片数也不同。实际系统效果如图14~图16所示。图14识别后GUI界面(七道题)图15识别后GUI界面(八道题)龙源期刊网界面(九道题)3.2报警功能本系统设计具有报警功能,若所识别的图像某一大题处为空白,会在总分上面显示出“thereisanenpty!”进行报警,效果如图17所示。实现方法:对每道题的图片取垂直投影histcol3,令mm=sum(histcol3),即对垂直投影histcol3求和,若mm图17空白报警GUI界面3.3系统准确率对手写分数的识别准确率是衡量系统的重要指标,它决定了系统是否具有实际应用价值。本设计中共取20个分数栏图像作为训练样本,每个图像中含有10个手写体数字,共200个测试样本对系统进行性能测试。测试结果如表1所示。由表1中的数据可知,总体数字识别的正确率为93.25%,正确率较高。就本设计而言,数字识别准确率与摄像头获取图像的亮度、手写数字的间距等均有关,因此,在实际运用中,还应对图像获取、数字位置等都有准确规定,以获得更高的准确率。表1求和器准确率4结论本文根据手写试卷评分特征,利用图像分割理论和BP神经网络,实现了试卷分数求和器系统设计。求和器能够自动实现对手写试卷分数的总分计算,减少了人工统计计算成本;求和器所具有的题数可选功能和对空白分数栏的报警提示功能,提高了系统适应性,能对试卷评分栏进行检查,排除分数漏统计风险。经过实际测试表明,本分数求和器的准确率达到93.5%,这表明基于本系统设计理论的手写分数求和器具有实际应用意义。通过对图像分割和数字识别算法进行改进,可进一步提高系统准确率,将本系统实际应用于手写试卷评分领域。参考文献[1]郝梦琳.手写体数字识别方法的研究与实现[D].太原:太原科技大学,2013.[2]康