多参数汉字笔画识别实现方案(草案1)肖航2011年4月27日输入:曲线的(X,Y)坐标及长度Len值域:NUMBER数值;TRUE;FALSE一、参数设计1.拐点数量:NUMBER说明:拐点指书写过程中曲线的折点,是最重要的参数;2.拟合后直线斜率:NUMBER(四种情况:正值、负值、约等于0、约等于1)若笔画近似直线,斜率用于判断曲线的方向;若非直线则为笔画组合的整体方向。斜率直线方程:BY=AX+C,B等于1或0,A为斜率,C为截距。经实验,垂直于X轴时斜率A等于1或大于10或小于-10。其他框框,A基本不可能严格等于1。3.X++&&Y++:TRUE/FALSE说明:X值是否有递增过程,连续5~10个点X值递增,则递增成立;X值递增时Y值是否同时递增,连续5~10个点Y值递增,则递增成立。XY二者皆成立可判断为此状态成立。样例:捺4.X--&&Y++:TRUE/FALSE说明:X是否有递减过程,连续5~10个点X值递减,则递减成立;X值递减时Y值是否同时递增,连续5~10个点Y值递增,则递增成立。XY二者皆成立可判断为此状态成立。样例:撇5.X--&&Y--:TRUE/FALSE说明:X是否有递减过程,连续5~10个点X值递减,则递减成立;X值递减时Y值是否同时递减,连续5~10个点Y值递减,则递减成立。XY二者皆成立可判断为此状态成立。样例:右向左上的钩6.X==&&Y++:TRUE/FALSE说明:X是否有恒定过程,连续10个点以上X值在5点范围内波动,可判断恒定状态成立。此时必定有纵向笔画。若Y值同时递增(连续5~10个点Y值递增),则递增成立。XY二者皆成立可判断为此状态成立。样例:竖7.X==&&Y--:TRUE/FALSE说明:X是否有恒定过程,连续10个点以上X值在5点范围内波动,可判断恒定状态成立。此时必定有纵向笔画。若Y值同时递减(连续5~10个点Y值递增),可判断为此状态成立。样例:竖直向上的钩8.X++&&Y==:TRUE/FALSE说明:X值是否有递增过程,连续5~10个点X值递增,则递增成立;Y是否有恒定过程,连续10个点以上Y值在5点范围内波动,可判断为恒定状态成立。此时必定有横向笔画。XY二者皆成立可判断为此状态成立。样例:横9.X--&&Y==:TRUE/FALSE说明:X是否有递减过程,连续5~10个点X值递减,则递减成立;Y是否有恒定过程,连续10个点以上Y值在5点范围内波动,可判断为恒定状态成立。此时必定有横向笔画。XY二者皆成立可判断为此状态成立。样例:写的过于平直的平撇10.与垂直于X轴的直线的最大交点个数:NUMBER现有笔画中最大可能是有4个交点,如“横撇弯钩”。11.与垂直于Y轴的直线的交点个数:NUMBER现有笔画中最大可能是有3个交点,如“竖弯钩”。12.(Xmax-Xmin)/Len:NUMBERX值变化的平均距离。13.(Xmax-Xmin)/Len:NUMBERY值变化的平均距离。14.(Xmax-Xmin)/(Ymax-Ymin)笔画边缘轮廓的矩形形状:大于1:横向长条约等于1:正方形小于1:纵向长条二、决策机制实行投票积分制,根据参数为每一符合参数要求的笔画投票。权重分配:拐点6分,斜率2分,其他每参数1分。总计20分最后根据得分排序,取得分最高的3笔。三、笔画参数决策表笔画分类将具体笔画根据笔形特点和形近情况分类,分为15类。笔画识别时,力求笔画分类判断准确,减少不能识别情况的出现;具体笔画可有多候选,并分值排序。笔顺判断时只根据笔画分类值。笔画书写质量判断时再根据具体笔画名称。后三个参数需要实验数据,未考虑清楚,暂空。取值:0,正值,负值,X皆有可能T-True,F-False,TF皆有可能下表为初步实验的数据,可能存在偏差。