【技术实现步骤摘要】
一种手写汉字图像的笔顺识别方法及系统
[0001]本专利技术属于计算机图像处理
,更具体地,涉及一种手写汉字图像的笔顺识别方法及系统。
技术介绍
[0002]在规范汉字书写教学的整个过程中,小学低年级的汉字教学是基础所在,但低年级的多数学习者书写出的汉字风格多变,对每个学生写过的所有汉字都给出纠正信息并辅助改正很难实现。且大部分家长和教师没有受过严格的、系统的规范汉字书写教育,即使最终能实现一对一的辅导,教师和家长也无法对学生书写的汉字给出具体化和规范化的评价信息。
[0003]随着信息技术的不断发展与完善,已经出现了很多计算机辅助的汉字书写评价系统。相关研究工作可以分为事后评价和实时评价两类。事后评判是指让书写者不受打扰一次性书写完目标汉字,然后提取其手写汉字的特征数据与模版汉字进行对比并进行规范性评价;实时评判,则是指书写者每次写完目标汉字的一个笔画,系统立即评判其规范性。这两类系统的研究都已经有相当多的成果,且主要的关注点都在于手写汉字笔顺的正确性。
[0004]要深入研究手写汉字笔顺的正确性评价,手写汉字的数据化十分重要。目前很多汉字书写教学系统都是通过类似于书写平板之类设备搭配电容笔来进行汉字数据采集,电子设备有时序数据,能够很方便的采集到书写者手写汉字的笔顺信息。然而,此类设备大多较为坚硬且表面光滑,影响书写体验,在电子屏上书写时很难得到真正笔纸的书写体验。此外,电子设备采集了汉字笔段数据后,一般通过设置阈值来实现笔段融合,而很少考虑汉字笔画本身的特征。
[0005]让书写者 ...
【技术保护点】
【技术特征摘要】
1.一种手写汉字图像的笔顺识别方法,其特征在于,包括以下步骤:(1)预处理步骤:对原始手写汉字图像进行汉字骨架提取操作,得到汉字骨架图像;对所述汉字骨架进行分割操作,得到含有多个笔段的分割图像;所述原始手写汉字图像仅包含1个手写汉字;(2)第一次笔顺匹配步骤:通过分支界限法,根据笔画集对所述分割图像中的笔段进行笔顺匹配操作,将匹配成功的笔段组成成功笔段集,完成从所述成功笔段集到所述笔画集的第一映射:将每个笔段映射到匹配成功的笔顺;将匹配失败的笔段组成失败笔段集,对所述失败笔段集执行下述第二次笔顺匹配步骤;所述笔画集的获取方法为:在规范汉字字库中查找获得所述原始手写汉字图像中的手写汉字的标准笔画集,简称为笔画集;所述规范汉字字库的建立方法为:根据八邻域方向编码规则对国标一级字库中的所有汉字建立规范汉字字库,所述规范汉字字库由每个汉字的标准笔画集构成,所述标准笔画集包括每个笔画的笔顺和质心;(3)第二次笔顺匹配步骤:对所述失败笔段集中的每个笔段,分别计算该笔段的质心与所述笔画集中每个笔画的质心的距离,并组成距离集;查找所述距离集中的最小距离;查找所述最小距离对应的笔画在所述笔画集中的笔顺,判定该笔顺与该笔段匹配成功;完成从所述失败笔段集到所述笔画集的第二映射:将每个笔段映射到匹配成功的笔顺;(4)笔段融合步骤:将所述第一映射和所述第二映射合并为第三映射,将所述第三映射中映射到同一笔顺的2个以上的笔段组成该笔顺的待融合笔段集;分别对每个所述待融合笔段集进行笔段融合操作:将每个所述待融合笔段集中的笔段融合为1个笔段。2.根据权利要求1所述的手写汉字图像的笔顺识别方法,其特征在于,所述预处理步骤中的汉字骨架图像的任一笔迹像素点在其八邻域内只存在4个以下的相邻的笔迹像素点;所述预处理步骤中的笔段的起终点在其八邻域内只存在1个相邻的笔迹像素点,其他笔迹像素点在其八邻域内只存在2个相邻的笔迹像素点;所述规范汉字字库中的标准笔画集还包括每个笔画的非法方向编码和合法方向编码;所述非法方向编码的规则为:若该笔画的主方向编码为0,则非法方向编码为2和6;若该笔画的主方向编码为1,则非法方向编码为3和7;若该笔画的主方向编码为2,则非法方向编码为0和4;若该笔画的主方向编码为3,则非法方向编码为1和5;若该笔画的主方向编码为4,则非法方向编码为2和6;若该笔画的主方向编码为5,则非法方向编码为3和7;若该笔画的主方向编码为6,则非法方向编码为0和4;若该笔画的主方向编码为7,则非法方向编码为1和5;所述合法方向编码的规则为:若该笔画的主方向编码为0,则合法方向编码为0、1和7;若该笔画的主方向编码为1,则合法方向编码为0、1和2;若该笔画的主方向编码为2,则合法方向编码为1、2和3;若该笔画的主方向编码为3,则合法方向编码为2、3和4;
若该笔画的主方向编码为4,则合法方向编码为3、4和5;若该笔画的主方向编码为5,则合法方向编码为4、5和6;若该笔画的主方向编码为6,则合法方向编码为5、6和7;若该笔画的主方向编码为7,则合法方向编码为0、6和7;所述笔画的主方向编码为该笔画的八邻域编码链中出现次数最多的方向编码。3.根据权利要求2所述的手写汉字图像的笔顺识别方法,其特征在于,所述第一次笔顺匹配步骤中的笔段匹配操作包括以下步骤:(1)匹配权重计算步骤:计算每个所述笔段的主方向编码,并分别对比所述笔画集中所有笔画的非法方向编码:若所述笔段的主方向编码不属于其中一个笔画的非法方向编码,则计算该笔段与该笔画的匹配权重,并继续对比下一个笔画;否则,判定该笔段与该笔画不匹配,并继续对比下一个笔画;直至完成所有笔画的对比;所述笔段的主方向编码为该笔段的八邻域编码链中出现次数最多的方向编码;所述匹配权重为该笔段的质心与该笔画的质心之间的距离;(2)匹配笔顺步骤:根据每个所述笔段的所有的匹配权重,通过分支界限法完成所述第一映射。4.根据权利要求2所述的手写汉字图像的笔顺识别方法,其特征在于,所述笔段融合步骤中的笔段融合操作包括以下步骤:(1)笔段编码步骤:以起始点为起点对所述待融合笔段集中的每个笔段进行遍历操作,按照八邻域方向编码规则计算除起点以外的每个笔迹像素点的方向编码,各个所述方向编码按所述遍历操作的遍历顺序构成该笔段的八邻域编码链;(2)翻转笔段步骤:对所述待融合笔段集中的每个笔段,在所述所述第三映射中查找该笔段的像,根据该笔段的像在所述笔画集中查找对应的笔画的合法方向编码;判断该笔段的八邻域编码链是否包含在该合法方向编码中,若不包含,则翻转该笔段,并将翻转后的笔段放入所述待融合笔段集,删除翻转前的笔段;否则,不翻转该笔段,且该笔段保留在所述待融合笔段集中;(3)融合笔段步骤:任取所述待融合笔段集中的两个笔段:第一笔段和第二笔段,对第一笔段的起始像素点P1和终止像素点P2,以及第二笔段的起始像素点P3和终止像素点P4,计算距离D1,D2,D3和D4;D1为P1和P3之间的距离,D2为P1和P4之间的距离,D3为P2和P3之间的距离,D4为P2和P4之间的距离;若D1~D4中最小的距离小于设定的阈值,则取P1~P4中距离最近的两点进行融合,并将融合后的笔段放入所述待融合笔段集;否则判定为融合失败,并删除融合失败的笔段;所述融合失败的笔段为所述第一笔段和所述第二笔段中属于所述失败笔段集的笔段;(4)融合完成步骤:对所述待融合笔段集重复执行所述融合笔段步骤,直至融合为1个笔段。5.一种手写汉字图像的笔顺识别系统,其特征在于,包括:笔画集获取模块:用于根据八邻域方向编码规则对国标一级字库中的所有汉字建立规范汉字字库,所述规范汉字字库由每个汉字的标准笔画集构成,所述标准笔画集包...
【专利技术属性】
技术研发人员:舒江波,杨宗凯,刘三女牙,李简然,卢帅成,易宝林,张照理,戴志诚,张维,吴亮,曾晶丽,
申请(专利权)人:华中师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。