本发明专利技术公开了一种汉字书写字形识别方法及装置,用于对汉字字形进行识别,该方法包括:保存标准汉字的标准笔画数据,标准笔画数据包括组成标准笔画的点的坐标;采集获得用户通过笔画方式输入的实时汉字的第一实时笔画数据,第一实时笔画数据包括组成实时笔画的点的坐标;根据标准笔画数据计算标准汉字的重心,根据第一实时笔画数据计算实时汉字的重心;对实时汉字进行偏移,偏移量为实时汉字的重心与标准汉字的重心的差值,获得偏移后实时汉字的第二实时笔画数据,第二实时笔画数据包括组成偏移后实时笔画的点的坐标;根据组成偏移后实时笔画的点的坐标以及组成标准笔画的点的坐标,计算每个偏移后实时笔画与对应的标准笔画的距离。
【技术实现步骤摘要】
本专利技术涉及计算机领域,具体涉及一种汉字书写字形识别方法及装置。
技术介绍
汉字广泛应用于人们的日常生活工作当中,在现有技术中,利用计算机自动识别 字符的技术已经比较成熟,例如OCR的ptical化aracter Reco即ition,光学字符识别)是 利用电子设备,如扫描仪或数码相机,检查纸上打印的字符,通过检测暗、亮的模式确定其 形状,然后用字符识别方法将形状翻译成计算机文字。 在上述应用中对文字的识别是W文字为单位,W判断出输入的是什么字符为识别 目标,但是,在一些领域中,汉字的书写过程也需要被关注,例如汉字字形、笔画位置等方面 是否正确,而在现有技术中,尚不存在对文字书写过程中字形是否正确进行识别的技术。
技术实现思路
有鉴于此,本专利技术提供一种汉字书写字形识别方法及装置,W解决现有技术中无 法对汉字书写字形进行识别的技术问题。 为解决上述问题,本专利技术提供的技术方案如下: -种汉字书写字形识别方法,预先保存标准汉字的标准笔画数据,所述标准笔画 数据包括组成标准笔画的点的坐标,所述方法包括: 采集获得用户通过笔画方式输入的实时汉字的第一实时笔画数据,所述第一实时 笔画数据包括组成实时笔画的点的坐标; 根据所述标准笔画数据计算所述标准汉字的重必,根据所述第一实时笔画数据计 算所述实时汉字的重必; 对所述实时汉字进行偏移,偏移量为所述实时汉字的重必与所述标准汉字的重必 的差值,获得偏移后实时汉字的第二实时笔画数据,所述第二实时笔画数据包括组成偏移 后实时笔画的点的坐标; 根据所述组成偏移后实时笔画的点的坐标W及所述组成标准笔画的点的坐标,计 算每个所述偏移后实时笔画与对应的标准笔画的距离。 相应的,所述方法还包括: 通过增加或删除所述标准笔画中的点,使所述组成标准笔画的点的个数达到预设 个数; 通过增加或删除所述实时笔画中的点,使所述组成实时笔画的点的个数达到所述 预设个数。 相应的,所述根据所述标准笔画数据计算所述标准汉字的重必,根据所述第一实 时笔画数据计算所述实时汉字的重必,包括: 将所述标准汉字中全部点的坐标进行求和,除W所述标准汉字中全部点的总数, 获得所述标准汉字的重必; 将所述实时汉字中全部点的坐标进行求和,除W所述实时汉字中全部点的总数, 获得所述实时汉字的重必。 相应的,所述根据所述组成偏移后实时笔画的点的坐标W及所述组成标准笔画的 点的坐标,计算每个所述偏移后实时笔画与对应的标准笔画的距离,包括: 计算所述偏移后实时笔画中第m个实时笔画点的坐标与对应的标准笔画中第m个 标准笔画点的坐标之间的距离,并将计算获得的m个距离之和作为所述偏移后实时笔画与 对应的标准笔画的距离,m的取值范围为1到所述标准笔画的点的个数。 相应的,所述方法还包括: 根据预先保存的部件结构信息,计算组成部件的偏移后实时笔画与对应的标准笔 画的距离之和; 和/或计算组成所述实时汉字的偏移后实时笔画与对应的标准笔画的距离之和。 -种汉字书写字形识别装置,所述装置包括: 保存单元,用于根据预先保存的部件信息,计算预先保存标准汉字的标准笔画数 据,所述标准笔画数据包括组成标准笔画的点的坐标; 采集单元,用于采集获得用户通过笔画方式输入的实时汉字的第一实时笔画数 据,所述第一实时笔画数据包括组成实时笔画的点的坐标; 第一计算单元,用于根据所述标准笔画数据计算所述标准汉字的重必,根据所述 第一实时笔画数据计算所述实时汉字的重必; 偏移单元,用于对所述实时汉字进行偏移,偏移量为所述实时汉字的重必与所述 标准汉字的重必的差值; 获得单元,用于获得偏移后实时汉字的第二实时笔画数据,所述第二实时笔画数 据包括组成偏移后实时笔画的点的坐标; 第二计算单元,用于根据所述组成偏移后实时笔画的点的坐标W及所述组成标准 笔画的点的坐标,计算每个所述偏移后实时笔画与对应的标准笔画的距离。 相应的,所述装置还包括: 调整单元,用于通过增加或删除所述标准笔画中的点,使所述组成标准笔画的点 的个数达到预设个数;通过增加或删除所述实时笔画中的点,使所述组成实时笔画的点的 个数达到所述预设个数。 相应的,所述第一计算单元包括: 第一计算子单元,用于将所述标准汉字中全部点的坐标进行求和,除W所述标准 汉字中全部点的总数,获得所述标准汉字的重必; 第二计算子单元,用于将所述实时汉字中全部点的坐标进行求和,除W所述实时 汉字中全部点的总数,获得所述实时汉字的重必。 相应的,所述第二计算单元具体用于: 计算所述偏移后实时笔画中第m个实时笔画点的坐标与对应的标准笔画中第m个 标准笔画点的坐标之间的距离,并将计算获得的m个距离之和作为所述偏移后实时笔画与 对应的标准笔画的距离,m的取值范围为1到所述标准笔画的点的个数。 相应的,所述装置还包括: 第H计算单元,用于根据预先保存的部件结构信息,计算组成部件的偏移后实时 笔画与对应的标准笔画的距离之和; 和/或计算组成所述实时汉字的偏移后实时笔画与对应的标准笔画的距离之和。 由此可见,本专利技术实施例具有如下有益效果: 本专利技术实施例通过将采集得到的实时汉字平移到与标准汉字重必重叠位置,获得 偏移后实时汉字每个实时笔画的实时笔画数据,再通过计算每个实时笔画与对应的标准笔 画的距离,获得各笔画形态的识别结果,进一步也可W由每个实时笔画与对应的标准笔画 的距离获得汉字各部件字形W及整字字形的识别结果,从而实现对汉字书写字形的识别。【附图说明】 图1为本专利技术实施例提供的汉字书写字形识别方法实施例一的流程图; 图2为本专利技术实施例提供的汉字书写字形识别方法实施例二的流程图; 图3为本专利技术实施例提供的汉字书写字形识别装置实施例的示意图。【具体实施方式】 为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本专利技术实施例作进一步详细的说明。 每个汉字是由一组固定的笔画组成的,对应汉字字形书写的优劣是W呈现在纸面 上的位置分布相关,也就是汉字字形的结构分布。在现有技术中尚没有对汉字书写字形的 识别,针对送个问题,本专利技术实施例中提供一种汉字书写字形识别方法及装置,通过把实时 汉字的坐标平面映射到标准汉字的坐标平面,使实时汉字与标准汉字的中必重叠,当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种汉字书写字形识别方法,其特征在于,预先保存标准汉字的标准笔画数据,所述标准笔画数据包括组成标准笔画的点的坐标,所述方法包括:采集获得用户通过笔画方式输入的实时汉字的第一实时笔画数据,所述第一实时笔画数据包括组成实时笔画的点的坐标;根据所述标准笔画数据计算所述标准汉字的重心,根据所述第一实时笔画数据计算所述实时汉字的重心;对所述实时汉字进行偏移,偏移量为所述实时汉字的重心与所述标准汉字的重心的差值,获得偏移后实时汉字的第二实时笔画数据,所述第二实时笔画数据包括组成偏移后实时笔画的点的坐标;根据所述组成偏移后实时笔画的点的坐标以及所述组成标准笔画的点的坐标,计算每个所述偏移后实时笔画与对应的标准笔画的距离。
【技术特征摘要】
【专利技术属性】
技术研发人员:闻申生,靳骏,
申请(专利权)人:北京汉仪科印信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。