当前位置: 首页 > 专利查询>北京大学专利>正文

一种个性化汉字数字墨水的生成方法技术

技术编号:9535267 阅读:250 留言:0更新日期:2014-01-03 18:36
本发明专利技术涉及一种个性化汉字数字墨水的生成方法,步骤为:1)对字库中的所有同种笔画进行聚类,挑选出覆盖完整的笔画训练字并提取得到训练字图像;2)拆分已标定出训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。本发明专利技术提供给用户一种个性化的触屏汉字输入体验,用户可以自己指定渲染风格,进行触屏书写时,显示结果既保持输入轨迹特征也能体现出指定的书写风格。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及,步骤为:1)对字库中的所有同种笔画进行聚类,挑选出覆盖完整的笔画训练字并提取得到训练字图像;2)拆分已标定出训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。本专利技术提供给用户一种个性化的触屏汉字输入体验,用户可以自己指定渲染风格,进行触屏书写时,显示结果既保持输入轨迹特征也能体现出指定的书写风格。【专利说明】
本专利技术属于计算机文字信息处理与触屏交互信息处理
,具体涉及。
技术介绍
汉字数字墨水指的是对于触屏设备上的手写汉字输入进行字形渲染的方法。至今为止,触屏汉字输入不再局限于拼音或者手写识别这种基于标准字库的方法,越来越多诸如“笔记”概念的软件开始支持手写输入的汉字,就像用笔在纸上写字一样。然而在电子屏上用电子笔或者手指写字很难有真是纸笔的触感,我们需要假定输入的轨迹都是比较简单的轨迹,而且不附带其他除了笔速以外的任何信息(压力,笔的倾斜度等等)。目前,有以下几种实现手写数字墨水的方法:(I)物理模拟方法:在一些特殊的平板设备上,可以根据传感器等设备来获取电子笔的三维空间位置和触屏压力等参数。然后通过一些预定义的物理模型,根据这些参数来模拟出虚拟的运笔状态和墨汁扩散运动。这种方法对于设备有比较高的要求,因为它的模型需要较多的输入参数,一般要用到多个电子笔上的位置传感器和能够识别压力的触屏。(2)骨架-皮肤方法:这类方法首先预定义一些形状对应于不同方向和位置的笔迹输入,然后根据用户的输入轨迹,将最合适的形状在相应的位置进行黏贴,最终进行边缘平缓产生最终结果。此方法已经可以通过定义形状特征来体现风格,不过还没有机器学习的思想,产生的结果风格比较单调。(3)风格融合法:根据用户输入的笔画骨架,首先产生一个简单方法渲染的结果,然后根据其形状与标准字库中相应汉字的笔画进行线性插值融合,融合的程度参数可以由用户自行指定。这类方法能够比较好的在结果中体现用户风格和字库风格,但前提是字库必须是经过笔画拆分的。以上几种方法都可以产生美观的字形渲染结果,然而它们共同的缺点是只能渲染出单一风格的字形,而且对于不同的情况要求的前提条件过多。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的是提供一个能够学习汉字书写风格的系统,然后对于已学习的风格,能够根据用户的手写轨迹输入进行渲染,从而实现个性化的汉字数字墨水。本专利技术所述方法有了较大改进,在加入半自动化的机器学习方法后,能够仅仅根据输入轨迹产生出多变风格的字形。为达到以上目的,本专利技术采用的技术方案是:,其步骤包括:I)对字库中的所有同种笔画进行聚类,挑选出覆盖完整笔画的训练字并提取得到训练字图像;2)拆分已标定出所述训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对所述独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据所述带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在所述风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。更进一步,所述笔画训练字为:“屿”,“建”,“梁”,“帆”,“剃”,“瓯”,“际”,“陟”,“乳”,“地”,“逃”,“虏”,“报”,“转”,“狭”,“姨”,“烽”,“龚”,“悠”,“饿”,“疯”,“希”,“畅”,“诞”,“制”,“觊”,“松”,“茕”,“惘”,“翅”。更进一步,所述最大圆滚动算法为:I)用圆心来模拟运笔的轨迹,圆直径模拟墨汁扩散的程度;2)在笔画段图像的中部随机挑选一个位置作为起始,找到当前位置与两侧边缘相切的圆作为内部最大圆;3)根据所述最大圆向两个方向进行滚动是需要满足:下一个圆的圆心与当前圆的圆心在位置上相邻,且能够覆盖最多未覆盖的笔画内部的像素点;4)在拐角部分的圆滚动需要相切于拐角部的内侧边缘;5)在得到一串圆模拟的结果后,相邻的圆的圆心距离至少为半个像素。更进一步,所述笔画分段模型将笔画分为如下形状特征:中部,端部和拐角部三种笔画段,同种类笔画段所承载的笔画风格信息各不相同:在端部和/或拐角部,形状根据不同的书写风格有较大不同承载主要的风格信息;在中部,体现笔画的宽度和走向承载次要的风格信息。更进一步,在所述笔画分段模型中根据以下方法得到笔画段上的切分点:I)通过对于圆半径和圆心方向的变化程度,设定阈值来判断笔画不同部分的切分点,2)采用半径和方向对于圆下标的二阶导数设定阈值,对应的阈值分别为0.1与0.01 ;3)当某个点前后对应的值一个大于阈值一个小于阈值时,判定该点为一个切分点。更进一步,增加人工操作检查所述笔画分段模型的分割结果:在相应的笔画段切分位置点下提示点,根据提示点的位置进行新的笔画分段。更进一步,所述不同风格数据库按照笔画类型、笔画聚类、笔画序号、笔画段类型、笔画段序号分别作为索引记录了各个笔画段的风格特征;对所述笔画段中的形状特征:对笔画中段,记录宽度与方向趋势;对笔画端部与拐角部,记录边缘性状与接口信息并用Bezier曲线表达。更进一步,步骤5)中输入手写汉字进行渲染时,I)对于笔画中段,按照输入的轨迹作为新的骨架,以原来的宽度信息进行圆渲染;2)对于端部和拐角部,在接口处进行变形以贴合方向与宽度的变形,对于离接口处最近的Bezier曲线,调整接口处的关键点与第二个关键点,其余关键点保持不变;3)对于各个部分渲染的结果进行边缘平滑,首先对于每一个中段的边缘进行Bezier曲线拟合,然后整体的边缘便成为一个Bezier曲线的串;在接口处,合并相邻的两个低次Bezier曲线为一个更高次的Bezier曲线。更进一步,步骤5)中进行笔画分段时:对于每个笔画轨迹输入轨迹进行分段比配:若入口出口方向与风格化数据库对应笔画中的拐角部相符而且没有产生逆序匹配,则选择这两个拐角部作为一个匹配对。更进一步,步骤5)中笔画相似度匹配时按照如下方法挑选出输入轨迹段误差最小的笔画段:I)对笔画整体轨迹在整字图像中所占的位置与大小的相似性,以及笔画段自身的特征的相似性进行匹配:2)笔画中部进行整体轨迹方向的相似性计算,端部与拐角部进行接口处方向与宽度的相似性计算;3)整体的误差可以表征为:宽度差+高度差+中心位置距离差异;接口处的误差表征为:方向误差值/ π +宽度误差值/10 ;4)最终的误差值表征为:总体误差+笔画段误差,误差值越小则相似性越高。有益效果:本专利技术的效果在于提供给用户一种个性化的触屏汉字输入体验,用户可以自己指定渲染风格,进行触屏书写时,显示结果既保持输入轨迹特征也能体现出指定的书写风格。【专利附图】【附图说明】图1是本专利技术汉字数字墨水生成方法的一实施例中挑选出某种风格的训练字挑选出的30个训练字;图2是本专利技术汉字数字墨水生成方法的一实施例中个性化汉字数字墨水的实现流程框架图;图3是本专利技术汉字数字墨水生成方法的一实施例中个性化汉字数字墨水的实现步骤示意图;图4是本专利技术汉字数字墨水生成方法的一实施例中本文档来自技高网
...

【技术保护点】
一种个性化汉字数字墨水的生成方法,其步骤包括:1)对字库中的所有同种笔画进行聚类,挑选出覆盖完整笔画的训练字并提取得到训练字图像;2)拆分已标定出所述训练字图像的笔画骨架,得到独立笔画段图像;3)根据最大圆滚动算法对所述独立笔画段图像进行笔画书写轨迹还原,按照还原结果建立笔画分段模型,得到带有笔画风格的笔画段;4)根据所述带有笔画风格的笔画段中的形状特征建立不同风格数据库;5)在所述风格数据库中输入手写汉字进行渲染,经过笔画分段、笔画相似度匹配后得到汉字数字墨水。

【技术特征摘要】

【专利技术属性】
技术研发人员:易天旸连宙辉唐英敏肖建国
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1