基于分割的辨认方法技术

技术编号:2927260 阅读:185 留言:0更新日期:2012-04-11 18:40
一种用来辨认手写图形的方法,包括在手写图形的一系列探测到的点中选择核心点。所选择的核心点用于分割并识别所述手写图形。所述方法还包括在所述手写图形的点的序列中识别可能的附加符号、确定每个核心点的特性、为核心点子集中的每个核心点分配至少一个与被识别的可能的附加符号相关联的特性、以及比较所述手写图形和模板。所述比较包括通过下述步骤逐步依次分析所述核心点,即,将核心点序列的特性与所述模板进行匹配并计算距离值,其中所述核心点序列或者从所述第一个核心点开始或者从前一个序列的最后的核心点开始,以及将累积距离值分配给所述被匹配的核心点序列中的最后的核心点,由此,最小累积距离值被分配给所述最后的核心点,它对应着一个匹配模板序列,该模板序列表示所述手写图形的一个可能的辨认结果。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及到 一种辨认手写图形的方法,其中该手写图形包含表示多 个符号的一条或多条曲线。
技术介绍
今天,手写正在变成越来越普及的输入数据到数据处理单元,特别是到手机和个人数字助理(Personal Digital Assistant, PDA)中的方法。为了 处理所输入的数据,必须辨认和解释笔迹。大多数辨认笔迹的现有方法要 求将要输入的字符^皮一个一个地写,并被一个一个地认。这种方法的一个例子在US 4,731,857中给出,但是最有名的是由Palm, Inc.制造的 Graffiti 。为了加速数据的输入,希望允许使用草书。然而,草书笔迹的辨认比 单独字符的辨认要复杂得多。草书笔迹辨认中复杂性的增加是源于连起来 的字符的分割问题,即源于手写图形中从一个字符到另 一个字符的过渡的 识别问题。因此,草书笔迹辨认中的误差可以以两个层次出现,这使得清 晰的顺序辨认系统的构造大大地复杂化了 。辨认草书笔迹的方法通常受到这样的问题的困扰,即在相邻字符之间 有许多可能的分割方法,这构成了手写图形的可能分割的組合方式的剧 增。所以,目前大多数的商用系统使用复杂的统计系统,采用神经网络和 隐马尔可夫模型,同时带有集成的字典。这种系统的例子见P.Neskovic and LCooper, "Neural network-based context driven recognition of on-line cursive script (基于神经网络的在线草书手迹的情景导向辨认方法)", Seventh International Workshop on Frontiers in Handwriting RecognitionProceedings, p. 352-362, September 2000和M.Schenkel and I.Guyon, "On-line cursive script recognition using time delay networks and hidden markov models"(使用延时网络和隐马尔可夫模型的在线草书手迹的辨认 方法),Machine Vision and Applications, Vol. 8, pages 215-223, 1995。这些 系统的一个主^点是,它们非常大而且要求有很大的训练集。此外,它 们高度依赖于所用的字典。
技术实现思路
本专利技术的一个目标是,提供一种用于辨认草书笔迹的改善了的方法。 本专利技术的另一个目标是,提供一种能快速分割并辨认手写图形的方法。本 专利技术还有一个目标是,提供一种不需要广泛学习并且不需要很大的处理能 力的方法。上述目标中至少一些可以由根据独立权利要求所述的方法、装置和计 算机程序产品来实现。在权利要求书中的附属项中阐明了本专利技术的特定的 实施例。因此,本专利技术提供了一种用来辨认手写图形的方法,其中该手写图形 包括一条或多条曲线并表示多个符号。所述方法包括探测所述手写图形, 将所述手写图形作为沿着一条或多条所述手写图形曲线的点的序列,在所 述手写图形的点的序列中识别可能的附加符号,在所述点的序列中选择核 心点,其中,所选择的核心点被用于分割所述手写图形并将所述手写图形 的这些,皮分割的片断辨i^为符号,确定一条或多条曲线在每个核心点处或 在其附近的的特性,为核心点子集中的每个核心点分配至少一个与4皮识别 的可能的附加符号相关联的特性,以及比较所述手写图形和模板,每个模 板表示至少一个符号或者符号的一部分。所述比较包括逐步依次分析所述 核心点,其中核心点表示可能的分割点,从第一个可能的分割点到第二个 可能点分割点的核心点序列表示可能的符号,通过下述步骤进行所述的分 析,将核心点序列的特性与所述模板进行匹配并计算距离值,其中所述核 心点序列或者从所述第一个核心点开始或者从前一个核心点序列的最后的核心点开始,以及将累积距离值分配给所述被匹配的核心点序列中的最 后的核心点,所述累积距离值是被分配给所述序列中的第一个核心点的距 离值与被计算出来的距离值的和,由此,所有连续的核心点的最小累积距 离值被分配给所述最后的核心点,该最小累积距离值对应着一个匹配模板 序列,该模板序列将多个符号表示为所述手写图形的可能的辨1^人结果。本专利技术也提供一种用于识别手写图形的装置,其中该手写图形包括表示多个符号的一条或多条曲线,所述装置包括执行上述方法的工具。 本专利技术也提供一种可以直接加栽到数据处理单元的内存中的计算机程序产品,包括用于执行上述方法的软件代码部分。由于有本专利技术,故可以快速地辨认表示几个符号的手写图形。通过使用核心点来进行分割和辨认,计算过程将同时把手写图形分开并把该图形 与模板进行匹配。因此,将手写图形与模板进行比较的过程是很快的。在 所有的核心点被分析过之后,累积距离值被分配给最后的核心点,并与已 经和所述手写图形进行了匹配的模板序列相关联。因此,被分配给最后一 个核心点的信息可以很容易地被用来获得对手写图形的可能的辨认结果。 此外,通过识别可能的附加字符并将它们分配给核心点子集,容易获得高 的命中率,即发现正确的解释,而且辨认过程可以仍然很快。已经认识到,棉^据一些标准,通过选择有限数目的可能分割点,可以 只用与这些可能的分割点相关的信息来辨i人手写图形的片断。因此,已经 认识到,不需要使用神经网络或隐马尔可夫(hidden markov)模型来辨 认草书笔迹。取而代之的是,选择可能的分割点并使用这些可能的分割点 来辨认手写图形中的符号。核心点的选择从所述探测的序列中去掉了大量的点。因此,选择便于 处理的数量的核心点,这就限制了将核心点序列与模板进行比较时所需要 的计算量。已经认识到,对于辨认手写图形来说,所探测到的点的序列中 的一大部分信息是冗余的。所以,去掉大量的点几乎不影响正确辨认手写 图形的可能性。另外,由于在辨认过程中使用了有限数目的点,可以使用 几个模板来辨认同一个符号。因此,模板可以表示异形字,即书写同一符号时的不同形状或风格。有利的是,只选择那些构成手写符号中的可能的分割点的核心点。这当然就减少了要分析的核心点的it目,由此,所述方法非常快。如在这里所用的,术语"符号,,应该;故解释为具有特定意义的^f壬何的 形式,诸如字符、拉丁文、汉字或任何其它种类、字符之间之前之后的连 字、数字、或任何标点符号。此外,术语"手写图形"应该被解释为由人 所书写的特定形式的符号或符号序列。根据实施例,所述比较通过下面步骤进行形成图,该图具有节点和 连接所述节点的弧线,其中每个节点表示一个核心点,该核心点对应着所 述手写图形中两个符号之间的一个可能的分割点,每条弧线表示沿着核心 点序列从一个节点到另一个节点的一条路径,所^径对应着所述手写图 形中的可能符号,通过将所述核心点序列的特性与所述模板进行匹配,为 每条路径分配至少 一个距离值,以及至少确定贯穿从所述笫 一个节点到最 后一个节点的图的具有最小累积距离值的路径,所述路径对应着匹配的模 板序列,该序列表示对所述手写图形的可能的辨认结果。通过形成一个图,可以安排按顺序的核心点的逐步分析。这意味着, 对要进行的计算可以获得良好的控制,并且累积距离的结果可以在结构上 与节点和弧本文档来自技高网
...

【技术保护点】
一种用来辨认手写图形的方法,其中该手写图形包括一条或多条曲线并代表多个符号,所述方法包括:    探测所述手写图形,沿着所述手写图形的所述一条或多条曲线得到一个点的序列,    在所述手写图形的所述点的序列中识别可能的附加符号,    在所述点的序列中选择核心点,其中,所选择的核心点被用于分割所述手写图形,并将所述手写图形的这些片断辨认为符号,    确定在每个核心点处或在其附近的所述一条或多条曲线的特性,    为核心点子集中的每个核心点分配至少一个与被识别的可能的附加符号相关联的特性,以及    比较所述手写图形和模板,每个模板表示至少一个符号或者符号的一部分,所述比较包括:    逐步依次分析所述核心点,其中核心点表示可能的分割点,从第一个可能的分割点到第二个可能点分割点的核心点序列表示可能的符号,通过下述步骤进行所述的分析    将核心点序列的特性与所述模板进行匹配并计算距离值,其中所述核心点序列或者从第一个核心点开始或者从前一个核心点序列的最后的核心点开始,以及    将累积距离值分配给所述匹配的核心点序列中的最后的核心点,所述累积距离值为被分配给所述序列中的第一个核心点的距离值与被计算出来的距离值的和,    由此,所有连续的核心点的最小累积距离值被分配给所述最后的核心点,它对应着一个匹配的模板序列,该模板序列将多个符号表示为所述手写图形的可能的辨认结果。...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J施特恩比
申请(专利权)人:ZI德库玛股份公司
类型:发明
国别省市:SE[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术