公开了改进手写识别操作的各种技术和技巧。手写输入在训练模式中接收,并令其通过若干基本识别器来生成若干备选项列表。备选项列表被联合成组合的备选项列表。如果正确结果处于组合列表中,则使用每一正确/不正确备选项对来生成训练模式。存储与备选项对相关联的权重。在运行时,正如训练时那样生成组合备选项列表。经训练的比较器网可用于比较组合列表中的任何两个备选项。与一个或多个神经网络基本识别器一起使用模板匹配基本识别器来改进识别操作。系统提供已经对于印刷体和草书数据进行了训练的比较器网和重新定序网过程以及仅对于草书数据进行了训练的比较器网和重新定序网过程。相应地使用各个比较器网和重新定序网过程。
【技术实现步骤摘要】
【国外来华专利技术】用于提供手写识别的组合器背景诸如图形输入板pc和个人数字助理等启用笔的设备通常使用一种或多种类型的手写识别器来允许用户使用笔来输入数据。手写识别器根据一系列分类 器分析用户的手写笔迹以确定最有可能的匹配。由于人与人之间或同一人书写 同一字符的大量变化(或书写风格),通常难以对草写体手写笔迹达到良好的手写识别结果。例如,N个笔画的字符可用l-N个笔画书写(潜在地产生2AN 种书写),且人与人之间以及字符与字符之间连接笔画的方式可能变化很大。 此外,东亚预言通常有约10,000个字符(码点或类),这进一步使问题复杂化。 困难也因不均匀的数据分布(诸如当存在比草写体样本多得多的印刷体训练样 本时)而造成,这导致在原型数据库中存在与印刷体样本的数目相比有限数目 的草写体样本。当使用神经网络来用于字符识别时,产生另一难点。神经网络通常不能良好地縮放到数千个类或字符。在神经网络识别器中试图支持所有这 些字符可能会急剧地降级系统准确性。概述公开了改进手写识别操作的各种技术和技巧。手写输入在训练模式中接 收,并令其通过若干基本识别器来生成若干备选项列表。备选项列表被联合在 一起以生成新的组合备选项列表(诸如具有N个备选项)。如果在组合备选项 列表中存在正确的结果,则使用新组合备选项列表中正确/不正确备选项对中的 每一个(其中共有N-1个)来生成训练模式以训练可学习哪个备选项是正确的 识别系统(被称为比较器网)(即,可用来比较两个备选项的系统)。存储与 备选项对相关联的权重供识别操作使用。在运行时,按照与训练时相同的方式生成组合备选项列表。经训练的比较 器网可用于比较组合备选项列表中的任何两个备选项。在一个实现中,与比较 器网一起使用排序功能(或最大值功能)来对组合备选项列表重新定序以改进准确性。在一个实现中,与一个或多个神经网络基本识别器一起使用模板匹配 基本识别器来改进识别操作。该系统提供对已经对于印刷体和草写体数据进行 了训练的比较器网和重新定序网过程以及对仅对于草写体数据进行了训练的 比较器网和重新定序网过程的访问。然后根据手写输入是印刷体还是草写体来 使用相应比较器网和重新定序网过程。提供本概述以便以简化形式介绍将在以下详细描述中进一步描述的一些 概念。该概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在 用于帮助确定所要求保护的主题的范围。附图简述附图说明图1是示出供识别操作使用的基于比较器网的组合器的一个实现的系统 的示意图。图2是图1系统的一个实现的的过程流程图,它示出了执行手写识别训练 操作来产生基于比较器网的组合器时所涉及的各个阶段。图3是图1系统的一个实现的的过程流程图,它示出了使用基于比较器网 的组合器来执行手写识别操作时所涉及的各个阶段。图4是示出供识别操作使用的基于比较器网和重新定序网的组合器的一个实现的系统的示意图。图5是图4系统的一个实现的的过程流程图,它示出了执行手写识别训练 操作来产生比较器网和重新定序网时所涉及的各个阶段。图6是图4系统的一个实现的的过程流程图,它示出了使用比较器网和重 新定序网过程来执行手写识别操作时所涉及的各个阶段。图7是图1和图4系统的一个实现的的过程流程图,它示出了使用对基本 识别器的约束来执行识别操作时所涉及的各个阶段。图8是图1和图4系统的一个实现的的过程流程图,它示出了提供基于比 较器网和重新定序网的组合器来改进手写识别时所涉及的各个阶段。图9是图1和图4系统的一个实现的过程流程图,它示出了除神经网络识 别器以外添加模板匹配(或最近邻居)基本识别器来改进縮放性时所涉及的各 个阶段。图IO是图1和图4系统的一个实现的的过程流程图,它示出了基于墨迹的草写体程度(cursiveness)来提供分层组合器体系结构时所涉及的各个阶段。 图11是一个实现的计算机系统的示意图。详细描述为促进对本专利技术原理的理解,现将参考附图中所示的各实施例,并将使用 专用语言来描述它们。然而,要理解,并不旨在对范围进行限制。在所述实施 方式中的任何改变和进一步修正,以及在此所述的原理的进一步应用可以预期 将是本领域技术人员通常能想到的。可在一般上下文中将该系统描述为改进手写识别的应用程序,但是该系统 还用于除此之外的其它目的。在一个实现中,此处所描述的一种或多种技术可 被实现为手写识别程序内、或来自任何其它类型的用于训练手写识别器或识别 手写输入的程序或服务的特征。图1是示出供识别操作使用的基于比较器网的组合器的一个实现的系统 98的示意图。系统98从用户接收墨迹100 (例如,手写输入),诸如有1-3 个笔画。令墨迹100通过多个基本手写识别器102,诸如神经网络识别器104、 神经网络识别器106和模板/原型匹配识别器108。在一个实现中,神经网络识 别器104是在线识别器,而神经网络识别器106是离线识别器。在一个实现中, 原型/模板匹配识别器108将墨迹段与数据库中墨迹样本进行比较以确定最有 可能的结果的概率列表。也可使用其他变化和数量的识别器,包括与此处所述 相比更少或更多的一个或多个类型的识别器。在令墨迹100通过基本手写识别 器102之后,来自每一过程的备选项列表被合并成一新的备选项列表。备选项 列表是字符以及指示各个字符是正确结果的可能性的相应得分的列表。在本文 的系统的一个实现中,对备选项列表的长度有上限。由基于比较器网的组合器 110使用新的备选项列表以执行识别操作。然后提供结果112。将参考图2-3 进一步详细描述系统98。现转向图2-3并继续参考图1,将进一步详细描述用于实现识别系统98 的一个或多个实现的各个阶段。图2是图1的系统98的一个实现的的过程流 程图,它示出了执行手写识别训练操作来产生基于比较器网的组合器110时所7涉及的各个阶段。在一种形式中,图2的过程至少部分地用计算设备600 (在 图11中描述)的操作逻辑来实现。该过程在起始点240处开始,从用户接收手写输入用于训练操作(阶段 242)。在一个实现中,手写输入(例如,墨迹IOO)是l-3个笔画的(例如, 少于4个笔画)。令手写输入通过第一神经网络识别器104 (例如,在线或其 他)以生成带有得分的备选项列表(阶段244)。令手写输入通过第二神经网 络识别器106 (例如,离线或其他)以生成带有得分的另一备选项列表(阶段 246)。还令手写输入通过模板/原型匹配识别器108以生成带有得分的另一备 选项列表(阶段248)。在一个实现中,这些采用基本识别器的识别是不受约 束的。如将在图7中进一步详细描述的,在另一实现中,来自一个识别器的备 选项列表被用作采用接下来的识别器的后续识别操作的约束。这是在图1上所 示的替换实现,虚线从识别器104流向106再流向108。备选项列表被联合在一起使得有一唯一列表(阶段250)。例如,假定有 以下备选项列表备选项列表1: 备选项列表2: 备选项列表3: 组合的备选项列表将包括,这是原始备选项列表中所包括 的所有内容的唯一列表。如果正确的结果(假定为C)位于组合的备选项列表 中,则使用正确/不正确备选项对的各个组合来训练基于比较器网的组合器110 (阶段252)。如果组合的备选项列表不包含正确的结果,则不从该特定的墨 迹样本生成用于比本文档来自技高网...
【技术保护点】
一种用于改进手写识别的方法,包括: 在训练模式中接收第一手写输入(242); 使所述第一手写输入通过多个识别器(102)来生成多个备选项列表(244); 将所述多个备选项列表合并在一起以生成新的备选项列表(250); 当正确结果已知时一起比较所述新备选项列表中的多个字符对来基于备选项对训练识别系统(252);以及 存储与所述多个字符对相关联的一组权重供稍后在识别操作中使用(254)。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:Q张,AA阿布杜勒卡德,MT布莱克,
申请(专利权)人:微软公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。