信息处理方法和信息处理设备技术

技术编号:2890237 阅读:191 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种分类生成方法,它恰当地反映了模式的宏观结构特征,并充分反映了类别之间的竞争关系。当一个输入模式由笔划形成时,一个训练笔划被分为多个段,并对分段的笔划进行向量量化。在分段的量化笔划中,相邻的笔划组被合成,分别生成上层笔划向量。在分层的笔划向量系列中,从上层笔划向量中选出一个使预定平均信息量函数达到最大值的向量,并向下层笔划向量组展开。结果,得到了一个分类树。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及模式识别,如字符和语音模式,尤其是一种为字符、语音等的模式识别提供数据的技术。传统上,为了对构成一种模式的手写字符进行识别,一个步进过程使用分类树对模式进行分类。由于使用分类树的传统识别方法中,为了准备节点,注意力只集中在各个节点的特征数上,不能确定模式更广泛的方面。为了生成一个识别带有大量特征的模式的分类树,必须采用一种方法,在各个节点上选择一个特征轴,因为计算是需要时间的。另外,有一种传统方法,使用一个N元语法表,用于句子识别,根据它,一个有限自动机被用作一种构成句子的语言模型,基于这种模型,计算出字符行出现的前置可能性。换句话说,根据这种方法,一个步骤是从大规模语句数据库中,计算关于构成句子的元素行连续的可能性。然而,对于包含几千种字符类别的语言如日语或中文来说,即使是构造一个三元语法表(N=3),也需要大量的语句数据。如果一个表是用少量的语句数据生成的,可靠转换可能性和不可靠转换可能性会在表中共存,产生缺陷。构造分类树的传统方法是通过包含模式逐步退化的预处理来进行的。根据这种方法,对模式的宏观到微观形式,能够构造一个平衡很好的分类树。结果,可以产生一种尽可能接近人类识别能力的识别功能。但是,由于这种方法用多种训练模式来吸收模式修正,所以就需要有庞大数量的训练模式。这种情况将结合图32来解释。假设根据传统方法,为从“0”到“9”的数字位图识别产生一个分类树。一个用上述方法建立的分类树形状如图32中所示。三种类别的训练模式,“4”、“5”和“6”,在图32中从右边起第五个分支。换句话,广义地讲,在图32右起第五分支上,只有“4”、“5”和“6”三个类别对训练模式是有效的。作为例子,考虑一个完整的使用如此提供的分类树的新位图模式识别过程。广义来说,图41A到41E中所示的所有位图都有与图32右起第五分支相同的形状。换句话说,当上面解释的分类树用于识别这些位图时,位图总是被分类为属于类别“4”、“5”和“6”。结果,图41A到41C中的位图被正确地识别出来,但图41D中所识别的位图会被排除,而图41E中的位图显然是被错误识别的。这种缺陷产生的原因是,模式中没有如图41E中位图形状的类别“2”。这说明,对传统方法来说,需要包含所有可能的排列变化的数目庞大的训练模式。因此,本专利技术的一个目的是提供一种分类树的生成方法,用于生成一个由笔划向量组成的分类树,用它可以恰当地反映一个有大量特征的模式的宏观结构特征并可以恰当地反映存在于类别之间的竞争关系,本专利技术还提供与该方法相应的设备;并提供一种字符识别方法,通过它,一个已生成的分类树被用于在高速和高识别率下识别字符,以及与该方法相应的设备。依据本专利技术,从一个字符模式中能够有效地生成一个分层的字符模式。另外,在已生成的分层字符模式的基础上,可以产生一个分类树,其中类别的竞争在上层最激烈,其中类别被优先在紧接着的下一层分类。进而,用产生的分类树可以生成一个存储器有效的N元语法表。而且,通过查找如此得到的N元语法表,能够进行高速和高识别率的识别。根据本专利技术,从训练模式中提取子模式,而且对子模式的分层提前进行。基于分层的子模式,子模式的分类树就准备好了,由此,即使以很少数量的训练模式,也可以提供高识别率。根据本专利技术,在分层过程中,数据从详细子模式数据的依次退化中产生,所以能够提供快速的识别处理过程。根据本专利技术,分类树通过从高级到低级展开的分层子模式数据而得到,所以能够提供有高识别效率的字典数据。根据本专利技术,当子模式被看作通过分割训练模式而得到的模式段时,子模式的准备就变得容易了。根据本专利技术,选择一个分类效率最高的变量,对所选的变量准备一个分类树。作为结果,可以提供一个与传统不同的有效的分类树。根据本专利技术,分层在一个输入模式上进行。通过跟踪分类树来识别分层的输入模式,从模式的高级数据一直持续到低级。结果,得到了高速度下的高识别率。根据本专利技术,当模式由位图数据组成时,可以对通过扫描仪等输入的图象数据进行高效的识别。根据本专利技术,当模式是笔划数据时,可以对由笔输入的笔迹数据进行高效的识别。根据本专利技术,当模式为语音数据时,能够对由麦克风等输入的语音数据进行高效的识别。附图说明图1是一个方块图,描述依据本专利技术第一实施方案的设备设置;图2是一个流程图,表现第一实施方案生成一个联机手写字符识别字典的方法;图3是一个流程图,表现第一实施方案生成一个联机手写字符识别字典的过程;图4用来解释在第一实施方案中的一个笔划生成阶段的处理;图5显示了一个分层向量序列;图6解释在第一实施方案中向量的平均化过程;图7显示第一实施方案的分类树;图8显示在第一实施方案中,联机手写字符识别字典的分类树的示例数据配置;图9是一个流程图,显示第一实施方案的联机手写字符识别方法;图10是一个详细流程图,表现第一实施方案的分类树产生过程;图11描述了第一实施方案在图10的步骤S1007中分支的生成;图12描述了根据第一实施方案的设备的第一设置;图13描述了根据第一实施方案的设备的第二设置;图14是一个方块图,描述了依据第二实施方案的设备设置;图15是一个概念图,表现依据第二实施方案的信息处理;图16描述了一个金字塔形状的神经网络,它是第二实施方案处理过程的一部分;图17是一个流程图,显示依据第二实施方案的信息处理;图18描述了依据第二实施方案的一个示例性训练模式;图19描述了依据第二实施方案的一个分层训练模式的例子;图20显示了依据第二实施方案的一个分类树生成过程;图21描述了依据第二实施方案生成的分类树的例子;图22显示了一个依据第二实施方案的大类别分组的例子;图23是一个流程图,描述了依据第二实施方案的第二处理过程;图24是第二流程图,描述了依据第二实施方案的信息处理过程;图25描述了依据第二实施方案的程序模块的存储器布局例子;图26描述了依据第三实施方案的设备的硬件设置;图27描述了依据第三实施方案的分类树准备过程;图28描述了依据第三实施方案的设备配置;图29是一个流程图,描述了第三实施方案的处理过程;图30解释了依据第三实施方案对子模式的提取;图31描述了依据第三实施方案的金字塔形;图32显示一个依据第三实施方案而产生的分类树;图33是一个流程图,描述了依据第三实施方案的分类准备过程;图34描述了低级的分层模式,它们是依据第三实施方案,通过所选择的神经元产生的;图35描述了一个依据第三实施方案最终准备的分类树;图36描述了依据第三实施方案的识别处理;图37描述了依据第三实施方案的分类树生成过程;图38是一个流程图,描述了依据第三实施方案的第二处理过程;图39描述了依据第三实施方案的子向量提取设备;图40描述了依据第三实施方案的第二识别处理过程;图41A、41B、41C、41D和41E描述了现有技术;图42描述了依据第三实施方案,对一个语音模式进行傅里叶变换,而得到的包络线;图43显示了对应于X轴频率的语音模式的强度;及图44显示了对应于X轴时间的语音模式的频率。在第一实施方案中,描述了一种为识别一个联机输入的笔划而生成分类树的方法及使用生成的分类树的识别处理过程。首先,描述依据这个实施方案识别字符的方法和设备的主要特点,随之是它们的详细描述。在依据本实施方案的字符识别方法中,本文档来自技高网...

【技术保护点】
一种生成分类树的信息处理方法,分类树是字符识别使用的识别字典,包括:一个分割步骤,将预定的训练笔划分为多个段;一个向量量化步骤,对所述分割步骤得到的所述段中的所述笔划进行向量量化;分层笔划向量生成步骤,合成所述分割步骤得到的分为 所述段的相邻笔划,获得笔划组生成上层笔划向量,并产生一个分层的向量系列;及一个分类树生成步骤,在所述分层笔划向量生成步骤得到的所述分层笔划向量系列中,从上层笔划向量中选择一个使预定平均信息量函数达到最大值的笔划向量,并展开所述笔划向量, 产生低层笔划向量,生成一个分类树。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:吉井裕人新井常一高须英司
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1