字符串识别装置和方法制造方法及图纸

技术编号：5173986 阅读：258 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种识别字符串的方法，包括以下步骤：将字符串图像划分为多个片段；对所述多个片段进行ＯＣＲ识别，获得候选字符，其中，每一个片段对应于至少一个候选字符；获取片段的候选字符和／或片段的候选字符形成的字符组合的统计信息；以及结合所述统计信息以及候选字符的ＯＣＲ识别置信度来确定候选字符串。此外，本发明专利技术还公开了一种字符串识别装置。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种，即由字符串图像识别出字符串的装置和方法。
技术介绍
当今，通过OCR技术识别各种字符信息是很普遍的事情。例如，用户在纸上或触摸屏上写下一串字符，通过扫描、拍照或感应等转换为字符串图像，将该字符串图像输入识别系统，从而识别并输出该字符串值。在实际应用中存在各种字符串，例如字符串可能完全由字母组成，也可能由字母和数字混合组成，可能包含分隔符“.”，还可能包含分隔符“@”。对于这样的信息、特别是这些信息的手写体的识别现在变得越来越重要，因为随着互联网的迅速发展，在传送信息时使用到这种字符串的情况越来越频繁，例如用户会在触摸屏上手写输入Email地址。然而，对于这种字符串的识别，目前并没有特别高效的方法。
技术实现思路
本专利技术的目的是提出一种识别字符串的方法和装置。在下文中给出关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分，也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。根据本专利技术的一个方面，提供了一种识别字符串的方法，包括以下步骤将字符串图像划分为多个片段；对所述多个片段进行OCR识别，获得候选字符，其中，每一个片段对应于至少一个候选字符；获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息；以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。根据本专利技术的另一个方面，提供了一种字符串识别装置，包括片段划分...

【技术保护点】
一种识别字符串的方法，包括以下步骤：将字符串图像划分为多个片段；对所述多个片段进行ＯＣＲ识别，获得候选字符，其中，每一个片段对应于至少一个候选字符；获取片段的候选字符和／或片段的候选字符形成的字符组合的统计信息；以及结合所述统计信息以及候选字符的ＯＣＲ识别置信度来确定候选字符串。

【技术特征摘要】
1.一种识别字符串的方法，包括以下步骤将字符串图像划分为多个片段；对所述多个片段进行OCR识别，获得候选字符，其中，每一个片段对应于至少一个候选字符；获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息；以及结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。2.—种字符串识别装置，包括片段划分模块，用于将字符串图像划分为多个片段；OCR识别模块，用于对所述多个片段进行OCR识别，获得候选字符，其中，每一个片段对应于至少一个候选字符；统计信息获取模块，用于获取片段的候选字符和/或片段的候选字符形成的字符组合的统计信息；以及第一字符串确定模块，用于结合所述统计信息以及候选字符的OCR识别置信度来确定候选字符串。3.根据权利要求2所述的字符串识别装置，其中所述统计信息包括一个字符、字符类型和/或字符组合与至少一个预定字符、字符类型和/或字符组合一起出现的概率。4.根据权利要求2或3所述的字符串识别装置，其中所述字符组合为构成音节的字符组合或者同类型字符的组合。5.根据权利要求2或3所述的字符串识别装置，其中，所述字符串包括分隔符，其中，该字符串识别装置还包括分隔符识别模块，用于识别字符串中的分隔符。6...

【专利技术属性】
技术研发人员：白洪亮，郑大念，孙俊，诹访美佐子，武部浩明，堀田悦伸，于浩，直井聪，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人