信息处理方法和设备技术

技术编号：2891512 阅读：151 留言：0更新日期：2012-04-11 18:40

当由ＯＣＲ识别的文本被寄存且这些文本被一个检索字检索时，可消除一种状况，即在用ＯＣＲ识别时依靠错误识别不能进行检索的状况。本发明专利技术之目的在于实现这样一种处理：不因上述状况而把负担加于操作者或设备。在此提供一种ＯＣＲ处理器（２），用于识别储存的图像信息和输出识别的结果，同时按照似然度转换将作为识别结果而输出的候选字符数；和一种资料检索器（３），用于形成字符串以便从识别结果检索且作为检索文件而寄存。（*该技术在2015年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种信息处理方法和设备，它利用一种字符识别功能，例如OCR(光学字符识别)功能或类似功能，把输入图象信息转换成一种文本。本专利技术还涉及另一种信息处理方法和设备，它能够从一种文本形成一个检索数据库，该文本是利用一种字符识别功能，例如OCR功能或类似的功能，通过转换输入图象信号而得到的；它还能够检索所需要的数据。至今，当一个输入图象被一种OCR功能或类似功能识别并被转换成一种文本时，对于一个其中仅得出低相似性候选字符的输入字符，作为一种错误识别用的对策，就把相似性低的事实通知操作者，他可判断该候选字是正确还是错误。当它为错误时，就敦促操作者手工校正该错误的字符，并输入一个正确的字符。然而，根据这样一种方法，操作者必须不仅输入一个要转换成文本的图象，而且还要进行校正操作，因此存在着操作者感觉有负担的缺点。还有一种方法，藉此不仅可输出字符识别的结果，还可把由该字符识别得出的一个候选字符对照一本字典或一个知识库，从而校正一个被错误地识别的字符，而不必求助于操作者。然而，上述方法也存在一些缺点该字典或知识库必须存入校正过程用的一个存储器，并且这样一种使用它们的校正过程是复杂的，所花时间长，成为该设备的负担。本专利技术的一个目的在于消除操作者或设备的负担，用于把一个在OCR操作或类似操作的字符识别过程中可能产生的被错误地识别的字符校正成一个正确的字符；并使它能够有效地用于其他过程。本专利技术的另一个目的在于形成一个能够高质量地检索的数据库，而不必执行一种额外负担的过程，例如对在OCR操作或类似操作的字符识别过程中可能发生的被错误地识别的字符进行校正...

【技术保护点】
一种信息处理方法，包括下述步骤：储存图象信息；识别所述储存图象信息的字符和输出字符代码及其似然值；按照所述输出的似然值来判定用于一个字符图象信息的将被输出的候选字符的数；和寄存一个包括候选字符的所述判字数的候选者的识别结果。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：椎山弘隆，正木克己，
申请(专利权)人：佳能株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人