当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于来自图像的文本的机器语言翻译的方法和服务器技术

技术编号:14705009 阅读:123 留言:0更新日期:2017-02-25 09:36
一种计算机实现技术可以包括在服务器处从移动计算设备接收包括文本的图像,所述服务器具有一个或多个处理器。所述技术可以包括在服务器处获得对应于文本的光学字符识别(OCR)文本,该OCR文本是通过对图像执行OCR而获得的。所述技术可以包括在服务器处从图像识别非文本上下文信息,所述非文本上下文信息(i)表示除所述文本本身之外的上下文信息以及(ii)指示所述图像的上下文。所述技术可以包括基于所述非上下文信息,在服务器处获得OCR文本到目标语言的翻译以获得所翻译的OCR文本。所述技术可以包括从服务器向移动计算设备输出所翻译的OCR文本。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2014年6月24日提交的美国申请号14/313,670的优先权。上述申请的公开被整体地通过引用并入到本文中。
本公开一般地涉及光学字符识别(OCR)和机器语言翻译,并且更特别地涉及用于基于来自图像的非文本上下文信息的对来自图像的OCR文本的机器语言翻译的技术。
技术介绍
本文中提供的背景描述是出于一般地呈现本公开的上下文的目的。在已经在
技术介绍
小节中进行描述的程度上,本专利技术人的工作以及以其它方式在提交时未被承认为现有技术的本描述的各方面既未明示地、也为隐含地被认可为针对本公开的现有技术。光学字符识别(OCR)涉及到使用计算设备(例如,服务器)的图像中的文本的检测。OCR可以提供用以在用户设备处以数字形式获得文本的更快方式(例如,与由用户向用户设备手动输入文本相比)。在获得图像中的文本之后,可以以各种方式利用该文本。例如,该文本可被计算设备处理、被存储在存储器处和/或被发送到另一计算设备。处理文本的一个示例是机器语言翻译,其涉及到使用计算设备将文本从源语言翻译成不同的目标语言。
技术实现思路
在一个方面,提出了一种计算机实现的技术。所述技术可以包括在服务器处从移动计算设备接收包括文本的图像,所述服务器具有一个或多个处理器。所述技术可以包括在服务器处获得对应于文本的光学字符识别(OCR)文本,所述OCR文本是通过对图像执行OCR而获得的。被技术可以包括在服务器处从图像识别非文本上下文信息,所述非文本上下文信息(i)表示除文本本身之外的上下文信息且(ii)指示图像的上下文。所述技术可以包括基于非文本上下文信息,在服务器处获得OCR文本到目标语言的翻译以获得所翻译的OCR文本。所述技术还可以包括从服务器向移动计算设备输出所翻译的OCR文本。在某些实施例中,所述技术还包括在服务器处获得OCR文本到目标语言的翻译以获得基准翻译的OCR文本,以及在服务器处基于非文本上下文信息来调整基准翻译的OCR文本以获得所翻译的OCR文本。在其它实施例中,所述技术还包括在服务器处基于非文本上下文信息来确定文本的源语言,其中,所翻译的OCR文本进一步基于源语言。在某些实施例中,所述技术还包括在服务器处基于非文本上下文信息来确定捕捉到图像的位置的类型,其中,所翻译的OCR文本进一步基于位置的类型。在其它实施例中,所述技术还包括在服务器处确定移动计算设备的地理位置,其中,所翻译的OCR文本进一步基于移动计算设备的地理位置。在某些实施例中,所述技术还包括在服务器处基于地理位置来获得地图信息,以及在服务器处使用地图信息来识别地理位置附近的兴趣点,其中,所翻译的OCR文本进一步基于所述地理位置附近的兴趣点。在其它实施例中,所述技术还包括在服务器处确定对应于移动计算设备的用户的用户历史,其中,所翻译的OCR文本进一步基于用户历史。在某些实施例中,所述非文本上下文信息包括文本的字体。在其它实施例中,所述非文本上下文信息包括以下的至少一个:(i)图像中的对象和(ii)图像中的对象的形状。在某些实施例中,所述非文本上下文信息包括对象的颜色中的至少一个,并且其中,所述技术还包括在服务器处基于对象的颜色来确定图像是在室内还是室外捕捉的,其中,所翻译的OCR文本进一步基于图像是在室内还是室外捕捉的。还呈现了一种具有被配置成执行操作的一个或多个处理器的服务器。所述操作可以包括从移动计算设备接收包括文本的图像。所述操作可以包括获得对应于文本的OCR文本,所述OCR文本是通过对图像执行OCR而获得的。所述操作可以包括从图像识别非文本上下文信息,所述非文本上下文信息(i)表示除文本本身之外的上下文信息以及(ii)指示图像的上下文。所述操作可以包括基于非文本上下文信息,获得OCR文本到目标语言的翻译以获得所翻译的OCR文本。所述操作还可以包括向移动计算设备输出所翻译的OCR文本。在某些实施例中,所述操作还包括获得OCR文本到目标语言的翻译以获得基准翻译的OCR文本,以及基于非文本上下文信息来调整基准翻译的OCR文本以获得所翻译的OCR文本。在其它实施例中,所述操作还包括基于非文本上下文信息来确定文本的源语言,其中,所翻译的OCR文本进一步基于源语言。在某些实施例中,所述操作还包括基于非文本上下文信息来确定捕捉到图像的位置的类型,其中,所翻译的OCR文本进一步基于位置的类型。在其它实施例中,所述操作还包括确定移动计算设备的地理位置,其中,所翻译的OCR文本进一步基于移动计算设备的地理位置。在某些实施例中,所述操作还包括基于地理位置来获得地图信息,以及使用地图信息来识别地理位置附近的兴趣点,其中,所翻译的OCR文本进一步基于所述地理位置附近的兴趣点。在其它实施例中,所述操作还包括确定对应于移动计算设备的用户的用户历史,其中,所翻译的OCR文本进一步基于用户历史。在某些实施例中,所述非文本上下文信息包括文本的字体。在其它实施例中,所述非文本上下文信息包括以下中的至少一个:(i)图像中的对象和(ii)图像中的对象的形状。在某些实施例中,所述非文本上下文信息包括对象的颜色中的至少一个,并且其中,所述操作还包括基于对象的颜色来确定图像是在室内还是室外捕捉的,其中,所翻译的OCR文本进一步基于图像是在室内还是室外捕捉的。根据在下文中提供的详细描述,本公开的更多适用领域将变得显而易见。应理解的是本详细描述和特定示例仅仅意图用于说明的目的且并不意图限制本公开的范围。附图说明根据本详细描述和附图将更全面地理解本公开,在所述附图中:图1是根据本公开的某些实施方式的包括示例服务器和示例移动计算设备的计算网络的图;图2是图1的示例服务器的功能框图;图3A-图3B图示出根据本公开的某些实施方式的每一个具有相同文本但不同的非文本上下文信息的示例图像对;图4A-图4B图示出根据本公开的某些实施方式的每一个具有相同文本但不同的非文本上下文信息的另一示例图像对;以及图5是根据本公开的某些实施方式的用于基于来自图像的非文本上下文信息的来自图像的OCR文本的机器语言翻译的示例技术的流程图。具体实施方式常规系统从图像获得光学字符识别(OCR)文本并执行OCR文本从其源语言到期望语言的机器语言翻译。然而,某些单词和/或短语在某些语言中可能具有多个意义。这些多个意义中的每一个可取决于特定单词或短语的上下文。例如,德语单词“rind”可意指“牛肉”和“奶牛”两者。常规系统将把OCR文本“rind”翻译成英语的“beef(牛肉)”或“cow(奶牛)”中任一个,例如哪个单词在英语中具有较高使用率。并且例如,英语单词“bearright”可以意指“向右”“转向”、“转弯”或“止住”以及“熊”(动物)“在右边”两者。这些系统并未考虑到图像中的可指示其上下文的其它信息,该信息可以用来确定正确的意义并因此获得正确或期望的翻译。因此,呈现了用于来自图像的OCR文本基于来自图像的非文本上下文信息的机器语言翻译的技术。如本文所使用的“非文本上下文信息”指的是来自图像的除文本本身之外的指示图像的上下文的任何信息。非文本上下文信息包括从图像本身提取且指示图像的上下文的信息(特征、对象等)。换言之,非文本上下文信息是从图像提取或导出(例如,在图像内部)的信息而不是关于图像的信息(例如,在图本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580033709.html" title="用于来自图像的文本的机器语言翻译的方法和服务器原文来自X技术">用于来自图像的文本的机器语言翻译的方法和服务器</a>

【技术保护点】
一种计算机实现的方法,包括:在服务器处从移动计算设备接收包括文本的图像,所述服务器具有一个或多个处理器;在所述服务器处获得对应于所述文本的光学字符识别OCR文本,所述OCR文本是通过对所述图像执行OCR而获得的;在所述服务器处从所述图像识别非文本上下文信息,所述非文本上下文信息(i)表示除所述文本本身之外的上下文信息且(ii)指示所述图像的上下文;基于所述非文本上下文信息,在所述服务器处获得所述OCR文本到目标语言的翻译以获得所翻译的OCR文本;以及从所述服务器向所述移动计算设备输出所翻译的OCR文本。

【技术特征摘要】
【国外来华专利技术】2014.06.24 US 14/313,6701.一种计算机实现的方法,包括:在服务器处从移动计算设备接收包括文本的图像,所述服务器具有一个或多个处理器;在所述服务器处获得对应于所述文本的光学字符识别OCR文本,所述OCR文本是通过对所述图像执行OCR而获得的;在所述服务器处从所述图像识别非文本上下文信息,所述非文本上下文信息(i)表示除所述文本本身之外的上下文信息且(ii)指示所述图像的上下文;基于所述非文本上下文信息,在所述服务器处获得所述OCR文本到目标语言的翻译以获得所翻译的OCR文本;以及从所述服务器向所述移动计算设备输出所翻译的OCR文本。2.根据权利要求1所述的计算机实现的方法,还包括:在所述服务器处获得所述OCR文本到所述目标语言的翻译以获得基准翻译的OCR文本;以及在所述服务器处基于所述非文本上下文信息来调整所述基准翻译的OCR文本以获得所翻译的OCR文本。3.根据权利要求1所述的计算机实现的方法,还包括在所述服务器处基于所述非文本上下文信息来确定所述文本的源语言,其中所翻译的OCR文本进一步基于所述源语言。4.根据权利要求1所述的计算机实现的方法,还包括在所述服务器处基于所述非文本上下文信息来确定捕捉所述图像的位置的类型,其中所翻译的OCR文本进一步基于所述位置的类型。5.根据权利要求1所述的计算机实现的方法,还包括在所述服务器处确定所述移动计算设备的地理位置,其中所翻译的OCR文本进一步基于所述移动计算设备的所述地理位置。6.根据权利要求5所述的计算机实现的方法,还包括:在所述服务器处基于所述地理位置来确定地图信息;以及在所述服务器处使用所述地图信息来识别所述地理位置附近的兴趣点,其中,所翻译的OCR文本进一步基于所述地理位置附近的所述兴趣点。7.根据权利要求1所述的计算机实现的方法,还包括:在所述服务器处确定对应于所述移动计算设备的用户的用户历史,其中所翻译的OCR文本进一步基于所述用户历史。8.根据权利要求1所述的计算机实现的方法,其中,所述非文本上下文信息包括所述文本的字体。9.根据权利要求1所述的计算机实现的方法,其中,所述非文本上下文信息包括以下中的至少一个:(i)所述图像中的对象和(ii)所述图像中的所述对象的形状。10.根据权利要求9所述的计算机实现的方法,其中,所述非文本上下文信息包括所述对象的颜色中的至少一个,并且进一步包括在所述服务器处基于所述对象...

【专利技术属性】
技术研发人员:阿恩·莫塞亚历山大·杰·卡斯贝特约翰·斯特迪·德内罗
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1