用于来自图像的文本的机器语言翻译的方法和服务器技术

技术编号：14705009 阅读：134 留言：0更新日期：2017-02-25 09:36

一种计算机实现技术可以包括在服务器处从移动计算设备接收包括文本的图像，所述服务器具有一个或多个处理器。所述技术可以包括在服务器处获得对应于文本的光学字符识别(OCR)文本，该OCR文本是通过对图像执行OCR而获得的。所述技术可以包括在服务器处从图像识别非文本上下文信息，所述非文本上下文信息(i)表示除所述文本本身之外的上下文信息以及(ii)指示所述图像的上下文。所述技术可以包括基于所述非上下文信息，在服务器处获得OCR文本到目标语言的翻译以获得所翻译的OCR文本。所述技术可以包括从服务器向移动计算设备输出所翻译的OCR文本。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2014年6月24日提交的美国申请号14/313,670的优先权。上述申请的公开被整体地通过引用并入到本文中。
本公开一般地涉及光学字符识别(OCR)和机器语言翻译，并且更特别地涉及用于基于来自图像的非文本上下文信息的对来自图像的OCR文本的机器语言翻译的技术。
技术介绍
本文中提供的背景描述是出于一般地呈现本公开的上下文的目的。在已经在
技术介绍
小节中进行描述的程度上，本专利技术人的工作以及以其它方式在提交时未被承认为现有技术的本描述的各方面既未明示地、也为隐含地被认可为针对本公开的现有技术。光学字符识别(OCR)涉及到使用计算设备(例如，服务器)的图像中的文本的检测。OCR可以提供用以在用户设备处以数字形式获得文本的更快方式(例如，与由用户向用户设备手动输入文本相比)。在获得图像中的文本之后，可以以各种方式利用该文本。例如，该文本可被计算设备处理、被存储在存储器处和/或被发送到另一计算设备。处理文本的一个示例是机器语言翻译，其涉及到使用计算设备将文本从源语言翻译成不同的目标语言。
技术实现思路
在一个方面，提出了一种计算机实现的技术。所述技术可以包括在服务器处从移动计算设备接收包括文本的图像，所述服务器具有一个或多个处理器。所述技术可以包括在服务器处获得对应于文本的光学字符识别(OCR)文本，所述OCR文本是通过对图像执行OCR而获得的。被技术可以包括在服务器处从图像识别非文本上下文信息，所述非文本上下文信息(i)表示除文本本身之外的上下文信息且(ii)指示图像的上下文。所述技术可以包括基于非文本上下文信息，在服务器处获得OCR文...
<a href="http://www.xjishu.com/zhuanli/55/201580033709.html" title="用于来自图像的文本的机器语言翻译的方法和服务器原文来自X技术">用于来自图像的文本的机器语言翻译的方法和服务器</a>

【技术保护点】
一种计算机实现的方法，包括：在服务器处从移动计算设备接收包括文本的图像，所述服务器具有一个或多个处理器；在所述服务器处获得对应于所述文本的光学字符识别OCR文本，所述OCR文本是通过对所述图像执行OCR而获得的；在所述服务器处从所述图像识别非文本上下文信息，所述非文本上下文信息(i)表示除所述文本本身之外的上下文信息且(ii)指示所述图像的上下文；基于所述非文本上下文信息，在所述服务器处获得所述OCR文本到目标语言的翻译以获得所翻译的OCR文本；以及从所述服务器向所述移动计算设备输出所翻译的OCR文本。

【技术特征摘要】
【国外来华专利技术】2014.06.24 US 14/313,6701.一种计算机实现的方法，包括：在服务器处从移动计算设备接收包括文本的图像，所述服务器具有一个或多个处理器；在所述服务器处获得对应于所述文本的光学字符识别OCR文本，所述OCR文本是通过对所述图像执行OCR而获得的；在所述服务器处从所述图像识别非文本上下文信息，所述非文本上下文信息(i)表示除所述文本本身之外的上下文信息且(ii)指示所述图像的上下文；基于所述非文本上下文信息，在所述服务器处获得所述OCR文本到目标语言的翻译以获得所翻译的OCR文本；以及从所述服务器向所述移动计算设备输出所翻译的OCR文本。2.根据权利要求1所述的计算机实现的方法，还包括：在所述服务器处获得所述OCR文本到所述目标语言的翻译以获得基准翻译的OCR文本；以及在所述服务器处基于所述非文本上下文信息来调整所述基准翻译的OCR文本以获得所翻译的OCR文本。3.根据权利要求1所述的计算机实现的方法，还包括在所述服务器处基于所述非文本上下文信息来确定所述文本的源语言，其中所翻译的OCR文本进一步基于所述源语言。4.根据权利要求1所述的计算机实现的方法，还包括在所述服务器处基于所述非文本上下文信息来确定捕捉所述图像的位置的类型，其中所翻译的OCR文本进一步基于所述位置的类型。5.根据权利要求1所述的计算机实现的方法，还包括在所述服务器处确定所述移动计算设备的地理位置，其中所翻译的OCR文本进一步基于所述移动计算设备的所述地理位置。6.根据权利要求5所述的计算机实现的方法，还包括：在所述服务器处基于所述地理位置来确定地图信息；以及在所述服务器处使用所述地图信息来识别所述地理位置附近的兴趣点，其中，所翻译的OCR文本进一步基于所述地理位置附近的所述兴趣点。7.根据权利要求1所述的计算机实现的方法，还包括：在所述服务器处确定对应于所述移动计算设备的用户的用户历史，其中所翻译的OCR文本进一步基于所述用户历史。8.根据权利要求1所述的计算机实现的方法，其中，所述非文本上下文信息包括所述文本的字体。9.根据权利要求1所述的计算机实现的方法，其中，所述非文本上下文信息包括以下中的至少一个：(i)所述图像中的对象和(ii)所述图像中的所述对象的形状。10.根据权利要求9所述的计算机实现的方法，其中，所述非文本上下文信息包括所述对象的颜色中的至少一个，并且进一步包括在所述服务器处基于所述对象...

【专利技术属性】
技术研发人员：阿恩·莫塞，亚历山大·杰·卡斯贝特，约翰·斯特迪·德内罗，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人