用于跨语言信息检索的方法、系统、装置,包括计算机程序产品。接收源语言的源查询。将所述源查询翻译为目标语言的目标查询。识别满足所述目标查询的一个或多个目标语言资源。将所识别的资源翻译为源语言。呈现与所翻译资源相对应的搜索结果。
【技术实现步骤摘要】
【国外来华专利技术】跨语言信息检索 相关串i青 本申请要求2007年5月16日提交的美国临时申请No. 60/938448和2008年4月 29日提交的美国专利申请No. 12/111888的优先权,通过引用将其全文合并于此。
技术介绍
本说明书的主题一般地涉及搜索系统。 万维网("Web")过去主要是由英语内容所充盈(populate)。现在,随着非英语 用户和内容提供者的数量的增加,在Web上存在相当数量的非英语内容。说英语的人能够 得益于访问非英语内容中所包含的信息和知识,反之亦然。可以使用传统的机器翻译工具 将内容从一种语言翻译为另一种语言。
技术实现思路
—般地,本说明书中所描述的主题的一个方面可以以方法来实现,所述方法包括 以下动作接收源语言的源查询;将所述源查询翻译为与所述源语言不同的第一目标语言 的候选查询;接收将所述候选查询修改为所述第一目标语言的第一目标查询的输入;识别 满足所述第一 目标查询的所述第一 目标语言的一个或多个资源;将所识别的资源翻译为所 述源语言的对应的翻译资源;并且呈现与所述翻译资源相对应的搜索结果。该方面的其它 实施例包括对应的系统、装置、计算机程序产品和计算机可读介质。 —般地,本说明书中所描述的主题的另一个方面可以以方法来实现,所述方法包 括以下动作接收指定源语言、所述源语言的查询以及目标语言的一个或多个用户输入; 呈现所述查询到所述目标语言的翻译;接收对所述查询的翻译进行修改的用户输入;并且 呈现满足所述查询的经修改的翻译的所述目标语言的一个或多个搜索结果到所述源语言 的翻译。该方面的其它实施例包括对应的系统、装置、计算机程序产品和计算机可读介质。 —般地,本说明书中所描述的主题的另一个方面可以以方法来实现,所述方法包 括以下动作在显示设备上生成搜索界面,所述搜索界面包括用于接收源语言的查询的第 一用户输入的第一域、用于接收指定所述源语言的第二用户输入的第二域以及用于接收指 定目标语言的第三用户输入的第三域;基于所述第一、第二和第三用户输入,在所述显示设 备上生成第一结果界面,第一结果界面包括所述查询到所述目标语言的翻译以及用于接收 对所述查询的翻译进行修改的第四用户输入的第四域;并且基于所述第一、第二、第三和第 四输入,在所述显示设备上生成第二结果界面,所述第二结果界面包括满足所述查询的经 修改的翻译的所述目标语言的一个或多个搜索结果到所述源语言的翻译。该方面的其它实 施例包括对应的系统、装置、计算机程序产品和计算机可读介质。 可实施该说明书中所描述的主题的特定实施例来实现以下一个或多个优势。交互 式跨语言搜索允许用户对所翻译的搜索查询进行修改以便优化搜索结果。所述跨语言搜索 允许对目标语言具有一些了解的用户以目标语言构建有用的搜索查询。 以下结合附图和描述给出该说明书中所描述的主题的一个或多个实施例的细节。根据描述、附图和权利要求,所述主题的其它特征、方面和优势将变得显而易见。 附图说明 图1是图示网络环境的框图。 图2是图示示例性跨语言信息检索(CLIR)系统的框图。 图3是图示用于对内容执行跨语言搜索的示例性过程的流程图。 图4A-4C图示了用于跨语言内容搜索的示例性用户界面。 图5是图示示例性计算机系统的框图。 图6是图示用于对内容执行跨语言搜索的另一示例性过程的流程图。 各附图中相同的附图标号和名称表示相同元素。具体实施例方式图1图示了网络环境100,其可包括搜索系统104、翻译系统106、跨语言信息检索 (CLIR)系统108和用户客户端102。这些组件可通过一个或多个网络IIO进行通信。例如, 网络110可包括局域网、广域网、无线网络、移动电话网和因特网。 搜索系统104对资源服务器所托管的资源进行索引。搜索系统104在所述资源服 务器上进行爬行(crawl)以识别可用于索引的资源。在一些实施方式中,搜索系统104还 存储经索引的资源的副本。被搜索系统104所爬行和索引的资源包括不同语言的资源。资 源的示例包括网页、音频文件、视频文件、可移植文档格式(PDF)文档、文本文件、字处理文 档、图像等。资源可具有一个或多个语言成分(例如,能够以例如英语、法语、德语、中文等 对应的语言的知识所理解的文本、演讲、歌曲的歌词等)。 搜索系统104(例如,从用户客户端102)接收对资源的查询,并且针对各个查询, 对索引搜索满足各个查询的经索引的资源。查询包括一个或多个词语(例如,词、短语、字 符、表意符号、数字等)。所述查询可以以任意的一种或多种语言被呈现。搜索结果从搜索 系统104传送到用户客户端102以便向用户呈现。所述搜索结果可包括到满足所述查询的 经索引资源的链接和其摘录(例如,片段)。 翻译系统106将资源从一种语言翻译为另一种语言。在一些实施方式中,翻译系 统106能够作为直接输入(例如,输入到文本域中的文本)或者作为到所要翻译的资源的 统一资源定位符(URL)接收所要翻译的资源。翻译系统106可被实施为使用各种机器翻译 技术(例如,各种统计或基于示例的机器翻译技术)的任意一种对资源进行翻译。在一些 实施方式中,翻译系统106基于用于将资源从一种语言翻译为另一种语言的特定翻译模型 而使用统计技术对资源进行翻译。在一些实施方式中,翻译系统106支持多种语言。翻译 系统106连同所要翻译的资源一起接收所述资源的源语言以及所述资源要被翻译成的目 标语言的指定。 在一些实施方式中,CLIR接口 108促进跨语言信息检索,其允许用户以一种语言 (例如,用户流利使用的语言)对一种或多种其它语言的资源进行搜索。CLIR接口 108与 搜索系统104和翻译系统106进行通信。CLIR接口 108可从用户客户端102接收第一语言 的查询。所接收的查询被翻译为第二语言。搜索结果可包括到满足翻译成第二语言的所述 查询的资源从所述第二语言到第一语言的翻译的链接。CLIR接口 108将所述搜索结果传送6给用户客户端102。所述搜索结果还可包括来自满足翻译成第二语言的所述查询的资源的 片段从所述第二语言到第一语言的翻译。 用户客户端102可以是通过一个或多个网络110与CLIR接口 108进行数据通信并 且可选地与搜索系统104和翻译系统106进行数据通信的任意设备。在一些实施方式中, 用户客户端102包括能够访问CLIR接口 108、搜索系统104和/或翻译系统106的客户端 应用(例如,web浏览器)。用户客户端的示例包括台式电脑、笔记本电脑、膝上电脑、个人 数字助理(PDA)、移动电话、智能电话、媒体播放器、游戏控制台、便携式游戏设备或机顶盒。 图2图示了 CLIR系统200。 CLIR系统200包括搜索引擎202、翻译引擎210和 CLIR引擎216。搜索引擎202、翻译引擎210和CLIR引擎216通过一个或多个网络226进 行数据通信。 搜索引擎202包括搜索模块204、相关查询模块206和资源的索引208。在一些实 施方式中,搜索引擎202是搜索系统(例如,搜索系统104)的一部分。 搜索模块204接收搜索查询并使用索引208来识别满足所接收的搜索查询或所述 查询的翻译的资源。相关查询模块206针对查询识别相关查询。在一些实施方式中,相关 查询可包括查询本文档来自技高网...
【技术保护点】
一种方法,包括:接收源语言的源查询;将所述源查询翻译为与所述源语言不同的第一目标语言的候选查询;接收将所述候选查询修改为所述第一目标语言的第一目标查询的输入;识别满足所述第一目标查询的所述第一目标语言的一个或多个资源;将所识别的资源翻译为所述源语言的对应的翻译资源;以及呈现与所述翻译资源相对应的搜索结果。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:秦家豪,莫琳海曼斯,亚历山德拉科约乌霍夫,林嘉珊,檀慧,
申请(专利权)人:谷歌公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。