搜索引擎包括确定响应于用户搜索查询返回的文档是否可能是与该搜索查询非常相关的判定部件。引用搜索引擎确定为可能非常相关的文档的链接可以利用帮助用户浏览这些链接的视觉提示进行显示。判定部件可以将它的判定基于多个参数,包括:(1)在搜索结果的排名列表中文档的位置,(2)文档的点击通过率,(3)响应于该搜索查询作为点击返回的、该文档和其它文档的相关性计分,以及(4)该文档是否被归类为色情文档(搜索引擎可以制止为潜在的色情文档显示视觉提示)。(*该技术在2024年保护过期,可自由使用*)
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术通常涉及文档搜索引擎,并且尤其涉及突出显示从搜索引擎返回的选择文档。
技术介绍
万维网(“web”)包含巨量的信息。然而,定位信息的期望部分是具有挑战性的。因为在web上的信息量和在web搜索方面没有经验的新用户的数量快速增长,所以这个问题变得复杂。搜索引擎试图返回给用户感兴趣的网页的超链接。通常,搜索引擎将它们对用户兴趣的确定基于由用户输入的搜索项(称为搜索查询)。搜索引擎的目标是基于搜索查询、向用户提供到高质量的、相关结果的链接。通常,搜索引擎通过将在搜索查询中的项目与预先存储的网页的语料库(corpus)进行匹配,来实现它。“命中(hit)”包含用户搜索项的网页,并且将该网页返回给用户。为了提高返回给用户的网页的相关性和质量,搜索引擎可以试图对命中列表进行排序,以便使最相关和/或最高质量的页面处于返回给用户的命中列表的顶端。例如,搜索引擎可以向每个命中分配排名或者记分,其中记分被设计为对应于网页的相关性或者重要性。确定相关性的已有技术基于网页的内容。更高级的技术不仅仅基于网页的内容确定网页的重要性。例如,在Sergey Brin和Lawrence Page所著的、标题为“The Anatomy of Large-Scale Hypertextual SearchEngine”的文章中描述了一种已知的方法,其基于网页的链接结构向网页分配重要性程度。换句话说,Brin和Page的算法试图不仅仅基于网页的内容来量化网页的重要性。搜索引擎的目标是为任何特定的搜索查询返回最期望的链接集。然而,除仅仅返回最期望的链接集之外,还以清楚并且快速地向用户通知与每个链接相关联的内容的方式向用户给出链接集也是有益的。一种向用户通知与特定链接相关联的内容的方法是还与该链接一起显示文本的“片断(snippet)”。理想地,文本片断应该概述链接的内容。实际上,这些片断一般从由该链接所引用的文档的文本中提取。虽然文本片断在概述链接方面是有用的,但是在准确地概述链接方面的片断质量能够基于诸如片断生成的自动化特性以及基础文档的质量之类的因素而发生改变。此外,为了让片断有用,用户必须花费时间读取该片断。在本
中需要有改进的、用于响应于搜索查询而向用户通知返回的链接内容的技术。
技术实现思路
搜索引擎返回到与搜索查询相关的文档的链接列表。引用搜索引擎确定为与用户查询非常相关的文档的链接可以用帮助用户浏览链接的视觉提示(visual cue)进行显示。附图说明并入并且构成这个说明书一部分的附图,举例说明了本专利技术的实施例,而且连同该说明书文字部分一起用来解释本专利技术。在附图中,图1为说明其中可以实现依据本专利技术的概念的示例系统的图示;图2为说明响应于搜索查询而显示的、包括到网络文档的链接的文档的图示;图3为流程图,说明了依据本专利技术一个方面的搜索引擎的操作;以及图4为一个框图,在概念上说明了对一个文档是否与用户搜索查询非常相关的确定过程。具体实施例方式以下对本专利技术的详细说明参考附图。该详细说明不用于限制本专利技术。相反,本专利技术的范围由附加的权利要求以及等效含义所定义。如此处描述的那样,搜索引擎可以确定它确信特定的链接是用户意图查找的链接。搜索引擎然后可以用视觉提示突出显示这个链接。视觉提示允许用户快速地定位和确定突出显示的链接是否是用户意图查找的链接。系统概述图1为说明其中可以实现依据本专利技术的概念的示例系统的图示。该系统包括多个客户机设备102、服务器设备110、以及网络101,该网络可以是例如Internet。客户机设备102每个都包括诸如随机存取存储器之类的计算机可读介质109,其连接到处理器108。处理器108执行存储在存储器109中的程序指令。客户机设备102还可以包括多个额外的外部或者内部设备,诸如而不是限制于鼠标、CD-ROM、键盘、和显示器。通过客户机设备102,用户105能够在网络101上互相进行通信,以及与连接到网络101的其它系统和设备、诸如服务器设备110进行通信。类似于客户机设备102,服务器设备110可以包括连接到计算机可读存储器112的处理器111。服务器设备110另外可以包括诸如数据库130之类的辅助存储单元。客户机处理器108和服务器处理器111可以是多个众所周知的计算机处理器中的任一个。通常,客户机设备102可以是连接到网络并且与应用程序交互的任意类型的计算平台,诸如数字助理或者“智能”蜂窝电话或者传呼机。服务器110,虽然被描述为单个计算机系统,但是可以实现为计算机处理器网络。存储器112包含搜索引擎程序120。搜索引擎程序120响应于来自用户105的搜索查询定位相关的信息。具体地,用户105发送搜索查询到服务器设备110,服务器设备110通过返回相关信息列表给用户105而进行响应。典型地,用户105要求服务器设备110定位与特定主题相关、并且存储在连接到网络101的其它设备或者系统处的网页。搜索引擎120包括文档定位器121和排名(ranking)部件122。通常,文档定位器121查找内容与用户搜索查询匹配的文档集。排名部件122可以基于相关性对所定位的文档集进行排名,并且可以为每个文档生成指示相关性等级的相关性记分。搜索引擎120然后可以返回指向由文档定位器121所确定的文档集的链接列表。链接列表可以基于由排名部件122所确定的相关性记分进行排序。文档定位器121最初可以通过将用户搜索查询中的项与存储在数据库130中的文档语料库中的文档进行比较,来从该文档语料库中定位文档。通常,用于对网络文档进行索引、并且搜索该网络文档的已索引语料库以返回包含搜索项的文档集的处理在本领域中是众所周知的。因此,将不在此处进一步描述文档定位器121的这个功能。排名部件122通过对由文档定位器121所识别的文档集进行排名,帮助搜索引擎120向用户返回相关文档。这个排名可以采取分配称为相关性记分的数值的形式,该相关性记分对应于由文档定位器121所识别的每个文档的已计算的相关性。在本
有多种已知的恰当排名算法,如在这个公开的专利技术
技术介绍
部分中所提及的那样,其中之一在Brin和Page的文章中进行了描述。做为选择,可以将排名部件122和文档定位器121的功能进行组合,以便文档定位器121产生每个都具有排名值的相关文档集。如此处使用的,文档被广泛地解释为包括任何机器可读和机器可存储的作品。文档可以是电子邮件、文件、文件组合、具有到其它文件的嵌入式链接的一个或者多个文件等。在Internet的环境中,常见的文档是网页。网页经常包括内容而且可以包括嵌入的信息(诸如元信息、超链接等)和/或嵌入的指令(诸如Javascript等)。搜索引擎120的操作。按照本专利技术的一个方面,除描述网络文档的文本片断之外,到由搜索引擎120返回的网络文档集的链接可以还包括向用户通知该网络文档很可能与用户的搜索查询相关的视觉提示。视觉提示可以包括图形信息,通过该图形信息,用户可以快速且容易地验证该链接是否是用户意图定位的链接。在本专利技术的一个方面,用视觉提示显示与被确定为与用户搜索查询“高度相关”(即,高度确信该文档是用户将最有兴趣查看的文档)的文档相对应的链接。图2为说明文档200的图示,该文档200包括到可以响应于搜索查询而在客户本文档来自技高网...
【技术保护点】
一种执行文档搜索的方法,包含: 生成到与用户提交的搜索查询相关联的文档集合的链接; 确定在该文档集合中的一个或多个文档是否可能对应于用户认为是与搜索查询非常相关的文档; 将视觉提示与到在文档集合中被确定为是非常相关的文档的链接相关联;以及 将所生成的链接和相关联的视觉提示返回给用户。
【技术特征摘要】
【国外来华专利技术】US 2003-6-10 10/457,4881.一种执行文档搜索的方法,包含生成到与用户提交的搜索查询相关联的文档集合的链接;确定在该文档集合中的一个或多个文档是否可能对应于用户认为是与搜索查询非常相关的文档...
【专利技术属性】
技术研发人员:西门汤,
申请(专利权)人:GOOGLE公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。