当前位置: 首页 > 专利查询>雅虎公司专利>正文

联合团体搜索制造技术

技术编号:7140743 阅读:180 留言:0更新日期:2012-04-11 18:40
提供一种用于联合搜索的方法、物品和设备。联合搜索可以由其创建者限定来在预先限定的一组数据源中搜索数据。相比于传统的基于爬虫的搜索,提高了搜索结果的准确度和关联度。

【技术实现步骤摘要】
【国外来华专利技术】联合团体搜索相关申请本申请要求2008年7月28日提交的美国正式专利申请第12/181,268号的优先权,其全部内容通过引用被结合于此。
技术介绍
1.
:在此公开的主题涉及网络搜索协议。2.信息在诸如Google之类的传统互联网搜索引擎中,仅仅是通过搜索引擎的爬虫(crawler)技术已搜索和索引(index)的数据源可被用户搜索、获取和访问。当用户查询传统的搜索引擎时,用户通常不是搜索整个互联网,而实际上是搜索搜索引擎的索引来找到查询的匹配并随后访问数据源。数据源的示例包括网页和数据库,但是不限于此。从这样的所谓基于爬虫的搜索得到的搜索结果有很多限制。例如,依赖于搜索引擎的爬虫技术用来更新具体网站的索引的时间表和时间,搜索结果可能明显过期。此外,大量数据被包含在由于爬虫技术的限制和访问约束而不能被传统互联网搜索引擎访问的数据库和网页中。联合搜索(federatedsearch)与传统的基于爬虫的搜索不同。联合搜索可以由其创建者限定以在预定一组数据源中搜索数据。联合搜索允许用户利用来自单个用户界面的单个查询来搜索多个数据源。用户可以在界面的搜索框中输入搜索查询并且该查询可以被发送给联合搜索中所限定的每个数据源。由于联合搜索通常包括作为目标的一组数据源,所以对于给定查询,可以提高各个搜索的准确度和关联度。此外,相比由基于爬虫的搜索引擎提供的那些搜索,可以减少搜索目标数据源所需要的时间量。所产生的搜索结果的关联度通常依赖于具体的联合搜索中所包括的数据源的关联度。另外,联合搜索通常固有地作为各个数据源的当前数据,这是因为它们是被实时地搜索的。附图说明将参考以下附图来描述非限制性和非穷尽性实施例,其中,若非另外指明,在各个附图中,类似的标号表示类似的部分。图1是能够通过网络在客户端和一个或多个服务器之间建立会话的系统的示意图;图2图示出根据一个实施例如显示装置上所显示的网络浏览器;图3是图示出根据一个实施例的联合搜索库的示例的示图;图4是用于处理联合搜索的方法的实施例的流程图;图5是提供用于处理联合搜索的方法的实施例的可能的图形表示的实施例的示图;图6是用于处理联合搜索的方法的实施例的流程图;图7是提供用于处理联合搜索的方法的实施例的可能的图形表示的实施例的示图;图8是用于处理联合搜索的方法的实施例的流程图;图9是提供用于处理联合搜索的方法的实施例的图形表示的实施例的示图;图10是提供用于处理联合搜索的系统的实施例的图形表示的示图;以及图11是图示出可以实现实施例的计算机系统的框图。具体实施方式贯穿本说明书,对“一个实施例”或“实施例”的提及是指与该实施例关联地描述的具体特征、结构或特点被包括在要求保护的主题的至少一个实施例中。因此,贯穿本说明书的各个地方出现的短语“在一个实施例中”或“实施例”不一定都是指同一实施例。此外,具体的特征、结构或特点可以在一个或多个实施例中被组合。除非以其他方式特别指明,从以下讨论中显见,可以理解,贯穿本说明书,利用例如诸如“处理”、“计算”、“选择”、“形成”、“使能”、“抑制”、“识别”、“开始”、“获取”、“托管(host)”、“维护”、“呈现”、“修改”、“接收”、“发送”、“建立”、“确定”等的术语进行的讨论是指可以通过计算平台执行的动作和/或处理,所述计算平台例如是计算机或类似的电子计算装置,其操纵和/或变换在计算平台的处理器、存储器、寄存器和/或其他信息存储、发送、接收和/或显示装置内被表示为物理电子量和/或磁量和/或其他物理量的数据。这样的动作和/或处理可以在被存储在存储介质中的机器可读指令的控制下由计算平台执行。此外,除非以其他方式特别指明,在此参考流程图或其他方式描述的处理也可以全部或部分由这样的计算平台执行和/或控制。图1是能够通过网络104在客户端104和一个或多个服务器106之间建立会话的系统100的示意图。网络104可以采用包括一个或多个数据传输介质的数据链路(未示出),例如线缆(例如,光纤、双绞线、同轴线)、卫星传输链路或地面无线传输链路。然而,这些仅仅是可以用于在网络中传输信息的数据传输介质的示例,并且所要求保护的主题在这方面不受限制。另外,网络104可以采用用于在源和目的地之间传输信息的一个或多个通信协议,例如,互联网协议(IP)、异步传输模式(ATM)和/或适于在无线传输链路上使用的通信协议。然而,这些仅仅是可以用于在网络中的源和目的地之间传输信息的通信协议的示例,并且所要求保护的主题在这些方面不受限制。在具体实施例中,网络104可以包括一个或多种网络技术和/或配置,例如举几个例子,例如一个或多个局域网、一个或多个企业内部网、互联网、与企业内部网相对的无线载波基础架构互联网和/或无线载波基础架构。尽管在此提供的具体示例在客户端和服务器之间建立会话,但是应当理解,这样的实现方式仅仅是为了说明的目的而提供的示例,并且所要求保护的主题不限于这样的实现方式。例如,也可以通过网络104在对等的装置和/或处理之间建立会话。客户端102可以包括被托管在计算平台上的一个或多个处理,该计算平台通过通信适配器(未示出)可通信地耦接到网络104。类似地,服务器106可以包括被托管在一个或多个计算平台上的处理,这些计算平台通过相关联的通信适配器连接到网络104。在具体实施例中,每个服务器106可以被托管在其自己的关联计算平台上,其自己的关联计算平台与托管其他服务器106的计算平台不同。可替换地,两个或多个服务器可以被托管在单个计算平台上。客户端102可以发起与服务器106的会话,以通过例如建立客户端102和服务器106可经其通过网络104进行通信的会话来提供服务。客户端102可以包括被托管在计算平台上的若干应用程序中的任意一个,例如,电子邮件应用、网络浏览器、文档处理程序、媒体播放器等。这里,应当理解,客户端102可被托管在能够利用网络进行通信的若干装置中的任一装置上和/或在其上被执行,例如,举几个例子,所述装置例如是个人计算机、移动电话、个人数字助理。在具体实施例中,尽管所要求保护的主题在这方面不受限制,但是服务器可以包括适于处理打印任务的打印机、网络服务器、电子邮件服务器、适于(例如通过流传输)分发音频或视频内容的内容服务器。在具体实施例中,服务器106可以通过单个套接字(socket)地址来寻址。套接字地址可以包括例如组合了IP地址和UDP端口号的信息。这里提及的基于爬虫的搜索引擎涉及利用爬虫技术来搜索网络可访问数据源并索引搜索结果的搜索引擎。作为对查询的应答的搜索结果是从被索引的内容中而不是整个网络中提取的。搜索结果可以包括链接的列表,所述链接链接到包含被认为与该查询相关的信息的网页。基于爬虫的搜索引擎可以,在用户已经在查询字段中输入查询并且通过点击“搜索(Search)”、“输入(Enter)”、“开始(Go)”或另一开始输入命令而发出了查询之后,提供搜索结果。这样的查询可被与之前通过爬虫技术收集的搜索结果的索引相比较。以这种方式获得的搜索结果可能包括可能与该查询的目的并不完全相关的大量“命中(hit)”(例如,网页链接)。图2图示出根据一个实施例的如显示装置220上所显示的网络浏览器200。显示装置220例如可以是托管客户端的计算平台的本文档来自技高网...
联合团体搜索

【技术保护点】
1.一种方法,包括:通过计算平台根据索引标准来索引一个或多个联合搜索;通过所述计算平台将查询与所述索引标准中的一个或多个索引标准相比较,通过所述计算平台将所述查询与索引标准相匹配;以及通过所述计算平台提供来自一个或多个与和所述查询相关联的索引标准相关联的被索引的联合搜索的结果。

【技术特征摘要】
【国外来华专利技术】US12/181,2682008年7月28日1.一种联合搜索方法,包括:接收识别的由一个或多个第一用户计算平台提交或上载的多个联合搜索源,所述多个联合搜索源包括至少一个第一联合搜索源和至少一个第二联合搜索源,所述多个联合搜索源中各个联合搜索源包括到多个不同指定数据源的链接;索引所述多个联合搜索源以确定索引标准,所述索引包括确定所述至少一个第一联合搜索源以及所述至少一个第二联合搜索源中与一个或多个第一关键词和一个或多个第二关键词中的各个关键词有关的至少一个联合搜索源;在执行所述索引之后,接收来自第二用户计算平台的查询,并且将所接收到的查询与所述索引标准进行匹配以确定所述多个联合搜索源中与所述查询相关的一个或多个联合搜索源并对这一个或多个联合搜索源进行排名;以及经由通信网络向所述第二用户计算平台发送包括结果的电信号,所述结果包括到和所述查询相关的所述一个或多个被排名的联合搜索源的各个链接以及针对一个或多个被排名的联合搜索源中的各个联合搜索源的有用性度量的至少一个可显示图形指示符。2.根据权利要求1所述的方法,还包括:确定与被索引的联合搜索源相关联的签名;将查询和所述签名进行比较;以及确定所述查询与和被索引的联合搜索相关联的签名之间的最接近匹配。3.根据权利要求2所述的方法,还包括:至少部分地基于被索引的联合搜索源来提供搜索结果,其中所述查询与和该被索引的联合搜索源相关联的签名之间为最接近匹配。4.根据权利要求3所述的方法,还包括:基于基于爬虫的搜索来提供搜索结果。5.根据权利要求2所述的方法,其中,所述索引至少部分地基于由所述联合搜索的创建者所提供的关键字;并且其中,所述比较至少部分地基于由被索引的联合搜索的创建者所提供的关键字。6.根据权利要求2所述的方法,其中,索引至少部分地基于将联合搜索中的域与由该查询定义的域相匹配;并且其中,所述比较至少部分地基于将联合搜索的域与通过该查询限定的域相匹配。7.根据权利要求2所述的方法,其中,所述索引至少部分地基于将被索引的联合搜索的域与基于分类路径返回结果的搜索引擎的域相匹配,其中被索引的联合搜索结果的分类路径被与和基于爬虫的搜索相关联的分类路径相匹配。8.根据权利要求1所述的方法,其中,索引至少一组搜索结果包括:从与联合搜索相关联的站点获取数据;从所述数据中提取至少包括关键字和域的加权因子;以及基于所述加权因子来创建签名的表格;并且其中将查询与所述至少一个被索引的联合搜索进行比较包括将该查询与和所述联合搜索相关联的签名相比较;并且其中,确定该查询与被索引的联合搜索源之间的最接近匹配包括:确定该查询与签名之间的最接近匹配,并且还包括:至少部分地基于被索引的联合搜索来提供搜索结果,其中该查询和与该被索引的联合搜索相关联的签名之间为最接近匹配。9.一种用于联合搜索的设备,包括:用于接收从一个或多个第一用户计算平台接收的多个联合搜索源的装置,所述多个联合搜索源包括至少一个第一联合搜索源和至少一个第二联合搜索源,所述多个联合搜索源中各个联合搜索源包括到多个不同指定数据源的链接;用于索引所述多个联合搜索源以确定索引标准的装置,所述索引包括确定所述至少一个第一联合搜索源以及所述至少一个第二联合搜索源中与一个或多个第一关键词和一个或多个第二关键词中的各个关键词有关的至少一个联合搜索源;用于在执行所述索引之后,接收来自第二用户计算平台的查询,并且将所接收到的查询与所述索引标准进行匹配以确定所述多个联合搜索源中与所述查询相关的一个或多个联合搜索源并对这一个或多个联合搜索源进行排名的装置;以及用于经由通信网络向所述第二用户计算平台发送包括结果的电信号的装置,所述结果包括到和所述查询相关的所述一个或多个被排名的联合搜索源的各个链接以及针对一个或多个被排名的联合搜索源中的各个联合搜索源的有用性度量的至少一个可显示图形指示符。10.根据权利要求9所述的设备,还包括:用于确定与被索引的联合搜索源相关联的签名的装置;用于将查询和所述签名进行比较的装置;以及用于确定所述查询与和被索引的联合搜索源相关联的签名之间的最接近匹配的装置。11.根据权利要求10所述的设备,还包括:用于至少部分地基于被索引的联合搜索源来提供搜索结果的装置,其中所述查询与和该被索引的联合搜索源相关联的签名之间为最接近匹配。12.根据权利要求11所述的设备,还包括:用于基于基于爬虫的搜索来提供搜索结果的装置。13.根据权利要求10所述的设备,其中,所述索引至少部分地基于由所述联合搜索源的创建者所提供的关键字;并...

【专利技术属性】
技术研发人员:基思·A·马洛
申请(专利权)人:雅虎公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1