将搜索结果分组为简档页面制造技术

技术编号:10459491 阅读:122 留言:0更新日期:2014-09-24 14:53
公开了一种用于将搜索结果分组为简档页面的方法。搜索引擎接受用户搜索字符串并且生成第一集合的结果。响应于该第一集合的结果,查询生成器生成与共享共同名称的多个实体的数量对应的多个查询。搜索引擎执行该多个查询,返回多个响应的数据集合。实体分解器合并数据集合以确保每一个唯一实体由单个数据集合代表。可以定义阈值以使得达到特定级别相似性的结果被合并。简档生成器使用在搜索结果的集合中包含的传记数据创建每一个唯一实体的简档页面,并还生成包含到每一个唯一简档的链接的结果页面。该结果页面然后被发送给用户用于在图形用户界面上显示。

【技术实现步骤摘要】
【国外来华专利技术】将搜索结果分组为简档页面
本专利技术涉及搜索引擎的领域。更具体地,本专利技术涉及针对与其他实体共享共同名 称的每一个唯一实体生成具体简档页面(profile page),并且呈现到每一个简档页面的链 接作为响应于指定该共同名称的用户搜索字符串的搜索结果的列表。
技术介绍
搜索引擎向计算机用户提供了几秒钟搜索在例如因特网的网络上可用的不断扩 大的文档集合的方式。搜索引擎使用复杂的算法来评分并排序各个文档或页面,以响应于 用户指定的搜索字符串呈现最相关和精确的结果。当用户搜索在多个实体(人、位置、组织 或其他实体)之间共享的名称时,当前方法涉及大量数据集合的密集统计计算来确定用户 在寻找多个实体中的哪个并且可能无法提供与该实体对应的完整和有意义的结果。 US20110106807公开了用于通过生成实体简档并且从多个文档提取信息以生成实 体简档集合、使用相似性匹配算法确定实体简档集合内的等同(equivalence)并且将信息 整合在相关实体中,消除实体的歧义的方法。
技术实现思路
这里公开的一个实施例包括计算机实现的方法,用于呈现响应于指定由多个实体 共享的共同名称的搜索引擎搜索字符串生成的简档页面。操作一般可以包括:从用户接收 指定作为由多个实体共享的共同名称的实体名称的第一搜索字符串;基于第一搜索字符 串的结果生成多个查询;执行多个所生成查询的每一个来创建搜索结果的相应集合;分解 (resolve)搜索结果的相应集合的每一个以使得每一个实体由单个集合的搜索结果代表; 生成多个简档,每一个简档与分解后的搜索结果的集合之一对应;并且向输出装置呈现多 个简档作为响应于第一搜索字符串的结果的集合。 这里公开的另一实施例提供计算机可读介质,包含当在包括处理器和存储器的系 统上执行时进行大体包括如下的操作的程序:从用户接收指定作为由多个实体共享的共同 名称的实体名称的第一搜索字符串;基于第一搜索字符串的结果生成多个查询;执行多个 所生成查询的每一个来创建搜索结果的相应集合;分解搜索结果的相应集合的每一个以使 得每一个实体由单个集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结 果的集合之一对应;并且向输出装置呈现多个简档作为响应于第一搜索字符串的结果的集 合。 这里公开的另一实施例提供系统,该系统从用户接收指定作为由多个实体共享的 共同名称的实体名称的第一搜索字符串。该系统基于第一搜索字符串的结果生成多个查 询,执行多个所生成查询的每一个来创建搜索结果的相应集合,并且分解搜索结果的相应 集合的每一个以使得每一个实体由单个集合的搜索结果代表。该系统生成多个简档,每一 个简档与分解后的搜索结果的集合之一对应,并且向输出装置呈现多个简档作为响应于第 一搜索字符串的结果的集合。 从第一方面来看,本专利技术提供用于将搜索结果分组为简档页面的计算机实现的方 法,该方法包括:接收指定一个或多个搜索词语的第一搜索字符串,其中一个或多个搜索词 语的至少一个是与多个实体对应的共享词语;基于接收到的第一搜索字符串生成多个搜索 查询,每一个对应于多个实体中的相应实体;执行所生成的多个搜索查询的每一个来创建 搜索结果的相应集合;分解搜索结果的集合,以使得多个实体的每一个由单个集合的搜索 结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其中多个简档 中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;并且呈现 多个简档作为响应于第一搜索字符串的结果的集合。 优选地,本专利技术提供其中多个实体的每一个包括人、位置或组织中的至少一个的 方法。 优选地,本专利技术提供其中基于响应于第一搜索字符串提供的相关搜索字符串的集 合生成多个搜索查询的方法。 优选地,本专利技术提供该分解包括如下的方法:比较搜索结果的集合的每一个以检 测相似性;并且当检测到相似性时合并搜索结果的集合。 优选地,本专利技术提供其中当检测到的相似性超出了指定相似性阈值时,该合并发 生的方法。 优选地,本专利技术提供其中使用从搜索结果的对应集合检索到的传记信息生成多个 简档中的每一个的方法。 优选地,本专利技术提供包括如下的方法:接收标记简档中的至少一个数据元素为与 该简档相关或不相关的用户反馈。 优选地,本专利技术提供其中至少一个文档包括与该实体相关联的社交网络页面的方 法。 从另一方面看,本专利技术提供用于将搜索结果分组为简档页面的计算机程序产品, 该计算机程序产品包括:具有以其体现的计算机可读程序代码的计算机可读存储介质,该 计算机可读程序代码包括:配置为接收指定一个或多个搜索词语的第一搜索字符串的计算 机可读程序代码,其中一个或多个搜索词语中的至少一个是与多个实体对应的共享词语; 配置为基于接收到的第一搜索字符串生成多个搜索查询的计算机可读程序代码,每一个搜 索查询对应于多个实体中的相应实体;配置为执行所生成的多个搜索查询的每一个来创建 搜索结果的相应集合的计算机可读程序代码;配置为分解搜索结果的集合以使得多个实体 的每一个由单个集合的搜索结果代表的计算机可读程序代码;配置为生成多个简档的计算 机可读程序代码,每一个简档与分解后的搜索结果的集合之一对应,其中多个简档中的每 一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;以及配置为呈现 多个简档作为响应于第一搜索字符串的结果的集合的计算机可读程序代码。 优选地,本专利技术提供其中多个实体的每一个包括人、位置或组织中的至少一个的 计算机程序产品。 优选地,本专利技术提供其中基于响应于第一搜索字符串提供的相关搜索字符串的集 合生成多个搜索查询的计算机程序产品。 优选地,本专利技术提供其中该分解包括如下的计算机程序产品:比较搜索结果的集 合的每一个以检测相似性;并且当检测到相似性时合并搜索结果的集合。 优选地,本专利技术提供其中当所检测的相似性超出了指定相似性阈值时,该合并发 生的计算机程序产品。 优选地,本专利技术提供其中使用从搜索结果的对应集合检索到的传记信息生成多个 简档中的每一个的计算机程序产品。 优选地,本专利技术提供包括如下的计算机程序产品:接收将简档中的至少一个数据 元素标记为与该简档相关或不相关的用户反馈。 优选地,本专利技术提供其中至少一个文档包括与该实体相关联的社交网络页面的计 算机程序产品。 从另一方面看,本专利技术提供用于将搜索结果分组为简档页面的系统,该系统包括: 处理器;以及存储器,包含当由处理器执行时配置为进行用于将搜索结果分组为简档页面 的操作的程序,该操作包括:接收指定一个或多个搜索词语的第一搜索字符串,其中一个或 多个搜索词语的至少一个是与多个实体对应的共享词语;基于接收到的第一搜索字符串生 成多个搜索查询,每一个对应于多个实体中的相应实体;执行所生成的多个搜索查询的每 一个来创建搜索结果的相应集合;分解搜索结果的集合,以使得多个实体的每一个由单个 集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其 中多个简档中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数 据;并且呈现多个简档作为响应于第一搜索字符串的结果的集合。 优选地,本文档来自技高网...

【技术保护点】
一种用于将搜索结果分组为简档页面的计算机实现的方法,该方法包括:接收指定一个或多个搜索词语的第一搜索字符串,其中所述一个或多个搜索词语的至少一个是与多个实体对应的共享词语;基于接收到的第一搜索字符串生成多个搜索查询,每一个对应于所述多个实体中的相应实体;执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合;分解搜索结果的集合,以使得所述多个实体的每一个由单个集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其中所述多个简档中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;并且呈现所述多个简档作为响应于第一搜索字符串的结果的集合。

【技术特征摘要】
【国外来华专利技术】2012.01.17 US 13/351,6231. 一种用于将搜索结果分组为简档页面的计算机实现的方法,该方法包括: 接收指定一个或多个搜索词语的第一搜索字符串,其中所述一个或多个搜索词语的至 少一个是与多个实体对应的共享词语; 基于接收到的第一搜索字符串生成多个搜索查询,每一个对应于所述多个实体中的相 应实体; 执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合; 分解搜索结果的集合,以使得所述多个实体的每一个由单个集合的搜索结果代表; 生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其中所述多个简档 中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;并且 呈现所述多个简档作为响应于第一搜索字符串的结果的集合。2. 如权利要求1所述的方法,所述多个实体中的每一个包括人、位置或组织中的至少 一个。3. 如权利要求1所述的方法,其中基于响应于所述第一搜索字符串提供的相关搜索字 符串的集合,生成所述多个搜索查询。4. 如权利要求1所述的方法,其中该分解包括: 比较搜索结果的集合的每一个以检测相似性;并且 当检测到所述相似性时合并搜索结果的集合。5. 如权利要求4所述的方法,其中当检测到的相似性超出了指定相似性阈值时,该合 并发生。6. 如权利要求1所述的方法,其中使用从所述搜索结果的对应集合检索到的传记信息 生成所述多个简档中的每一个。7. 如权利要求1所述的方法,包括: 接收将简档中的至少一个数据元素标记为与该简档相关或不相关的用户反馈。8. 如权利要求1所述的方法,其中所述至少一个文档包括与所述实体相关联的社交网 络页面。9. 一种用于将搜索结果分组为简档页面的计算机程序产品,所述计算机程序产品包 括: 具有以其体现的计算机可读程序代码的计算机可读存储介质,该计算机可读程序代码 包括: 配置为接收指定一个或多个搜索词语的第一搜索字符串的计算机可读程序代码,其中 所述一个或多个搜索词语中的至少一个是与多个实体对应的共享词语; 配置为基于接收到的第一搜索字符串生成多个搜索查询的计算机可读程序代码,每一 个搜索查询对应于所述多个实体中的相应实体; 配置为执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合的计算机可 读程序代码; 配置为分解搜索结果的集合以使得多个实体的每一个由单个集合的搜索结果代表的 计算机可读程序代码; 配置为生成多个简档的计算机可读程序代码,每一个简档与分解后的搜索结果的集合 之一对应,其中多个简档中的每一个包括从分解后的搜索结果的对应集合中的至少一个文 档获得的数据;以及 配置为呈现多个简档作为响应于第一搜索字符串的结果的...

【专利技术属性】
技术研发人员:AK舒克A艾沃里EJ伯卡特DM斯特克
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1