【技术实现步骤摘要】
【国外来华专利技术】将搜索结果分组为简档页面
本专利技术涉及搜索引擎的领域。更具体地,本专利技术涉及针对与其他实体共享共同名 称的每一个唯一实体生成具体简档页面(profile page),并且呈现到每一个简档页面的链 接作为响应于指定该共同名称的用户搜索字符串的搜索结果的列表。
技术介绍
搜索引擎向计算机用户提供了几秒钟搜索在例如因特网的网络上可用的不断扩 大的文档集合的方式。搜索引擎使用复杂的算法来评分并排序各个文档或页面,以响应于 用户指定的搜索字符串呈现最相关和精确的结果。当用户搜索在多个实体(人、位置、组织 或其他实体)之间共享的名称时,当前方法涉及大量数据集合的密集统计计算来确定用户 在寻找多个实体中的哪个并且可能无法提供与该实体对应的完整和有意义的结果。 US20110106807公开了用于通过生成实体简档并且从多个文档提取信息以生成实 体简档集合、使用相似性匹配算法确定实体简档集合内的等同(equivalence)并且将信息 整合在相关实体中,消除实体的歧义的方法。
技术实现思路
这里公开的一个实施例包括计算机实现的方法,用于呈现响应于指定由多个实体 共享的共同名称的搜索引擎搜索字符串生成的简档页面。操作一般可以包括:从用户接收 指定作为由多个实体共享的共同名称的实体名称的第一搜索字符串;基于第一搜索字符 串的结果生成多个查询;执行多个所生成查询的每一个来创建搜索结果的相应集合;分解 (resolve)搜索结果的相应集合的每一个以使得每一个实体由单个集合的搜索结果代表; 生成多个简档,每一个简档与分解后的搜索结果的集合 ...
【技术保护点】
一种用于将搜索结果分组为简档页面的计算机实现的方法,该方法包括:接收指定一个或多个搜索词语的第一搜索字符串,其中所述一个或多个搜索词语的至少一个是与多个实体对应的共享词语;基于接收到的第一搜索字符串生成多个搜索查询,每一个对应于所述多个实体中的相应实体;执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合;分解搜索结果的集合,以使得所述多个实体的每一个由单个集合的搜索结果代表;生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其中所述多个简档中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;并且呈现所述多个简档作为响应于第一搜索字符串的结果的集合。
【技术特征摘要】
【国外来华专利技术】2012.01.17 US 13/351,6231. 一种用于将搜索结果分组为简档页面的计算机实现的方法,该方法包括: 接收指定一个或多个搜索词语的第一搜索字符串,其中所述一个或多个搜索词语的至 少一个是与多个实体对应的共享词语; 基于接收到的第一搜索字符串生成多个搜索查询,每一个对应于所述多个实体中的相 应实体; 执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合; 分解搜索结果的集合,以使得所述多个实体的每一个由单个集合的搜索结果代表; 生成多个简档,每一个简档与分解后的搜索结果的集合之一对应,其中所述多个简档 中的每一个包括从分解后的搜索结果的对应集合中的至少一个文档获得的数据;并且 呈现所述多个简档作为响应于第一搜索字符串的结果的集合。2. 如权利要求1所述的方法,所述多个实体中的每一个包括人、位置或组织中的至少 一个。3. 如权利要求1所述的方法,其中基于响应于所述第一搜索字符串提供的相关搜索字 符串的集合,生成所述多个搜索查询。4. 如权利要求1所述的方法,其中该分解包括: 比较搜索结果的集合的每一个以检测相似性;并且 当检测到所述相似性时合并搜索结果的集合。5. 如权利要求4所述的方法,其中当检测到的相似性超出了指定相似性阈值时,该合 并发生。6. 如权利要求1所述的方法,其中使用从所述搜索结果的对应集合检索到的传记信息 生成所述多个简档中的每一个。7. 如权利要求1所述的方法,包括: 接收将简档中的至少一个数据元素标记为与该简档相关或不相关的用户反馈。8. 如权利要求1所述的方法,其中所述至少一个文档包括与所述实体相关联的社交网 络页面。9. 一种用于将搜索结果分组为简档页面的计算机程序产品,所述计算机程序产品包 括: 具有以其体现的计算机可读程序代码的计算机可读存储介质,该计算机可读程序代码 包括: 配置为接收指定一个或多个搜索词语的第一搜索字符串的计算机可读程序代码,其中 所述一个或多个搜索词语中的至少一个是与多个实体对应的共享词语; 配置为基于接收到的第一搜索字符串生成多个搜索查询的计算机可读程序代码,每一 个搜索查询对应于所述多个实体中的相应实体; 配置为执行所生成的多个搜索查询的每一个来创建搜索结果的相应集合的计算机可 读程序代码; 配置为分解搜索结果的集合以使得多个实体的每一个由单个集合的搜索结果代表的 计算机可读程序代码; 配置为生成多个简档的计算机可读程序代码,每一个简档与分解后的搜索结果的集合 之一对应,其中多个简档中的每一个包括从分解后的搜索结果的对应集合中的至少一个文 档获得的数据;以及 配置为呈现多个简档作为响应于第一搜索字符串的结果的...
【专利技术属性】
技术研发人员:AK舒克,A艾沃里,EJ伯卡特,DM斯特克,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。