向信息源路由查询以及对查询结果进行分类和筛选制造技术

技术编号:2833427 阅读:290 留言:0更新日期:2012-04-11 18:40
向与搜索查询类别相关联的信息源提交该搜索查询。该查询类别由将查询与类别相关联的查询知识本体来指示。代表从中检索出高百分比的该查询类别的查询的搜索结果的域的查询类别的专家域可以利用基础统计模型来建立。为搜索结果指定得分,并可以根据所指定的得分对其进行分类或筛选。所指定的得分基于该查询在搜索结果的替代表示内的存在、位置和形式。在筛选的例子中,可以对各对搜索结果进行检查,以便识别出搜索结果之间的显著质量落差(例如完全不同的指定得分)。可以删去得分低于这对搜索结果中较低等级的搜索结果的搜索结果。

【技术实现步骤摘要】
【国外来华专利技术】向信息源路由查询以及对查询结果进行分类和筛选
本文献涉及检索以及呈现搜索查询的搜索结果。技术背景常规搜索引擎检索与搜索查询相对应的一组搜索结果。某些搜索 结果可能将用户指向用户并不感兴趣的因特网资源,尽管这些搜索结 果与搜索查询相匹配。例如,当一个查询涉及多个不同主题,而这些 主题中的一个或多个对于查询提交者而言不太感兴趣或完全不感兴趣 时,可能就会出现这个问题,在这种情况下产生了代表各个不同主题 的搜索结果。
技术实现思路
在第一个一般方面,路由查询包括保持查询知识本体,该查询知 识本体包含一个或多个查询类别,以及与该一个或多个类别中的每一 个相关联的一个或多个查询。该查询知识本体中包含的与特定类别相 关联的一个或多个查询代表与该特定类别相关联的查询。从用户接收 查询。将所接收的查询与查询知识本体内包含的一个或多个查询进行比较。形成所接收查询的变形(variation)。每个变形均表示所接收 查询中包含的一个或多个项的组合,在查询知识本体内识别与所接收 查询的一个或多个形成的变形相对应的一个或多个类别。识别出对应 于所识别类别之一的信息源,并将所接收查询路由给所识别的信息源。至少关于笫一个一般方面,实现方式可以包含一个或多个以下特 征。例如,可以识别对应于一个或多个所识别类别的多个信息源,并 可以将所接收查询路由给所识别的这些信息源。路由所接收查询给所识别信息源可以包括向所识别信息源提交 所接收查询,并从所识别信息源接收所接收查询的搜索结果。路由所接收查询给所识别信息源可以包括向搜索引擎提交所接收查询,所接收查询带有仅从所识别信息源返回搜索结果的指令。可 以从该搜索引擎接收所接收查询的,仅来自所识别信息源的搜索结果。 可以使用户能够感知到所接收查询的、来自所识别信息源的搜索结果。在查询知识本体中对应于所识别类别的所识别信息源可以与所 识别类别相关联。识别对应于所识别类别的信息源可以包括从查询知 识本体中识别与所识别类别相关联的信息源。保持查询知识本体可以包括将查询知识本体内的一个或多个类 别排列为有向非循环图的节点。识别与所接收查询的变形相对应的、 查询知识本体中包含的一个或多个类别可以包括识别该查询作为与所 接收查询的变形相关联的在查询知识本体中所包含的类别的祖先类别 或孩子类别在知识本体中包含的一个或多个类别。识别与所接收查询的变形相对应的在查询知识本体中包含的一 个或多个类别可以包括识别与所接收查询的变形相对应的在知识本体 中包含的多个类别。可以将该多个类别的子集识别为与所接收查询的 变形相对应的类别。识别该多个类别的子集可以包括根据所述类别的 子集是否对应于单个查询的判断来识别所述该多个类别的子集。根据 所述类别的子集是否对应于单个查询的判断来识别所述多个类别的子 集可以包括根据所述类别的子集中所包含的类别对应于单个查询的概 率来识别所述类别的子集.根据所述类别的子集中所包含类别先前是 否对应于一个查询的判断来识别所述类别的子集.所接收查询可以用与所接收查询相对应的在查询知识本体中所 包含的类别相关联的信息来补充。该信息源可以表示这样的信息源,能够从中识别与所识别类别相 关联的查询的大百分比搜索结果。所接收查询的每一个变形均可以表示该查询内接连项的子集a在变形中按照该查询中包含接连项的次序 包含这些接连项。在第二个一般方面,识别查询的专家域包括保持查询知识本体, 它包含一个或多个查询类别、以及与该一个或多个类别中的每一个相 关联的一个或多个查询。该查询知识本体中所包含的与特定类别相关联的该一个或多个查询代表与该特定类别相关联的查询。检索该查询 知识本体中所包含查询的搜索结果。确定从中识别该查询知识本体中总体上包含的查询的搜索结果之一的各个域在所检索搜索结果中的出 现频率。检索与查询知识本体中所包含类别相关联的查询的搜索结果, 并确定从中识别与该类别相关联的查询的搜索结果之一的各个域在所 检索搜索结果中的出现频率。对于从其中识别与该类别相关联的查询 的搜索结果之一的各个域,将它在与该类别相关联的查询的搜索结果 中的出现频率与它在知识本体中总体上包含的查询的搜索结果中的出 现频率进行比较。将在与该类别相关联的查询的搜索结果中比在查询 知识本体中总体上包含的查询的搜索结果中更常识别出搜索结果的一个或多个域,识别为该类别的专家域。至少对于第二个一般方面,实现方式可以包含一个或多个以下特 征。例如,在查询知识本体中所识别的专家域可以与类别相关联。可 以从用户接收查询。所接收查询的变形可以与该类别相关联,并且可 以向用户呈现与该类别相关联的一个或多个专家域。 一旦用户选择了 这些专家域中的 一个,就可以从所选的专家域检索所接收查询的专家 搜索结果。确定从中识别该查询知识本体中所包含查询的搜索结果之一的 各个域在所检索搜索结果中的出现频率,可以包括确定从该域中识别 的所检索搜索结果的数目.确定从中识别该类别中所包含查询的搜索 结果之一的各个域在所检索搜索结果中的出现频率,可以包括确定从 该域中识别的所检索搜索结果的数目。确定从中识别该查询知识本体中所包含查询的搜索结果之一的 各个域在所检索搜索结果中的出现频率,可以包括确定从该域中识别 所检索搜索结果之一的概率。确定从中识别该类别中所包含查询的搜 索结果之一的各个域在所检索搜索结果中的出现频率,可以包括确定从该域中识别的所检索搜索结果之一的概率。一个域在查询知识本体中所包含查询的搜索结果中的出现频率 可以与这个域在该类别中所包含查询的搜索结果中的出现频率进行比较。可以根据频率的比较结果来识别这个域的加权因子。可以将加权 因子超出阈值加权因子的一个或多个域识别为专家域。可以将具有最 高加权因子的特定数目的域识别为专家域。检索查询知识本体中所包含查询的搜索结果可以包括,向搜索引 擎提交该查询知识本体中所包含的每个查询,并从该搜索引擎接收每 一个所提交查询的搜索结果。检索与查询知识本体中所包含类别相关 联的查询的搜索结果可以包括,向搜索引擎提交与该类别相关联的每 个查询,并从该搜索引擎接收每一个所提交查询的搜索结果。检索查询知识本体中所包含查询的搜索结果可以包括检索搜索 结果的子集。检索与查询知识本体中所包含类别相关联的查询的搜索 结果可以包括检索搜索结果的子集。可以使用户能够删除一个或多个所识别的专家域,并向所识别的 专家域添加一个或多个额外的专家域。在第三个一般方面,对搜索结果进行分类包括向多个搜索引擎提 交从用户接收的查询。从该多个搜索引擎的每一个接收该查询的一組 搜索结果。访问若千搜索结果中每一个的替代表示。根据与这些搜索 结果中的每一个相对应的替代表示的视觉特性,为其指定得分.根据 为搜索结果指定的得分来合并搜索结果的集合.至少对于第三个一般方面,实现方式可以包含一个或多个以下特 征.例如,合并搜索结果的集合可以包括创建搜索结果的一个单个列 表,该列表包含按照递减得分排序的搜索结果.根据与这些搜索结果中的每一个相对应的替代表示的视觉特性为其指定得分可以包括根据相应替代表示内的查询项的存在,相应 替代表示内查询项之间的距离,相应替代表示内查询项的次序,或者 其组合来给搜索结果指定得分。根据与这些搜索结果中的每一个相对应的替代表示的视觉特性本文档来自技高网...

【技术保护点】
一种路由查询的方法,该方法包括:保持查询知识本体,所述查询知识本体包含一个或多个查询类别、以及与所述一个或多个类别中的每一个相关联的一个或多个查询,该查询知识本体中包含的与特定类别相关联的所述一个或多个查询代表与该特定类别相关联的查 询;从用户接收查询;将所接收的查询与所述查询知识本体内包含的一个或多个所述查询进行比较;形成所接收查询的变形,每个变形均表示所接收查询中包含的一个或多个项的组合;从查询知识本体中识别与形成的所接收查询的变形的 一个或多个相对应的一个或多个类别;识别对应于所识别出的类别之一的信息源;及将所接收查询路由给所识别出的信息源。

【技术特征摘要】
【国外来华专利技术】US 2004-12-29 11/023,633;US 2004-12-29 11/023,642;1.一种路由查询的方法,该方法包括保持查询知识本体,所述查询知识本体包含一个或多个查询类别、以及与所述一个或多个类别中的每一个相关联的一个或多个查询,该查询知识本体中包含的与特定类别相关联的所述一个或多个查询代表与该特定类别相关联的查询;从用户接收查询;将所接收的查询与所述查询知识本体内包含的一个或多个所述查询进行比较;形成所接收查询的变形,每个变形均表示所接收查询中包含的一个或多个项的组合;从查询知识本体中识别与形成的所接收查询的变形的一个或多个相对应的一个或多个类别;识别对应于所识别出的类别之一的信息源;及将所接收查询路由给所识别出的信息源。2. 根据权利要求1的方法,其中路由所接收查询给所识别出的 信息源的步稞包括向所识别出的信息源提交所接收查询;及 从所识别出的信息源接收所接收查询的搜索结果。3. 根据权利要求1的方法,还包括使用户能够感知到对于所接 收查询的、来自所识别别出的信息源的搜索结果。4. 根据权利要求1的方法,其中在查询知识本体中对应于所识 别出的类别的所识别出的信息源与所识别出的类别相关联,并且识别 对应于所识别出的类别的信息源的步骤包括从查询知识本体识别出所 识别出的类别相关联的信息源。5. 根据权利要求1的方法,其中保持查询知识本体的步骤包括 将查询知识本体内的一个或多个类别排列为有向非循环图中的节点, 并且识别与所接收查询的变形相对应的、在查询知识本体中包含的一个或多个类别的步骤包括识别该查询知识本体中包含的、作为在查询 知识本体中包含的与所接收查询的变形相关联的类别的祖先类别或孩子类别的一个或多个类别。6. 根据权利要求1的方法,其中识别与所接收查询的变形相对 应的、在查询知识本体中包含的所述一个或多个类别的步骤包括识别与所接收查询的变形相对应的、在查询知识本体中包含的多 个类别;及将该多个类别的子集识别为与所接收查询的变形相对应的类别。7. 根据权利要求1的方法,还包括给所接收查询补充以与同 所接收查询相对应的、在查询知识本体中包含的类别相关联的信息。8. 根据权利要求1的方法,其中所接收查询的每一个变形均表 示该查询内接连的项的子集,所述接连的项按照所述接连的项包括在 该查询中的顺序包括在所述变形中。9. 一种对搜索结果进行分类的方法,该方法包括 向多个搜索引擎提交从用户接收的查询;从所述多个搜索引擎的每一个接收该查询的搜索结果的集合; 访问若干所述搜索结果中的每一个的替代表示; 根据与这些搜索结果中的每一个相对应的替代表示的视觉特性, 为这些搜索结果中的每一个指定得分;及根据为这些搜索结果指定的得分来合并搜索结果的集合。10. 根据权利要求9的方法,其中合并搜索结果的集合的步骤包 括创建搜索结果的 一个单个列表,该列表包含按照递减得分排序的搜 索结果。11. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步骤包括根据相应替代表示内的查询项的存在来给搜索结果指定 得分。12. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步骤包括根据相应替代表示内查询项之间的距离来给搜索结果指 定得分。13. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步骤包括根据相应替代表示内查询项的次序,来给搜索结果指定 得分。14. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步跺包括根据相应替代表示内的查询项的存在、相应替代表示内 查询项之间的距离,和相应替代表示内查询项的次序的组合来给搜索 结果指定得分。15. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步骤包括根据相应替代表示内存在的查询数量来给搜索结果指定 得分。16. 根据权利要求15的方法,其中根据相应替代表示内存在的 查询数量来给搜索结果指定得分的步骤包括根据相应替代表示内存 在的查询项的数目来给搜索结果指定得分。17. 根据权利要求15的方法,其中根据相应替代表示内存在的 查询数量来给搜索结果指定得分的步骤包括根据相应替代表示内存 在的查询项数目与该查询内查询项数目的比,来给搜索结果指定得分。18. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步骤包括根据反映查询项的相应替代表示的数量来给搜索结果指 定得分。19. 根据权利要求18的方法,其中根据反映查询项的相应替代 表示的数量来给搜索结果指定得分的步骤包括根据相应替代表示内 存在的查询项数目与相应替代表示中项数的比,来给搜索结果指定得 分。20. 根据权利要求9的方法,其中根据与这些搜索结果中的每一 个相对应的替代表示的视觉特性为这些搜索结果中的每一个指定得分 的步骤包括根据查询项在相应替代表示中的位置来给搜索结果指定 得分。21. 根据权利要求9的方法,其中搜索结果的替代表示包括由搜 索结果的标题、超链接、日期、描述、关键字,和元数据构成的组中 的至少一个。22.根据权利要求9的...

【专利技术属性】
技术研发人员:阿布杜尔R乔杜瑞格雷戈里S帕斯杰拉尔德F坎贝尔
申请(专利权)人:奥尔有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1