使用图划分动态地生成面制造技术

技术编号:35982456 阅读:15 留言:0更新日期:2022-12-17 22:54
示例系统包括处理器,处理器用于接收从与查询相对应的结果集中提取的概念以及针对每个所提取的概念的结果关联。处理器用于基于所提取的概念而构建图,其中,图包括多个节点和加权边,多个节点表示所提取的概念,加权边表示从共享结果中提取的概念之间的相似度。处理器用于将图划分成子图,子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应。处理器用于对候选面进行排名。处理器用于选择较高排名的候选面以用作面。处理器用于输出面和响应于查询的结果集。应于查询的结果集。应于查询的结果集。

【技术实现步骤摘要】
【国外来华专利技术】使用图划分动态地生成面

技术介绍

[0001]本技术涉及面(facets)。更具体地,本技术涉及动态地生成面。

技术实现思路

[0002]根据本文描述的实施例,一种系统可以包括处理器,所述处理器用于接收从与查询相对应的结果集中提取的概念以及针对每个所提取的概念的结果关联。所述处理器还可以基于所提取的概念而构建图。所述图包括多个节点和加权边,所述多个节点表示所提取的概念,所述加权边表示从共享结果中提取的概念之间的相似度。所述处理器还可以将所述图划分成子图,所述子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应。所述处理器还可以对所述候选面进行排名。所述处理器可以选择较高排名的候选面以用作面。所述处理器还可以输出所述面和响应于所述查询的所述结果集。
[0003]根据本文描述的另一实施例,一种方法可以包括经由处理器接收查询、与所述查询相对应的结果集、以及知识库。所述方法还可以包括经由所述处理器使用所述知识库从所述结果集中提取概念。所述方法还可以包括经由所述处理器基于所提取的概念而构建图。所述图包括多个节点和加权边,所述多个节点表示概念,所述加权边表示从共享结果中提取的概念之间的相似度。所述方法还可包括经由所述处理器将所述图划分成子图,所述子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应。所述方法还可以包括经由所述处理器对所述候选面进行排名。所述方法还可以包括经由所述处理器选择较高排名的候选面以用作面。所述方法还可以包括经由所述处理器输出所述面和响应于所述查询的所述结果集。
[0004]根据本文描述的另一实施例,一种用于面生成的计算机程序产品可以包括具有程序代码的计算机可读存储介质。所述计算机可读存储介质本身不是暂时性信号。所述程序代码能够由处理器执行以使得所述处理器接收查询、与所述查询相对应的结果集、以及知识库。所述程序代码还可以使得所述处理器使用所述知识库从所述结果集中提取概念。所述程序代码还可以使得所述处理器基于所提取的概念而构建图。所述图包括多个节点和加权边,所述多个节点表示概念,所述加权边表示从共享结果中提取的概念之间的相似度。所述程序代码还可以使得所述处理器将所述图划分成子图,所述子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应。所述程序代码还可以使得所述处理器对所述候选面进行排名。所述程序代码还可以使得所述处理器还选择较高排名的候选面以用作面。所述程序代码还可以使得所述处理器输出所述面和响应于所述查询的所述结果集。
附图说明
[0005]图1是用于使用图划分动态地生成面的示例系统的框图;
[0006]图2是可以使用图划分动态地生成面的示例方法的框图;
[0007]图3是可以使用图划分动态地生成面的示例计算设备的框图;
[0008]图4是根据本文描述的实施例的示例云计算环境的图;
[0009]图5是根据本文描述的实施例的示例抽象模型层的图;以及
[0010]图6是可以使用图划分动态地生成面的示例有形非暂时性计算机可读介质。
具体实施方式
[0011]一些系统提供用于过滤搜索结果的过滤器。例如,用户可以提交搜索查询,并且为了帮助用户缩小结果列表,系统可以建议若干过滤器供用户选择。这些过滤器在此被称为面(facets)。如本文所使用的,面是指对查询的每个结果进行分类所沿的维度。例如,销售相机镜头的网站上的搜索引擎可以具有一组面,包括相机类型、镜头焦距、镜头速度等,以用于查询由特定制造商制造的镜头。这些面可以由系统基于针对查询返回的结果来选择。系统然后可以向用户建议一个或多个面以帮助缩小搜索结果的范围。这样,系统可以使得分类能够以多种方式而不是以单个、预定的分类学顺序被访问和排序。然而,这样的面可以被限于一组预先定义的面。这样的搜索引擎可能不能够自动地适配以在附加特征出现时为附加特征添加面,诸如自动对焦能力、眼睛或面部跟踪能力等。相反,这样的搜索引擎可能只是对概念在一组搜索结果中出现的次数进行计数,并相应地显示一组预先定义的面。此外,提交给通用搜索引擎的查询可具有许多不同的意图。例如,提交的“美洲虎”查询可以旨在指动物或汽车制造商。如果不是不可能,则为所有可能的查询意图预先定义不同的面集合可能是非常困难的。
[0012]根据本公开的实施例,系统的处理器可以接收从与查询相对应的结果集中提取的概念以及针对每个所提取的概念的结果关联。处理器可以基于所提取的概念而构建图,其中,图包括多个节点和加权边,多个节点表示所提取的概念,加权边表示从共享结果中提取的概念之间的相似度。例如,如果在至少一个结果中一起检测到概念,则两个节点可以仅共享边。然后,可以基于相似度向边分配权重。处理器可以将图划分成子图,子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应。处理器还可以对候选面进行排名。处理器可以选择较高排名的候选面以用作面。处理器然后可以输出面和响应于查询的结果集。因此,本公开的实施例允许用户使用面来缩小查询的结果集,这能够减少用户在找到预期结果方面的工作。该技术使得能够从一组预先定义的有意义的概念中自动生成面。
[0013]现在参考图1,框图示出了用于使用图划分动态地生成面的示例系统。示例系统总体上由参考数字100表示。在各种示例中,系统100可以用于使用图3的计算设备300来实现图2的方法200。
[0014]图1的系统100包括用户接口102。系统100包括通信地耦接到用户接口102的概念提取器104。系统100还包括通信地耦接到概念提取器104的搜索引擎106。系统100还包括通信地耦接到概念提取器104的面服务108。
[0015]在图1的示例中,用户接口102可以从用户接收查询110,并将查询发送到概念提取器104。概念提取器104可以将查询110转发给搜索引擎106。搜索引擎106可以基于查询而生成结果集112,并将结果集112发送到概念提取器104。例如,结果集可以是一组文档。
[0016]然后,概念提取器104可以生成具有结果关联的概念组。例如,每组概念可以与结果集112中的特定结果相关联。在各种示例中,概念提取器104可以访问用于一个或多个领域的高级类别的闭集。作为一个例子,对于计算机科学领域,可以使用arXiv归档计算机科学类别。例如,这些类别包括“人工智能”、“计算和语言”、“计算复杂度”、“计算工程”、“金融
和科学,计算几何”、“计算机科学和游戏理论”、“计算机视觉和模式识别”、“计算机和社会”、“密码学和安全”、“数据结构和算法”、“数据库”、“数字库”、“离散数学”、“分布式、并行和集群计算”、“新兴技术”、“形式语言和自动机理论”、“一般文献”、“图形”、“硬件架构”、“人机交互”、“信息检索”、“信息理论”、“计算机科学中的逻辑”以及其他类别。概念提取器104也可以访问知识库。例如,知识库可以是维基百科。用于一个或多个领域的高级类别可以被映射到知识库的类别。在各种示例中,提及(mention)检测可以作为概念提取器104摄取管道的一部分来运行,并且提及被存储在索引中。例如,提及检测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统,包括处理器,所述处理器用于:接收从与查询相对应的结果集中提取的概念以及针对每个所提取的概念的结果关联;基于所提取的概念而构建图,其中,所述图包括多个节点和加权边,所述多个节点表示所提取的概念,所述加权边表示从共享结果中提取的概念之间的相似度;将所述图划分成子图,所述子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应;对所述候选面进行排名;选择较高排名的候选面以用作面;以及输出所述面和响应于所述查询的所述结果集。2.根据权利要求1所述的系统,其中,使用知识库从与所述查询相对应的所述结果集中提取所述概念。3.根据权利要求2所述的系统,其中,所述处理器用于将领域的高级类别映射到所述知识库的类别。4.根据权利要求2所述的系统,其中,所述处理器用于将提及检测工具应用于所述结果集中的所有文档以提取所述概念。5.根据权利要求2所述的系统,其中,所述处理器用于遍历所述知识库的类别树,并提取其类别在领域的层级之下的概念。6.根据权利要求1所述的系统,其中,所述处理器用于基于包含所提取的概念的提及的页面的数量来过滤所述概念。7.根据权利要求1所述的系统,其中,基于所述多个节点中的每个节点表示的概念的内链的数量,对每个节点加权。8.一种计算机实现的方法,包括:经由处理器接收查询、与所述查询相对应的结果集、以及知识库;经由所述处理器使用所述知识库从所述结果集中提取概念;经由所述处理器基于所提取的概念而构建图,其中,所述图包括多个节点和加权边,所述多个节点表示概念,所述加权边表示从共享结果中提取的概念之间的相似度;经由所述处理器将所述图划分成子图,所述子图的顶点与用于顶点的具有较高的加权边总和的候选面相对应;经由所述处理器对所述候选面进行排名;经由所述处理器选择较高排名的候选面以用作面;以及经由所述处理器输出所述面和响应于所述查询的所述结果集。9.根据权利要求8所述的计算机实现的方法,其中,构建所述图包括:基于所述多个节点中的每个节点表示的概念的内链的数量,计算每个节点的权重。10.根据权利要求8所述的计算机实现的方法,其中,构建所述图包括:使用归一化成对互信息PMI或归一化谷歌距离NGD来计算所述边中的每个边的权重。11.根据权利要求8所...

【专利技术属性】
技术研发人员:O
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1