用于意图挖掘的方法和设备技术

技术编号:11171760 阅读:206 留言:0更新日期:2015-03-19 13:05
本发明专利技术涉及用于意图挖掘的方法和设备。公开了一种用于意图挖掘的方法,所述方法包括:获取输入查询;针对所述输入查询生成意图类似查询,其中每一个意图类似查询具有与所述输入查询相同或类似的意图类型;针对每一个意图类似查询挖掘一组意图,其中每个意图提供针对相应的意图类似查询的子主题;通过使用所述意图类似查询的全部的意图组来确定类似意图信息描述集;以及通过使用所述类似意图信息描述集来挖掘针对所述输入查询的意图。

【技术实现步骤摘要】
用于意图挖掘的方法和设备
本专利技术涉及文本挖掘的方法和设备。特别地,本专利技术涉及用于挖掘意图的方法和 设备。并且更特别地,本专利技术涉及发现用户所提出的查询背后的搜索意图的方法和设备。
技术介绍
随着计算机和信息技术的不断发展,现在在整个世界中的信息产生的速率不断增 力口。现今世界中存在个人信息、职业信息、娱乐信息、科技信息、政府信息等诸多信息。因为 信息过多,所以导致对信息的组织和访问成为问题。 为了改进用户在信息搜索过程中的体验,用于帮助用户访问其所寻找的信息的 方法和系统不断被研发。例如,在 Santos, et al. 2011. University of Glasgow at the NTCIR-9Intent task:Experiments with Terrier on Subtopic Mining and Document Ranking. Proceedings of NTCIR_9Workshop Meeting, 2011,Tokyo (非专利文献 1)中提出 了尝试理解用户所输入的查询背后的潜在意图。在用户输入简短并且含糊的查询的情况 下,希望能够输出n个(例如,n=10)重要的并且多样化的最佳意图结果。表1示出了一种 示例。
用于意图挖掘的方法和设备

【技术保护点】
一种用于意图挖掘的方法,所述方法包括:获取输入查询;针对所述输入查询生成意图类似查询,其中每一个意图类似查询具有与所述输入查询相同或类似的意图类型;针对每一个意图类似查询挖掘一组意图,其中每个意图提供针对相应的意图类似查询的子主题;通过使用所述意图类似查询的全部的意图组来确定类似意图信息描述集;以及通过使用所述类似意图信息描述集来挖掘针对所述输入查询的意图。

【技术特征摘要】
1. 一种用于意图挖掘的方法,所述方法包括: 获取输入查询; 针对所述输入查询生成意图类似查询,其中每一个意图类似查询具有与所述输入查询 相同或类似的意图类型; 针对每一个意图类似查询挖掘一组意图,其中每个意图提供针对相应的意图类似查询 的子主题; 通过使用所述意图类似查询的全部的意图组来确定类似意图信息描述集;以及 通过使用所述类似意图信息描述集来挖掘针对所述输入查询的意图。2. 如权利要求1所述的方法,其中针对所述输入查询生成意图类似查询包括: 从至少一个数据源获得一个或多个查询对短语,其中每个查询对短语包括:所述输入 查询、意图类似指示符以及第三短语;以及 从每一个查询对短语提取所述第三短语,作为所述意图类似查询。3. 如权利要求1所述的方法,其中所述类似意图信息描述通过输入查询的正规表达来 呈现。4. 如权利要求3所述的方法,其中确定所述类似意图信息描述集包括: 分析所述意图类似查询的全部的意图组中的每一个意图的语言形式; 确定所述语言形式中相应意图类似查询的语言形式和其余语言形式之间的至少一种 查询意图关系; 对应于所确定的至少一种查询意图关系将每一个意图的语言形式变换为正规表达;以 及 将变换获得的正规表达添加到所述类似意图信息描述集中。5. -种用于意图挖掘的设备,所述设备包括: 输入查询获取单元,获取输入查询; 意图类似查询生成单元,针对所述输入查询生成意图类似查询,其中每一个意图类似 查询具有与所述输入查询相同或类似的意图类型; 第一意图挖掘单元,针对每一个意图类似查询挖掘一组意图,其中每个意图提供针对 相应的意图类似查询的子主题; 类似意图信息描述集确定...

【专利技术属性】
技术研发人员:黄耀海张碧川刘鹏
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1