一种用户查询意图识别方法技术

技术编号:9087045 阅读:195 留言:0更新日期:2013-08-28 23:37
本发明专利技术提供了一种用户查询意图识别方法,包括:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。本发明专利技术识别的准确率和召回率高;时间复杂度低,给搜索引擎造成的负荷较小,能够提升用户体验;特别适合于移动端的搜素或者移动终端本地的应用搜索。

【技术实现步骤摘要】

【技术保护点】
一种用户查询意图识别方法,包括下列步骤:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;其中,所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是对用户查询日志进行处理,将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。

【技术特征摘要】

【专利技术属性】
技术研发人员:熊锦华公帅程学旗廖华明王元卓
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1