热点问题分析方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:34832794 阅读:13 留言:0更新日期:2022-09-08 07:26
本申请涉及一种热点问题分析方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:在历史对话语句中获取多个待分析语句,根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句,进而利用注意力机制算法从候选语句中确定热点语句,以根据热点语句确定热点问题。通过上述方法避免了人工统计热点问题,减小了统计耗时,进而提高了分析效率。进而提高了分析效率。进而提高了分析效率。

【技术实现步骤摘要】
热点问题分析方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种热点问题分析方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着人工智能技术的发展,越来越多行业引入了客服机器人,以自动解答用户的提问。
[0003]传统技术中,需要人工基于历史提问数据统计热点问题,进而为客服机器人设置热点问题以及相应答复内容,以在客服机器人识别用户提出的到热点问题时,为用户提供相应的答复内容。
[0004]然而,传统人工统计热点问题的方式耗时久,效率低。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种热点问题分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种热点问题分析方法,包括:在历史对话语句中获取多个待分析语句;根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句;利用注意力机制算法从候选语句中确定热点语句,根据热点语句确定热点问题。
[0007]在其中一个实施例中,根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,包括:确定每一待分析语句的句向量和关键语句库中每一关键语句的句向量;计算每一待分析语句的句向量与每一关键语句的句向量的相似度;确定与待分析语句匹配的匹配语句的数量;其中,匹配语句为关键语句库中与待分析语句的相似度大于第一相似度阈值的关键语句;将各个待分析语句中匹配语句数量大于数量阈值的待分析语句确定为匹配程度最高的待分析语句。
[0008]在其中一个实施例中,在历史对话语句中获取多个待分析语句,包括:确定历史对话语句的关键词;获取历史对话语句中包括关键词的语句,作为待分析语句。
[0009]在其中一个实施例中,上述方法还包括:根据历史对话语句确定多个预设关键词在历史对话语句中的出现比例;根据每一预设关键词的出现比例以及关键语句库的预设容量,从历史对话语句中确定预设关键词对应的多个关键语句;
基于预设关键词对应的多个关键语句构建关键语句库。
[0010]在其中一个实施例中,利用注意力机制算法从候选语句中确定热点语句,包括:利用注意力机制算法确定每一候选语句与每一待分析语句的相似度;根据相似度在候选语句中确定热点语句。
[0011]在其中一个实施例中,根据相似度在候选语句中确定热点语句,包括:确定对应相似度大于第二相似度阈值的相似度数量与相似度总量的数量比值,若数量比值大于比例阈值,则确定对应相似度大于第二相似度阈值的候选语句为热点语句。
[0012]第二方面,本申请还提供了一种热点问题分析装置,包括:语句获取模块,用于在历史对话语句中获取多个待分析语句;匹配分析模块,用于根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句;热点确定模块,用于利用注意力机制算法从候选语句中确定热点语句,根据热点语句确定热点问题。
[0013]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:在历史对话语句中获取多个待分析语句;根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句;利用注意力机制算法从候选语句中确定热点语句,根据热点语句确定热点问题。
[0014]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:在历史对话语句中获取多个待分析语句;根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句;利用注意力机制算法从候选语句中确定热点语句,根据热点语句确定热点问题。
[0015]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:在历史对话语句中获取多个待分析语句;根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句;利用注意力机制算法从候选语句中确定热点语句,根据热点语句确定热点问题。
[0016]上述热点问题分析方法、装置、计算机设备、存储介质和计算机程序产品,通过在历史对话语句中获取多个待分析语句,根据多个待分析语句与关键语句库,确定多个待分析语句中与关键语句库匹配程度最高的待分析语句,并确定关键语句库中与匹配程度最高的待分析语句对应的关键语句为候选语句,进而利用注意力机制算法从候选语句中确定热
点语句,以根据热点语句确定热点问题。通过上述方法避免了人工统计热点问题,减小了统计耗时,进而提高了分析效率。
附图说明
[0017]图1为一个实施例中热点问题分析方法的流程示意图;图2为一个实施例中确定待分析语句的流程示意图;图3为一个实施例中确定关键语句库的流程示意图;图4为一个实施例中确定匹配程度最高的待分析语句的流程示意图;图5为一个实施例中确定热点语句的流程示意图;图6为一个实施例中BiMPM模型的结构示意图;图7为一个实施例中BiMPM模型中4种注意力机制策略的流程示意图;图8为一个实施例中热点问题分析装置的结构框图;图9为一个实施例中计算机设备的内部结构图。
具体实施方式
[0018]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0019]在一个实施例中,提供了一种热点问题分析方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0020]需要说明的是,本实施例中的热点问题(Frequently Asked Questions,FAQ)即用户所提出的咨询频率、热度达到一定程度的问题。本申请所提供的热点问题分析方法实质为确定热点问题的过程。
[0021]如图1所示,本实施例中,该方法包括以下步骤:S110、在历史对话语句中获取多个待分析语句。
[0022]其中,历史对话语句即历史对话过程中所产生的语句。可选地,历史对话语句可以是过去一段时间内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种热点问题分析方法,其特征在于,所述方法包括:在历史对话语句中获取多个待分析语句;根据所述多个待分析语句与关键语句库,确定所述多个待分析语句中与所述关键语句库匹配程度最高的待分析语句,并确定所述关键语句库中与所述匹配程度最高的待分析语句对应的关键语句为候选语句;利用注意力机制算法从所述候选语句中确定热点语句,根据所述热点语句确定热点问题。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个待分析语句与关键语句库,确定所述多个待分析语句中与所述关键语句库匹配程度最高的待分析语句,包括:确定每一待分析语句的句向量和所述关键语句库中每一关键语句的句向量;计算所述每一待分析语句的句向量与所述每一关键语句的句向量的相似度;确定与所述待分析语句匹配的匹配语句的数量;其中,所述匹配语句为所述关键语句库中与所述待分析语句的相似度大于第一相似度阈值的关键语句;将各个所述待分析语句中匹配语句数量大于数量阈值的待分析语句确定为匹配程度最高的待分析语句。3.根据权利要求1所述的方法,其特征在于,所述在历史对话语句中获取多个待分析语句,包括:确定所述历史对话语句的关键词;获取所述历史对话语句中包括所述关键词的语句,作为所述待分析语句。4.根据权利要求1~3中任一项所述的方法,其特征在于,所述方法还包括:根据所述历史对话语句确定多个预设关键词在所述历史对话语句中的出现比例;根据每一所述预设关键词的出现比例以及所述关键语句库的预设容量,从所述历史对话语句中确定所述预设关键词对应的多个关键语句;基于所述预设关键词对应的多个关键语句构建...

【专利技术属性】
技术研发人员:杨正超
申请(专利权)人:太平金融科技服务上海有限公司深圳分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1