摘要生成方法和装置制造方法及图纸

技术编号:33923283 阅读:17 留言:0更新日期:2022-06-25 21:21
本申请提供了一种摘要生成方法和装置,包括:确定对话文本中各对话语句内的关键词;确定不同关键词之间的相关度以及对话语句内关键词之间的出现顺序;基于出现顺序,确定关键词对对话文本的影响程度;结合不同关键词之间的相关度以及关键词对对话文本的影响程度,确定关键词的重要程度;基于关键词的重要程度,生成对话文本的摘要,摘要包括:对话文本中重要程度符合条件的关键词所在的对话语句。本申请的方案能够更为高效和准确地生成对话文本的摘要。的摘要。的摘要。

【技术实现步骤摘要】
摘要生成方法和装置


[0001]本申请涉及文本处理
,尤其涉及一种摘要生成方法和装置。

技术介绍

[0002]对话文本是指至少两个对话方之间聊天或者交流的对话语句所构成的文本。
[0003]为了能够更为便捷和高效的了解对话文本的内容,经常需要生成对话文本的摘要。如,在客户服务场景中,用户与客服(如,人工客服或者机器人客服等)之间可以通过对话来实现问题咨询等信息交互,而通过提取用户与客服之间对话的对话文本的摘要,能够对用户与客服之间的交互信息进行浓缩,有利于客服服务中的相关人员获得已经讨论过的问题或者解决方案等的概括内容。
[0004]为了能够更为准确反映对话文本的内容,就需要合理地提取对话文本的摘要,因此,如何能够更为合理地从对话文本中提取摘要,使得提取的摘要能够更为准确地反映对话文本的内容是本领域技术人员迫切需要解决的技术问题。

技术实现思路

[0005]本申请提供了一种摘要生成方法和装置。
[0006]其中,一种摘要生成方法,包括:
[0007]确定对话文本中各对话语句内的关键词;
[0008]确定不同关键词之间的相关度以及所述对话语句内关键词之间的出现顺序;
[0009]基于所述出现顺序,确定所述关键词对所述对话文本的影响程度;
[0010]结合不同关键词之间的相关度以及所述关键词对所述对话文本的影响程度,确定所述关键词的重要程度;
[0011]基于所述关键词的重要程度,生成所述对话文本的摘要,所述摘要包括:所述对话文本中重要程度符合条件的关键词所在的对话语句。
[0012]在一种可能的实现方式中,在所述生成所述对话文本的摘要之前,还包括:
[0013]将所述对话文本划分为至少一个对话分区,不同对话分区内的对话语句表征不同类别的对话意图;
[0014]所述基于所述关键词的重要程度,生成所述对话文本的摘要,包括:
[0015]基于所述关键词的重要程度,确定所述对话分区内用于组成摘要的目标对话语句,得到各对话分区内的目标对话语句组成的摘要。
[0016]在一种可能的实现方式中,确定对话语句内关键词之间的出现顺序包括:
[0017]对于每个关键词,确定所述关键词的各共现关键词以及所述关键词与其共现关键词首次共同出现的共现对话语句,所述关键词的共现关键词为与所述关键词同时出现在一个对话语句内的其他关键词;
[0018]确定所述共现对话语句内所述关键词与其共现关键词之间的出现顺序。
[0019]其中,一种摘要生成装置,包括:
[0020]关键词确定单元,用于确定对话文本中各对话语句内的关键词;
[0021]关联确定单元,用于确定不同关键词之间的相关度以及所述对话语句内关键词之间的出现顺序;
[0022]影响确定单元,用于基于所述出现顺序,确定所述关键词对所述对话文本的影响程度;
[0023]重要度确定单元,用于结合不同关键词之间的相关度以及所述关键词对所述对话文本的影响程度,确定所述关键词的重要程度;
[0024]摘要生成单元,用于基于所述关键词的重要程度,生成所述对话文本的摘要,所述摘要包括:所述对话文本中重要程度符合条件的关键词所在的对话语句。
[0025]由以上可知,本申请中,在确定对话文本中各对话语句的关键词之后,不仅会确定不同关键词之间的相关度,还会结合对话语句内关键词之间的出现顺序,确定关键词对对话文本的影响程度。在基础上,本申请会结合关键词之间的相关度以及关键词对对话文本的影响程度这两个维度,综合确定关键词的重要程度,使得关键词的重要程度能够更为合理且准确地反映出该关键词在对话文本中的重要性,因此,结合关键词的重要程度能够更为合理的从对话文本中确定出用于生成摘要的对话语句,从而使得摘要能够更为准确反映出对话文本中的关键信息。
附图说明
[0026]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0027]图1示出了本申请实施例提供的摘要生成方法的一种流程示意图;
[0028]图2示出了本申请实施例提供的摘要生成方法的又一种流程示意图;
[0029]图3示出了本申请实施例提供的有向图的一种示意图;
[0030]图4示出了本申请实施例中确定关键词之间相关度的一种流程示意图;
[0031]图5示出了本申请实施例中确定关键词的重要程度的一种流程示意图;
[0032]图6示出了本申请实施例提供的摘要生成方法的又一种流程示意图;
[0033]图7示出了本申请实施例中对话文本划分出的对话分区的一种示意图;
[0034]图8示出了本申请实施例提供的摘要生成方法的又一种流程示意图;
[0035]图9示出了本申请实施例提供的有向图的又一种示意图;
[0036]图10示出了本申请实施例提供的摘要生成装置的一种组成结构示意图;
[0037]图11示出了本申请实施例提供的电子设备的一种组成架构示意图。
具体实施方式
[0038]本申请实施例的方案适用于为任意类型的对话文本生成摘要,以通过生成的摘要更为合理且准确地反映出对话文本的关键信息。
[0039]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于
本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0040]如图1所示,其示出了本申请实施例提供的摘要生成方法的一种流程示意图,本实施例的方法可以应用于任意类型的电子设备。或者多台电子设备组成的集群或者分布式系统等,如,电子设备可以为笔记本电脑、台式电脑或者服务器等,对此不加限制。
[0041]本实施例方法可以包括:
[0042]S101,确定对话文本中各对话语句内的关键词。
[0043]其中,对话文本包括至少一条对话语句。当然,一般情况下,需要生成摘要的对话文本都会包括多条对话语句。如,对话文本中的对话语句可以为不同对话方之间用于信息咨询、解答或者交流的文本语句。
[0044]在本申请中,需要提取摘要的对话文本可以为任意场景下的对话文本。如,该对话文本可以为客户服务中用户与客服之间交互的对话文本,例如,包括买方用户与卖方客服之间交互的多条对话语句的文本。又如,对话文本可以为单位或者企业内容涉及工作事务相关交流的对话文本。
[0045]当然,对话文本还可以有其他可能,本申请对于对话文本的来源以及获取方式等均不加限制。
[0046]其中,一条对话语句中可以包括至少一个关键词。
[0047]对话语句中的关键词可以通过多种方式确定,对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种摘要生成方法,包括:确定对话文本中各对话语句内的关键词;确定不同关键词之间的相关度以及所述对话语句内关键词之间的出现顺序;基于所述出现顺序,确定所述关键词对所述对话文本的影响程度;结合不同关键词之间的相关度以及所述关键词对所述对话文本的影响程度,确定所述关键词的重要程度;基于所述关键词的重要程度,生成所述对话文本的摘要,所述摘要包括:所述对话文本中重要程度符合条件的关键词所在的对话语句。2.根据权利要求1所述的方法,在所述生成所述对话文本的摘要之前,还包括:将所述对话文本划分为至少一个对话分区,不同对话分区内的对话语句表征不同类别的对话意图;所述基于所述关键词的重要程度,生成所述对话文本的摘要,包括:基于所述关键词的重要程度,确定所述对话分区内用于组成摘要的目标对话语句,得到各对话分区内的目标对话语句组成的摘要。3.根据权利要求2所述的方法,所述基于所述关键词的重要程度,确定所述对话分区内用于组成摘要的目标对话语句,包括:基于不同对话意图的对话分区各自所需提取语句的目标数量,结合所述关键词的重要程度,从所述对话分区内确定所述目标数量个目标对话语句。4.根据权利要求1所述的方法,确定对话语句内关键词之间的出现顺序包括:对于每个关键词,确定所述关键词的各共现关键词以及所述关键词与其共现关键词首次共同出现的共现对话语句,所述关键词的共现关键词为与所述关键词同时出现在一个对话语句内的其他关键词;确定所述共现对话语句内所述关键词与其共现关键词之间的出现顺序。5.根据权利要求1或4所述的方法,所述基于所述出现顺序,确定所述关键词对所述对话文本的影响程度,包括:基于所述出现顺序,确定位于所述关键词之后的其他关键词的第一数量以及位于所述关键词之前的其他关键词的第二数量;基于所述关键词对应的第一数量和所述第二数量,确定所述关键词对所述对话文本的影响程度。6.根据权利要求4所述的方法,所述确定所述共现对话语句内所述关键词与其共现关键词之间的出现顺序,包括:构建表征所述对话文本内不同关键词之间关联关系的有向图;其中,所述有向图包括:多个节点以及多个节点之间指示有方向的有向边,每个节点表征一个关键词,两个节点之间具有所述有向边表示所述两个节点对应的两个关键词互为共现关键词,所述两个节点之间的有向边的方向表示所述两个节点对应的两个关键词在共现对话语句内的出现顺序;所述基于所述出现顺序,确定所述关...

【专利技术属性】
技术研发人员:莫森
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1