一种基于文本生成的智能填单方法技术

技术编号:38907093 阅读:30 留言:0更新日期:2023-09-22 14:25
本发明专利技术提供了一种基于文本生成的智能填单方法,包括:拼接当前轮对话内容得到当前交互文本;使用神经网络编码器得到当前轮对应的表单项;构造当前轮对应的表单项的表单生成指示;将表单生成指示作为神经网络解码器的初始输出,得到下一轮对应的表单项;根据下一轮对应的表单项更新当前轮对应的表单状态文本,得到下一轮对应的表单状态文本;基于下一轮对应的表单状态文本,对前轮对应的历史操作文本进行更新,得到下一轮的历史文本。本发明专利技术解决了现有技术中在智能填单的多轮交互的过程中,丢弃较早的历史数据,只考虑最近几轮的对话数据导致生成的表单内容不准确的问题。导致生成的表单内容不准确的问题。导致生成的表单内容不准确的问题。

【技术实现步骤摘要】
一种基于文本生成的智能填单方法


[0001]本专利技术涉及智能填单
,特别是涉及一种基于文本生成的智能填单方法。

技术介绍

[0002]智能填单是使用人工智能技术,自动从“人与人”、“人与机器人”的通话内容生成工单,以提高客服工单的记录和处理速度,将客服人员从简单枯燥的填单工作中解放出来,把更多的精力放在对实际问题的处理上,提高服务效率和质量。目前主流的智能填单技术有AIGC(人工智能生成内容)技术和实体抽取技术。实体抽取智能填单是使用深度神经网络序列标注模型和实体词典匹配等算法,从对话内容中标注对应表单项的实体词,需要精细梳理实体类型和实体词典,标注工作量大,难以在不同领域间迁移。AIGC智能填单是使用类ChatGPT文本生成技术,以对话内容为表单生成提示,生成表单内容。现有的序列标注算法、GPT等文本生成模型,在应用于智能填单时,对多轮交互上下文的建模能力都很薄弱,严重影响对表单项的正确赋值和多轮传递。现有的多轮交互上下文建模方法,是将原始的历史对话文本按时间先后顺序简单拼接,拼接成的文本长度不可控。深度神经网络模型难以处理过长的文档,交互轮数多了之后,通常是丢弃较早的历史数据,只考虑最近几轮的对话数据,破坏了多轮语义的完整性。
[0003]综上,现有技术中存在着在智能填单的多轮交互的过程中,丢弃较早的历史数据,只考虑最近几轮的对话数据导致生成的表单内容不准确的问题。

技术实现思路

[0004]为了克服现有技术的不足,本专利技术的目的是提供一种基于文本生成的智能填单方法,本专利技术解决了现有技术中在智能填单的多轮交互的过程中,丢弃较早的历史数据,只考虑最近几轮的对话数据导致生成的表单内容不准确的问题。
[0005]为实现上述目的,本专利技术提供了如下方案:一种基于文本生成的智能填单方法,包括:拼接当前轮对话内容得到当前交互文本;使用神经网络编码器分别计算当前交互文本的编码、当前轮对应的历史操作文本的编码和当前轮对应的表单状态文本的编码,得到当前轮对应的表单项;构造当前轮对应的表单项的表单生成指示;基于当前交互文本的注意力、当前轮对应的历史操作文本的注意力和当前轮对应的表单状态文本的注意力,将所述表单生成指示作为神经网络解码器的初始输出,得到下一轮对应的表单项;根据所述下一轮对应的表单项更新当前轮对应的表单状态文本,得到下一轮对应的表单状态文本;基于下一轮对应的表单状态文本,对所述前轮对应的历史操作文本进行更新,得到下一轮的历史文本。
[0006]优选地,所述神经网络解码器的解码过程为:将表单生成指示输入解码器,利用解码器循环生成表单项内容的下一个词,并将每个词拼接到输出文本后。
[0007]优选地,所述神经网络解码器的解码顺序为:遮掩式注意力及残差归一化;历史操作注意力及残差归一化;表单状态注意力及残差归一化;当前交互注意力及残差归一化;前馈网络及残差归一化。
[0008]优选地,所述使用神经网络编码器分别计算当前交互文本的编码、当前轮对应的历史操作文本的编码和当前轮对应的表单状态文本的编码,得到当前轮对应的表单项,包括:确定当前交互文本的结构化数据、当前轮对应的历史操作文本的结构化数据和当前轮对应的表单状态文本的结构化数据;基于当前交互文本的结构化数据、当前轮对应的历史操作文本的结构化数据和当前轮对应的表单状态文本的结构化数据,得到当前交互文本的多维向量、当前轮对应的历史操作文本的多维向量和当前轮对应的表单状态文本的多维向量;基于损失函数,根据当前交互文本的多维向量、当前轮对应的历史操作文本的多维向量和当前轮对应的表单状态文本的多维向量得到当前交互文本的编码数据、当前轮对应的历史操作文本的编码数据和当前轮对应的表单状态文本的编码数据的匹配数据集,所述匹配数据集为第一匹配数据、第二匹配数据和第三匹配数据;基于神经网络编码器,利用优化函数,根据所述匹配数据集计算得到当前轮对应的表单项。
[0009]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术提供了一种基于文本生成的智能填单方法,本专利技术追踪从对话开始到当前轮的每一轮交互数据,累积每一轮的智能填单生成结果,将最新的表单项赋值组合成一段文本,维护在表单状态中,并将最近一轮对表单的修改记录在历史操作中,从而兼顾了全局上下文和局部上下文。在每一轮智能填单时,结合历史操作、表单状态、当前交互,重新生成每一个表单项,保证了上下文表单状态的鲜活性和完整性,为准确生成表单项内容提供了充分的信息源。
附图说明
[0010]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0011]图1为本专利技术实施例提供的一种基于文本生成的智能填单方法流程图;图2为本专利技术实施例提供的一种基于文本生成的智能填单方法原理图;图3为本专利技术实施例提供的深度神经网络架构图;
图4为本专利技术实施例提供的居民用电故障报修通话其中一轮的智能填单示意图。
具体实施方式
[0012]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0013]本专利技术的目的是提供一种基于文本生成的智能填单方法,本专利技术解决了现有技术中在智能填单的多轮交互的过程中,丢弃较早的历史数据,只考虑最近几轮的对话数据导致生成的表单内容不准确的问题。
[0014]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0015]如图1所示,本专利技术提供了一种基于文本生成的智能填单方法,包括:步骤100:拼接当前轮对话内容得到当前交互文本;步骤200:使用神经网络编码器分别计算当前交互文本的编码、当前轮对应的历史操作文本的编码和当前轮对应的表单状态文本的编码,得到当前轮对应的表单项;步骤300:构造当前轮对应的表单项的表单生成指示;步骤400:基于当前交互文本的注意力、当前轮对应的历史操作文本的注意力和当前轮对应的表单状态文本的注意力,将所述表单生成指示作为神经网络解码器的初始输出,得到下一轮对应的表单项;步骤500:根据所述下一轮对应的表单项更新当前轮对应的表单状态文本,得到下一轮对应的表单状态文本;步骤600:基于下一轮对应的表单状态文本,对所述前轮对应的历史操作文本进行更新,得到下一轮的历史文本。
[0016]如图2

3所示,以居民用电故障报修通话其中一轮的智能填单为例:步骤如下:S101、在对话的每一轮,拼接当前轮客服说的话和客户说的话得到当前交互文本。当前交互是“客服说:您家里的电闸跳了吗?客户说:没跳。”。
[0017]S102、使用神经网络编码器分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本生成的智能填单方法,其特征在于,包括:拼接当前轮对话内容得到当前交互文本;使用神经网络编码器分别计算当前交互文本的编码、当前轮对应的历史操作文本的编码和当前轮对应的表单状态文本的编码,得到当前轮对应的表单项;构造当前轮对应的表单项的表单生成指示;基于当前交互文本的注意力、当前轮对应的历史操作文本的注意力和当前轮对应的表单状态文本的注意力,将所述表单生成指示作为神经网络解码器的初始输出,得到下一轮对应的表单项;根据所述下一轮对应的表单项更新当前轮对应的表单状态文本,得到下一轮对应的表单状态文本;基于下一轮对应的表单状态文本,对所述前轮对应的历史操作文本进行更新,得到下一轮的历史文本。2.根据权利要求1所述的一种基于文本生成的智能填单方法,其特征在于,所述神经网络解码器的解码过程为:将表单生成指示输入解码器,利用解码器循环生成表单项内容的下一个词,并将每个词拼接到输出文本后。3.根据权利要求1所述的一种基于文本生成的智能填单方法,其特征在于,所述神经网络解码器的解码顺序为:遮掩式注意力及残差归一化;历史操作注意力及残差归一化;表单状态注意...

【专利技术属性】
技术研发人员:王丙栋游世学
申请(专利权)人:北京中科汇联科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1