对话文本生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：25989954 阅读：16 留言：0更新日期：2020-10-20 18:58

本申请涉人工智能技术领域，提供对话文本生成方法、装置、计算机设备和存储介质，包括：接收客户在客户终端输入的问题信息，并转换成第一结构化信息；匹配进行答复的第二结构化信息；将问题信息编码为第一多维向量；将第二结构化信息转换成序列矩阵，将序列矩阵进行前后链接转换成向量；并基于自注意力机制模型，将向量编码为第二多维向量；将第一多维向量中对应在各结构层的值，替换为第二多维向量中对应在各结构层的值，得到第三多维向量；最后对第三多维向量进行解码得到输出文本，并将输出文本反馈至所述客户终端。本申请灵活根据客户的话语进行文本的生成，灵活性高，严谨度高。本申请方案还可应用于智慧教育领域，以推进智慧城市建设。

全部详细技术资料下载

【技术实现步骤摘要】
对话文本生成方法、装置、计算机设备和存储介质
本申请涉及人工智能的
，特别涉及一种对话文本生成方法、装置、计算机设备和存储介质。
技术介绍
越来越多的企业在微信公众号、APP、网站等多个渠道都接入了大量的客服机器人，智能客服机器人可以7x24小时不间断的为用户提供服务，应用智能客服机器人为客户服务，极大地缩短了用户的等待时间，并且大幅提升客户服务的效率。然而，目前客服机器人对话存在以下几个缺陷。目前客服机器人的回复绝大多为根据预先设置的固定话术和对话模板进行回复，灵活性比较差，无法根据客户的话语做到实时生成；现有的实时对话生成模型无法编码结构化的信息，生成的对话比较随意，不够严谨。
技术实现思路
本申请的主要目的为提供一种对话文本生成方法、装置、计算机设备和存储介质，旨在克服目前客服机器人生成对话时不够严谨以及灵活性差的缺陷。为实现上述目的，本申请提供了一种对话文本生成方法，包括以下步骤：接收客户在客户终端输入的问题信息，基于自然语言理解模型对所述问题信息进行识别，并基于识别结果将所述问题信息转换成第一结构化信息；基于所述第一结构化信息，匹配进行答复的第二结构化信息；所述第一结构化信息与所述第二结构化信息具有相同的结构层；将所述问题信息编码为第一多维向量；将所述第二结构化信息转换成序列矩阵，将所述序列矩阵进行前后链接转换成向量；并基于自注意力机制模型，将所述向量编码为第二多维向量；其中，所述第二多维向量与所述第一多维向量维度相同；>将所述第一多维向量中对应在各结构层的值，替换为所述第二多维向量中对应在各结构层的值，得到第三多维向量；对所述第三多维向量进行解码得到输出文本，并将所述输出文本反馈至所述客户终端。进一步地，所述基于识别结果将所述问题信息转换成第一结构化信息的步骤，包括：根据所述问题信息的语义，对所述问题信息进行分词处理，得到多个词组；从数据库中调用多个预设的匹配表达式，每个所述匹配表达式均包括匹配词语与目标词语的替换关系；判断每个所述词组是否与所述匹配表达式中的目标词语相同；若不同，则获取所述词组与各个所述匹配表达式中匹配词语的相似度，并判断所述相似度是否大于阈值；若大于，则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式，作为所述词组的目标表达式；将所述词组匹配为所述目标表达式中目标词语；根据所述目标词语，构建所述第一结构化信息。进一步地，所述基于自然语言理解模型对所述问题信息进行识别的步骤之前，包括：检测所述问题信息中是否出现错误汉字；若出现，则获取所述问题信息中错误汉字的拼音序列；查找词典集，在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集；其中，所述词典集中包括拼音与中文词的对应关系；依次将所述错误汉字替换为所述候选文本集中的文本，并将替换之后得到的问题信息输入至双向长短记忆模型中，验证所述问题信息是否正确；若正确，则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。进一步地，所述基于自然语言理解模型对所述问题信息进行识别的步骤之前，包括：构建所述问题信息的词嵌入；将所述词嵌入输入至文本识别模型中，以提取所述问题信息对应的第一特征向量；计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离；其中，所述数据库中预设的每个第二特征向量分别关联有对应的文本；从所述第二特征向量中，确定出与所述第一特征距离最小的目标特征向量，并获取与所述目标特征向量关联的文本，作为所述问题信息的替换文本。进一步地，所述接收客户在客户终端输入的问题信息的步骤，包括：采集客户在客户终端输入的语音信息，并对所述语音信息进行文字识别，得到对应的客户文本；将所述客户文本输入至双向长短记忆模型中，验证所述客户文本是否正确；若正确，则将所述客户文本作为所述问题信息。本申请还提供了一种对话文本生成装置，包括：接收单元，用于接收客户在客户终端输入的问题信息，基于自然语言理解模型对所述问题信息进行识别，并基于识别结果将所述问题信息转换成第一结构化信息；匹配单元，用于基于所述第一结构化信息，匹配进行答复的第二结构化信息；所述第一结构化信息与所述第二结构化信息具有相同的结构层；编码单元，用于将所述问题信息编码为第一多维向量；转换单元，用于将所述第二结构化信息转换成序列矩阵，将所述序列矩阵进行前后链接转换成向量；并基于自注意力机制模型，将所述向量编码为第二多维向量；其中，所述第二多维向量与所述第一多维向量维度相同；替换单元，用于将所述第一多维向量中对应在各结构层的值，替换为所述第二多维向量中对应在各结构层的值，得到第三多维向量；输出单元，用于对所述第三多维向量进行解码得到输出文本，并将所述输出文本反馈至所述客户终端。进一步地，所述接收单元基于识别结果将所述问题信息转换成第一结构化信息，具体包括：根据所述问题信息的语义，对所述问题信息进行分词处理，得到多个词组；从数据库中调用多个预设的匹配表达式，每个所述匹配表达式均包括匹配词语与目标词语的替换关系；判断每个所述词组是否与所述匹配表达式中的目标词语相同；若不同，则获取所述词组与各个所述匹配表达式中匹配词语的相似度，并判断所述相似度是否大于阈值；若大于，则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式，作为所述词组的目标表达式；将所述词组匹配为所述目标表达式中目标词语；根据所述目标词语，构建所述第一结构化信息。进一步地，所述接收单元，还用于：检测所述问题信息中是否出现错误汉字；若出现，则获取所述问题信息中错误汉字的拼音序列；查找词典集，在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集；其中，所述词典集中包括拼音与中文词的对应关系；依次将所述错误汉字替换为所述候选文本集中的文本，并将替换之后得到的问题信息输入至双向长短记忆模型中，验证所述问题信息是否正确；若正确，则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。进一步地，所述接收单元，还用于：构建所述问题信息的词嵌入；将所述词嵌入输入至文本识别模型中，以提取所述问题信息对应的第一特征向量；计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离；其中，所述数据库中预设的每个第二特征向量分别关联有对应的文本；从所述第二特征向量中，确定出与所述第一特征距离最小的目标特征向量，并获取与所述目标特征向量关联的文本，作为所述问题信息的替换文本。进一步地，所述接收单元接收客户在客户终端输入的问题信息，具体包括：采集客户在客户终端输入的语音信息，并对所述语音信息进行文字识别，得到对应的客户文本；将所述客户文本输入至双向长短本文档来自技高网...

【技术保护点】
1.一种对话文本生成方法，其特征在于，包括以下步骤：/n接收客户在客户终端输入的问题信息，基于自然语言理解模型对所述问题信息进行识别，并基于识别结果将所述问题信息转换成第一结构化信息；/n基于所述第一结构化信息，匹配进行答复的第二结构化信息；所述第一结构化信息与所述第二结构化信息具有相同的结构层；/n将所述问题信息编码为第一多维向量；/n将所述第二结构化信息转换成序列矩阵，将所述序列矩阵进行前后链接转换成向量；并基于自注意力机制模型，将所述向量编码为第二多维向量；其中，所述第二多维向量与所述第一多维向量维度相同；/n将所述第一多维向量中对应在各结构层的值，替换为所述第二多维向量中对应在各结构层的值，得到第三多维向量；/n对所述第三多维向量进行解码得到输出文本，并将所述输出文本反馈至所述客户终端。/n

【技术特征摘要】
1.一种对话文本生成方法，其特征在于，包括以下步骤：
接收客户在客户终端输入的问题信息，基于自然语言理解模型对所述问题信息进行识别，并基于识别结果将所述问题信息转换成第一结构化信息；
基于所述第一结构化信息，匹配进行答复的第二结构化信息；所述第一结构化信息与所述第二结构化信息具有相同的结构层；
将所述问题信息编码为第一多维向量；
将所述第二结构化信息转换成序列矩阵，将所述序列矩阵进行前后链接转换成向量；并基于自注意力机制模型，将所述向量编码为第二多维向量；其中，所述第二多维向量与所述第一多维向量维度相同；
将所述第一多维向量中对应在各结构层的值，替换为所述第二多维向量中对应在各结构层的值，得到第三多维向量；
对所述第三多维向量进行解码得到输出文本，并将所述输出文本反馈至所述客户终端。

2.根据权利要求1所述的对话文本生成方法，其特征在于，所述基于识别结果将所述问题信息转换成第一结构化信息的步骤，包括：
根据所述问题信息的语义，对所述问题信息进行分词处理，得到多个词组；
从数据库中调用多个预设的匹配表达式，每个所述匹配表达式均包括匹配词语与目标词语的替换关系；
判断每个所述词组是否与所述匹配表达式中的目标词语相同；
若不同，则获取所述词组与各个所述匹配表达式中匹配词语的相似度，并判断所述相似度是否大于阈值；
若大于，则确定出所述匹配词语与所述词组的相似度最大的所述匹配表达式，作为所述词组的目标表达式；
将所述词组匹配为所述目标表达式中目标词语；
根据所述目标词语，构建所述第一结构化信息。

3.根据权利要求1所述的对话文本生成方法，其特征在于，所述基于自然语言理解模型对所述问题信息进行识别的步骤之前，包括：
检测所述问题信息中是否出现错误汉字；
若出现，则获取所述问题信息中错误汉字的拼音序列；
查找词典集，在所述词典集中获取到与所述错误汉字的拼音序列相匹配的候选文本集；其中，所述词典集中包括拼音与中文词的对应关系；
依次将所述错误汉字替换为所述候选文本集中的文本，并将替换之后得到的问题信息输入至双向长短记忆模型中，验证所述问题信息是否正确；
若正确，则基于自然语言理解模型对替换之后得到的所述问题信息进行识别。

4.根据权利要求1所述的对话文本生成方法，其特征在于，所述基于自然语言理解模型对所述问题信息进行识别的步骤之前，包括：
构建所述问题信息的词嵌入；
将所述词嵌入输入至文本识别模型中，以提取所述问题信息对应的第一特征向量；
计算所述第一特征向量与数据库中预设的每个第二特征向量之间的距离；其中，所述数据库中预设的每个第二特征向量分别关联有对应的文本；
从所述第二特征向量中，确定出与所述第一特征距离最小的目标特征向量，并获取与所述目标特征向量关联的文本，作为所述问题信息的替换文本。

5.根据权利要求1所述的对话文本生成方法，其特征在于，所述接收客户在客户终端输入的问...

【专利技术属性】
技术研发人员：柳明辉，徐国强，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人