一种交互式对话方法、装置、设备及存储介质制造方法及图纸

技术编号：44164699 阅读：6 留言：0更新日期：2025-01-29 10:37

本申请涉及人工智能技术领域，提供一种交互式对话方法、装置、设备及存储介质，其中方法包括：采集用户输入的语音信号并对语音信号进行识别，得到语音信号对应的第一文本内容；提取语音信号的语音情感表征；提取第一文本内容的文本情感表征；将语音情感表征与文本情感表征进行融合，得到情感信息；根据第一文本内容，确定与第一文本内容对话的第二文本内容；根据情感信息与第二文本内容，输出对话语音。本申请将语音情感表征和文本情感表征进行融合，以充分地了解用户的真实情感状态，得到与用户的情感状态或说话风格相匹配的情感信息。根据情感信息和第二文本内容，输出与用户的情感状态或说话风格相匹配的对话语音，提高了交互性对话的真实性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种交互式对话方法、装置、设备及存储介质。

技术介绍

1、随着人机交互在人工智能
的迅猛发展，智能对话系统和用户可以实时地进行信息交换和反馈，其与用户双向对话，能够理解用户的问题并提供相应的回答。在医疗领域中，病人可以通过电话与医院中设有智能对话系统的客服机器人进行交互式对话，例如，病人可以向客服机器人咨询诊室位置、检查科室等医院信息，客服机器人通过预先设置的程序对用户咨询的信息进行处理后输出回复的语音。

2、相关技术中，一般采用固定话式合成指定的回复对话，不能很好地根据用户当前情绪生成贴合实际情绪的情感对话，与真实对话场景具有很大差距，导致对话流程显得枯燥和乏味。

技术实现思路

1、本申请的主要目的在于提供一种交互式对话方法、装置、设备及存储介质，将语音情感表征和文本情感表征进行融合，可以充分地了解用户的真实情感状态，以得到能够与用户的情感状态或者说话风格相匹配的情感信息；根据情感信息和第二文本内容，输出与用户的情感状态或者说话风格相匹配的对话语音，从而可以提高交互性对话的真实性。

2、第一方面，本申请提供一种交互式对话方法，包括：

3、采集用户输入的语音信号，并对所述语音信号进行识别，得到所述语音信号对应的第一文本内容；

4、提取所述语音信号的语音情感表征；

5、提取所述第一文本内容的文本情感表征；

6、将所述语音情感表征与所述文本情感表征进行融合，得到情感信息；

<p>7、根据所述第一文本内容，确定与所述第一文本内容对话的第二文本内容；

8、根据所述情感信息与所述第二文本内容，输出对话语音。

9、第二方面，本申请还提供一种交互式对话装置，包括：

10、采集识别模块，用于采集用户输入的语音信号，并对所述语音信号进行识别，得到所述语音信号对应的第一文本内容；

11、第一提取模块，用于提取所述语音信号的语音情感表征；

12、第二提取模块，用于提取所述第一文本内容的文本情感表征；

13、融合模块，用于将所述语音情感表征与所述文本情感表征进行融合，得到情感信息；

14、文本确定模块，用于根据所述第一文本内容，确定与所述第一文本内容对话的第二文本内容；

15、语音输出模块，用于根据所述情感信息与所述第二文本内容，输出对话语音。

16、第三方面，本申请还提供一种计算机设备，所述计算机设备包括存储器和处理器；

17、所述存储器，用于存储计算机程序；

18、所述处理器，用于执行所述计算机程序并在执行所述计算机程序时实现如上述的交互式对话方法。

19、第四方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现如上述的交互式对话方法的步骤。

20、本申请提供一种交互式对话方法、装置、设备及存储介质，其中，方法包括：采集用户输入的语音信号，并对所述语音信号进行识别，得到所述语音信号对应的第一文本内容；提取所述语音信号的语音情感表征；提取所述第一文本内容的文本情感表征；将所述语音情感表征与所述文本情感表征进行融合，得到情感信息；根据所述第一文本内容，确定与所述第一文本内容对话的第二文本内容；根据所述情感信息与所述第二文本内容，输出对话语音。本申请先采集用户输入的语音信号并对语音信号识别得到第一文本内容，再提取语音信号的语音情感表征和第一文本内容的文本情感表征，然后将语音情感表征和文本情感表征进行融合，可以充分地了解用户的真实情感状态，以得到能够与用户的情感状态或者说话风格相匹配的情感信息。根据第一文本内容，确定与第一文本内容对话的第二文本内容，使得第二文本内容能够针对性地回复第一文本内容，提高对话的智能性。最后，根据情感信息和第二文本内容，输出与用户的情感状态或者说话风格相匹配的对话语音，从而可以提高交互性对话的真实性。

本文档来自技高网...

【技术保护点】

1.一种交互式对话方法，其特征在于，包括：

2.根据权利要求1所述的交互式对话方法，其特征在于，所述提取所述语音信号的语音情感表征，包括：

3.根据权利要求2所述的交互式对话方法，其特征在于，所述通过预设的第一特征提取器，提取所述语音信号的第一特征向量，包括：

4.根据权利要求1所述的交互式对话方法，其特征在于，所述提取所述第一文本内容的文本情感表征，包括：

5.根据权利要求4所述的交互式对话方法，其特征在于，所述方法还包括：

6.根据权利要求4所述的交互式对话方法，其特征在于，所述第二情感分类模型包括Bert模型和线性层；所述第二情感分类模型对所述第二特征向量进行情感分类时，所述Bert模型提取所述第二特征向量的隐特征，所述线性层对所述隐特征进行分类，得到文本情感表征。

7.根据权利要求1所述的交互式对话方法，其特征在于，所述将所述语音情感表征与所述文本情感表征进行融合，得到情感信息，包括：

8.一种交互式对话装置，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器；

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1至7中任意一项所述的交互式对话方法的步骤。

...

【技术特征摘要】

1.一种交互式对话方法，其特征在于，包括：

2.根据权利要求1所述的交互式对话方法，其特征在于，所述提取所述语音信号的语音情感表征，包括：

3.根据权利要求2所述的交互式对话方法，其特征在于，所述通过预设的第一特征提取器，提取所述语音信号的第一特征向量，包括：

4.根据权利要求1所述的交互式对话方法，其特征在于，所述提取所述第一文本内容的文本情感表征，包括：

5.根据权利要求4所述的交互式对话方法，其特征在于，所述方法还包括：

6.根据权利要求4所述的交互式对话方法，其特征在于，所述第二情感分类模型包括bert模型和线性层；所述第二情...

【专利技术属性】
技术研发人员：石岩，陈闽川，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人