语音应答方法、装置、设备及存储介质制造方法及图纸

技术编号：31087865 阅读：14 留言：0更新日期：2021-12-01 12:45

本申请涉及人工智能，提供一种语音应答方法、装置、设备及计算机可读存储介质，该方法包括：向客户端发送询问语音；获取所述客户端发送的答复语音，所述答复语音用于答复所述询问语音；基于训练好的意图识别模型，根据所述询问语音对应的第一文本信息和所述答复语音确定用户意图；根据所述用户意图确定应答语音；向所述客户端发送所述应答语音。本申请能够提高意图识别的效率和准确率。本申请还涉及区块链技术，训练好的意图识别模型能够存储于区块链中。链中。链中。

全部详细技术资料下载

【技术实现步骤摘要】
语音应答方法、装置、设备及存储介质

[0001]本申请涉及语音处理的
，尤其涉及一种语音应答方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能技术在学术界的快速发展以及在生活中的广泛使用，语音交互成为人与机器之间沟通交流的重要桥梁。服务端要与客户对话并完成特定任务，其中一个核心技术是用户意图的判定，即让服务端在接受到用户的语音后，能够通过语音判定用户的意图。
[0003]目前，通过语音判定客户的意图一般是基于语音意图识别方法完成的，现传统的意图识别方法通常分成语音识别、意图识别两个独立的阶段，在第一阶段通过语音识别技术(Automatic Speech Recognition，ASR)将语音转化成文本，第二阶段通过自然语言处理技术(Natural Language Processing，NLP) 从文本中抽取文本内的语义信息，识别出客户的意图。基于文本的意图识别的准确率严重依赖于语音识别技术的准确率。并且进行意图识别的时间较长，意图识别的过程较为复杂且计算量较大。

技术实现思路

[0004]本申请的主要目的在于提供一种语音应答方法、装置、设备及计算机可读存储介质，旨在提高用户意图识别的准确性和效率，以提供更符合用户意图的应答语音，提高用户的使用体验。
[0005]第一方面，本申请提供一种语音应答方法，所述语音应答方法包括以下步骤：
[0006]向客户端发送询问语音；
[0007]获取所述客户端发送的答复语音，所述答复...

【技术保护点】

【技术特征摘要】
1.一种语音应答方法，其特征在于，包括：向客户端发送询问语音；获取所述客户端发送的答复语音，所述答复语音用于答复所述询问语音；基于训练好的意图识别模型，根据所述询问语音对应的第一文本信息和所述答复语音确定用户意图；根据所述用户意图确定应答语音；向所述客户端发送所述应答语音。2.如权利要求1所述的语音应答方法，其特征在于，所述基于训练好的意图识别模型，根据所述第一文本信息和所述答复语音确定用户意图，包括：基于所述意图识别模型的文本特征提取网络，对所述第一文本信息进行特征提取，得到第一文本特征向量；基于所述意图识别模型的语音特征提取网络，对所述答复语音进行特征提取，得到答复语音特征向量；基于所述意图识别模型的特征融合网络，对所述第一文本特征向量和所述答复语音特征向量进行融合，得到融合特征向量；基于所述意图识别模型的意图分类网络，对所述融合特征向量进行卷积、激活以及分类处理，得到用户意图。3.如权利要求2所述的语音应答方法，其特征在于，所述基于所述意图识别模型的特征融合网络，对所述第一文本特征向量和所述答复语音特征向量进行融合，得到融合特征向量，包括：获取N个预设矩阵，N为大于或等于3的自然数；将所述第一文本特征向量与每一个所述预设矩阵进行向量相乘，得到N个文本向量；将所述答复语音特征向量与每一个所述预设矩阵进行向量相乘，得到N个语音向量；对所述N个文本向量和所述N个语音向量进行融合，得到融合特征向量。4.如权利要求3所述的语音应答方法，其特征在于，所述对所述N个文本向量和所述N个语音向量进行融合，得到融合特征向量，包括：根据第一文本向量和第二文本向量计算所述第一文本特征向量的相似度；根据第一语音向量和第二语音向量计算所述语音特征向量的相似度；根据所述第一文本特征向量的相似度和所述语音特征向量的相似度，确定所述第一文本特征向量的权重和所述语音特征向量的权重；对所述第一文本特征向量的权重、第三文本向量、所述语音特征向量的权重以及第三语音向量进行向量计算，得到融合特征向量；其中，所述第一文本向量、所述第二文本向量以及所述第三文本向量是从N个文本向量中确定的，所述第一语音向量，所述第二语音向量以及所述第三语音向量是从N个语音向量中确定的。5.如权利要求1
‑
4任一项所述的语音应答方法，其特...

【专利技术属性】
技术研发人员：吴绍锋，
申请(专利权)人：平安普惠企业管理有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人