语音应答方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号：34490868 阅读：25 留言：0更新日期：2022-08-10 09:09

本发明专利技术为人工智能技术的语音合成技术领域，本发明专利技术提供了一种语音应答方法、装置、计算机设备及计算机可读存储介质，其中，所述方法包括：在与用户语音交互时，接收用户的语音数据，将语音数据输入预先训练好的语音提取模型中，确定语音数据的语音特征，将语音数据转换成语音文本，将语音文本输入预先训练好的意图识别模型中，确定语音文本的用户意图，根据用户意图确定答复文本，根据答复文本及语音特征合成应答语音，将应答语音发送给用户。本发明专利技术结合用户的语音特征合成相应的应答语音，实现针对不同用户的语音数据做出不同的语音答复，提升语音问答的灵活性，进而提高用户体验。进而提高用户体验。进而提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音应答方法、装置、计算机设备及计算机可读存储介质

[0001]本专利技术涉及人工智能技术的语音合成
，具体而言，本专利技术涉及一种语音应答方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能的发展，机器人发挥着越来越重要的作用，如当前很多公司通过机器客服，采用预设的语音问答方法与客户进行语音问答，大大的提高了服务效率。
[0003]但现有的客服机器人都是采用统一的语音问答方式，针对不同客户提的相同问题采用同种应答方式，导致应答过于机械化，因此，语音问答的灵活性较差，影响用户使用体验。

技术实现思路

[0004]本专利技术的主要目的为提供一种语音应答方法、装置、计算机设备及计算机可读存储介质，以提升语音问答的灵活性，提高用户体验。
[0005]为了实现上述专利技术目的，本专利技术提供一种语音应答方法，其包括：
[0006]在与用户语音交互时，接收用户的语音数据；
[0007]将所述语音数据输入预先训练好的语音提取模型中，确定所述语音数据的语音特征；
[0008]将所述语音数据转换成语音文本，将所述语音文本输入预先训练好的意图识别模型中，确定所述语音文本的用户意图；
[0009]根据所述用户意图确定答复文本，根据所述答复文本及所述语音特征合成应答语音；
[0010]将所述应答语音发送给所述用户。
[0011]优选地，所述语音特征包括声纹特征，所述根据所述答复文本及所述语音特征合成应答语音，包括：
[...

【技术保护点】

【技术特征摘要】
1.一种语音应答方法，其特征在于，所述方法包括：在与用户语音交互时，接收用户的语音数据；将所述语音数据输入预先训练好的语音提取模型中，确定所述语音数据的语音特征；将所述语音数据转换成语音文本，将所述语音文本输入预先训练好的意图识别模型中，确定所述语音文本的用户意图；根据所述用户意图确定答复文本，根据所述答复文本及所述语音特征合成应答语音；将所述应答语音发送给所述用户。2.根据权利要求1所述的方法，其特征在于，所述语音特征包括声纹特征，所述根据所述答复文本及所述语音特征合成应答语音，包括：将所述答复文本与声纹特征进行特征融合，得到融合特征；利用声码器对所述融合特征进行音频合成，得到应答语音。3.根据权利要求1所述的方法，其特征在于，所述语音特征包括语调特征，所述根据所述答复文本及所述语音特征合成应答语音，包括：从数据库中查询与所述语调特征相对应的目标语调特征；将所述答复文本转换为对应的文本向量；确定所述目标语调特征对应的向量，得到语调特征向量；将所述文本向量与所述语调特征向量拼接后输入声学模型，得到对应的声学特征；将所述声学特征转换为可播放的应答语音。4.根据权利要求1所述的方法，其特征在于，所述将所述语音数据转换成语音文本，包括：对所述语音数据进行预处理，得到语音信息；提取所述语音信息中的内容，得到语音内容；利用维特比算法对所述语音内容进行解码处理，得到语音最优路径；根据所述语音最优路径确定所述语音文本。5.根据权利要求1所述的方法，其特征在于，所述将所述语音文本输入预先训练好的意图识别模型中，确定所述语音文本的用户意图，包括：将所述语音文本输入预先训练好的意图识别模型中，调用所述意图识别模型对所述语音文本进行分句处理，得到多个语句；从预先构建的向量表中查询每个语句对应的语句向量，计算多个语句对应的语句向量的平均值，得到平均语句向量；从预先构建的标准语句库中获取多个标准语句向量；计算每个所述标准语句向量...

【专利技术属性】
技术研发人员：潘逸伦，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人