语音应答方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:34490868 阅读:25 留言:0更新日期:2022-08-10 09:09
本发明专利技术为人工智能技术的语音合成技术领域,本发明专利技术提供了一种语音应答方法、装置、计算机设备及计算机可读存储介质,其中,所述方法包括:在与用户语音交互时,接收用户的语音数据,将语音数据输入预先训练好的语音提取模型中,确定语音数据的语音特征,将语音数据转换成语音文本,将语音文本输入预先训练好的意图识别模型中,确定语音文本的用户意图,根据用户意图确定答复文本,根据答复文本及语音特征合成应答语音,将应答语音发送给用户。本发明专利技术结合用户的语音特征合成相应的应答语音,实现针对不同用户的语音数据做出不同的语音答复,提升语音问答的灵活性,进而提高用户体验。进而提高用户体验。进而提高用户体验。

【技术实现步骤摘要】
语音应答方法、装置、计算机设备及计算机可读存储介质


[0001]本专利技术涉及人工智能技术的语音合成
,具体而言,本专利技术涉及一种语音应答方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能的发展,机器人发挥着越来越重要的作用,如当前很多公司通过机器客服,采用预设的语音问答方法与客户进行语音问答,大大的提高了服务效率。
[0003]但现有的客服机器人都是采用统一的语音问答方式,针对不同客户提的相同问题采用同种应答方式,导致应答过于机械化,因此,语音问答的灵活性较差,影响用户使用体验。

技术实现思路

[0004]本专利技术的主要目的为提供一种语音应答方法、装置、计算机设备及计算机可读存储介质,以提升语音问答的灵活性,提高用户体验。
[0005]为了实现上述专利技术目的,本专利技术提供一种语音应答方法,其包括:
[0006]在与用户语音交互时,接收用户的语音数据;
[0007]将所述语音数据输入预先训练好的语音提取模型中,确定所述语音数据的语音特征;
[0008]将所述语音数据转换成语音文本,将所述语音文本输入预先训练好的意图识别模型中,确定所述语音文本的用户意图;
[0009]根据所述用户意图确定答复文本,根据所述答复文本及所述语音特征合成应答语音;
[0010]将所述应答语音发送给所述用户。
[0011]优选地,所述语音特征包括声纹特征,所述根据所述答复文本及所述语音特征合成应答语音,包括:
[0012]将所述答复文本与声纹特征进行特征融合,得到融合特征;
[0013]利用声码器对所述融合特征进行音频合成,得到应答语音。
[0014]优选地,所述语音特征包括语调特征,所述根据所述答复文本及所述语音特征合成应答语音,包括:
[0015]从数据库中查询与所述语调特征相对应的目标语调特征;
[0016]将所述答复文本转换为对应的文本向量;
[0017]确定所述目标语调特征对应的向量,得到语调特征向量;
[0018]将所述文本向量与所述语调特征向量拼接后输入声学模型,得到对应的声学特征;
[0019]将所述声学特征转换为可播放的应答语音。
[0020]在一实施例中,所述将所述语音数据转换成语音文本,包括:
[0021]对所述语音数据进行预处理,得到语音信息;
[0022]提取所述语音信息中的内容,得到语音内容;
[0023]利用维特比算法对所述语音内容进行解码处理,得到语音最优路径;
[0024]根据所述语音最优路径确定所述语音文本。
[0025]优选地,所述将所述语音文本输入预先训练好的意图识别模型中,确定所述语音文本的用户意图,包括:
[0026]将所述语音文本输入预先训练好的意图识别模型中,调用所述意图识别模型对所述语音文本进行分句处理,得到多个语句;
[0027]从预先构建的向量表中查询每个语句对应的语句向量,计算多个语句对应的语句向量的平均值,得到平均语句向量;
[0028]从预先构建的标准语句库中获取多个标准语句向量;
[0029]计算每个所述标准语句向量与所述平均语句向量的相似度;
[0030]将所述相似度最高的标准语句向量确定为目标语句向量,并将与所述目标语句向量对应的意图确定为所述语音文本的用户意图。
[0031]进一步地,所述将所述语音数据输入预先训练好的意图识别模型中,确定所述语音文本的用户意图之前,还包括:
[0032]获取训练数据;其中,所述训练数据包括多个语音文本样本及每个语音文本样本对应的目标意图识别结果;
[0033]将所述训练数据输入预先构建的神经网络模型进行训练,得到训练好的意图识别模型。
[0034]优选地,所述将所述训练数据输入预先构建的神经网络模型进行训练,得到训练好的意图识别模型,包括:
[0035]将所述训练数据输入预先构建的神经网络模型进行训练,利用预设的损失函数计算训练后的所述神经网络模型的损失值;
[0036]判断所述损失值是否低于预设损失值;
[0037]若是,则判定所述神经网络模型的训练结果满足要求,将训练结果满足要求的神经网络模型作为所述训练好的意图识别模型。
[0038]本专利技术还提供一种语音应答装置,其包括:
[0039]接收模块,用于在与用户语音交互时,接收用户的语音数据;
[0040]输入模块,用于将所述语音数据输入预先训练好的语音提取模型中,确定所述语音数据的语音特征;
[0041]确定模块,用于将所述语音数据转换成语音文本,将所述语音文本输入预先训练好的意图识别模型中,确定所述语音文本的用户意图;
[0042]合成模块,用于根据所述用户意图确定答复文本,根据所述答复文本及所述语音特征合成应答语音;
[0043]发送模块,用于将所述应答语音发送给所述用户。
[0044]本专利技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
[0045]本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算
机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
[0046]本专利技术所提供的一种语音应答方法、装置、计算机设备及计算机可读存储介质,在与用户语音交互时,接收用户的语音数据,将语音数据输入预先训练好的语音提取模型中,确定语音数据的语音特征,将语音数据转换成语音文本,将语音文本输入预先训练好的意图识别模型中,确定语音文本的用户意图,根据用户意图确定答复文本,根据答复文本及语音特征合成应答语音,将应答语音发送给用户,由于不同用户的语音特征会具有差异,因此,本专利技术结合用户的语音特征合成相应的应答语音,实现针对不同用户的语音数据做出不同的语音答复,提升语音问答的灵活性,进而提高用户体验。
附图说明
[0047]图1为本专利技术一实施例的语音应答方法的流程示意图;
[0048]图2为本专利技术又一实施例的语音应答方法的流程示意图;
[0049]图3为本专利技术又一实施例的语音应答方法的流程示意图;
[0050]图4为本专利技术另一实施例的语音应答方法的流程示意图;
[0051]图5为本专利技术又一实施例的语音应答方法的流程示意图;
[0052]图6为本专利技术另一实施例的语音应答方法的流程示意图;
[0053]图7为本专利技术又一实施例的语音应答方法的流程示意图;
[0054]图8为本专利技术一实施例的语音应答装置的结构示意框图;
[0055]图9为本专利技术一实施例的计算机设备的结构示意框图。
[0056]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0057]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音应答方法,其特征在于,所述方法包括:在与用户语音交互时,接收用户的语音数据;将所述语音数据输入预先训练好的语音提取模型中,确定所述语音数据的语音特征;将所述语音数据转换成语音文本,将所述语音文本输入预先训练好的意图识别模型中,确定所述语音文本的用户意图;根据所述用户意图确定答复文本,根据所述答复文本及所述语音特征合成应答语音;将所述应答语音发送给所述用户。2.根据权利要求1所述的方法,其特征在于,所述语音特征包括声纹特征,所述根据所述答复文本及所述语音特征合成应答语音,包括:将所述答复文本与声纹特征进行特征融合,得到融合特征;利用声码器对所述融合特征进行音频合成,得到应答语音。3.根据权利要求1所述的方法,其特征在于,所述语音特征包括语调特征,所述根据所述答复文本及所述语音特征合成应答语音,包括:从数据库中查询与所述语调特征相对应的目标语调特征;将所述答复文本转换为对应的文本向量;确定所述目标语调特征对应的向量,得到语调特征向量;将所述文本向量与所述语调特征向量拼接后输入声学模型,得到对应的声学特征;将所述声学特征转换为可播放的应答语音。4.根据权利要求1所述的方法,其特征在于,所述将所述语音数据转换成语音文本,包括:对所述语音数据进行预处理,得到语音信息;提取所述语音信息中的内容,得到语音内容;利用维特比算法对所述语音内容进行解码处理,得到语音最优路径;根据所述语音最优路径确定所述语音文本。5.根据权利要求1所述的方法,其特征在于,所述将所述语音文本输入预先训练好的意图识别模型中,确定所述语音文本的用户意图,包括:将所述语音文本输入预先训练好的意图识别模型中,调用所述意图识别模型对所述语音文本进行分句处理,得到多个语句;从预先构建的向量表中查询每个语句对应的语句向量,计算多个语句对应的语句向量的平均值,得到平均语句向量;从预先构建的标准语句库中获取多个标准语句向量;计算每个所述标准语句向量...

【专利技术属性】
技术研发人员:潘逸伦
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1