一种基于预训练深度神经网络模型的语音回复方法技术

技术编号:38471113 阅读:24 留言:0更新日期:2023-08-11 14:47
本发明专利技术公开了一种基于预训练深度神经网络模型的语音回复方案,属于智能硬件技术领域,所述方法包括:针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对所述语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;基于各所述概率筛选出目标语言回复系统;采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。本申请提供的基于预训练深度神经网络模型的语音回复方案,可使得生成的回复语句更加准确、合理。合理。合理。

【技术实现步骤摘要】
一种基于预训练深度神经网络模型的语音回复方法


[0001]本专利技术涉及智能硬件
,尤其涉及一种基于预训练深度神经网络模型的语音回复方法和装置、电子设备。

技术介绍

[0002]由于语音的便捷性,智能语音交互已经成为连接人与智能设备的主要方式。人机对话技术旨在让机器通过与人类的对话交互,以更自然友好的方式帮助用户高效地完成任务,以及与用户进行情感沟通。智能设备能够“听懂”用户的语言,执行相应的指令或者进行合理的回复。
[0003]人机对话是智能语音交互的重要支撑技术,在对用户的输入进行语音识别和内容理解后,通过人机对话技术管理对话状态、生成合理回复,以实现连续语音智能交互。而如何在人机对话过程中针对用户输入输出精准地回复语句是本领域技术人员研究的重要课题。

技术实现思路

[0004]本专利技术实施例的目的是提供一种基于预训练深度神经网络模型的语音回复方法和装置、电子设备,能够解决现有人机对话方案中存在的回复语句不准确的问题。
[0005]为解决上述技术问题,本专利技术提供如下技术方案:
[0006]本专利技术实施例提供了一种基于预训练深度神经网络模型的语音回复方法,其中,该方法包括:
[0007]针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;
[0008]通过语言处理系统对所述语音输入进行分析得到语音处理结果;
[0009]采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;
[0010]基于各所述概率筛选出目标语言回复系统;
[0011]采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。
[0012]可选地,所述预设的各语言回复系统包括以下至少之二:
[0013]基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。
[0014]可选地,所述概率神经网络通过如下方式训练生成:
[0015]采用X个参数组成初始概率神经网络;
[0016]依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整,直至调整后的X个所述参数满足
预设条件停止参数调整操作;
[0017]采用调整后的X个所述参数组成所述概率神经网络。
[0018]可选地,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整的步骤,包括:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述X个参数中的Y个参数进行调整,其中,X大于Y。
[0019]可选地,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述X个参数中的Y个参数进行调整的步骤,包括:
[0020]对所述X个参数中的Y个参数进行随机调整,并确定调整后的Y个参数的参数变化趋势;
[0021]采用调整后的X个参数组成中间概率神经网络;
[0022]确定所述中间概率神经网络对应的第一总评价分;
[0023]确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;
[0024]基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势。
[0025]可选地,基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势的步骤,包括:
[0026]若所述分数变化趋势为分数上升,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势同向;
[0027]若所述分数变化趋势为分数下降,则确定下一次参数调整时的参数调整趋势与所述参数变化趋势反向。
[0028]可选地,所述预设条件包括:所述中间概率神经网络对应的总评价分相较于本次调整前的中间概率神经网络对应的总评价分的分数上升值小于预设阈值。
[0029]本专利技术实施例还提供了一种基于预训练深度神经网络模型的语音回复装置,其中,所述装置包括:
[0030]采集模块,用于针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;
[0031]第一调用模块,用于通过语言处理系统对所述语音输入进行分析得到语音处理结果;
[0032]第二调用模块,用于采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;
[0033]筛选模块,用于基于各所述概率筛选出目标语言回复系统;
[0034]第三调用模块,用于采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。
[0035]可选地,所述预设的各语言回复系统包括以下至少之二:
[0036]基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。
[0037]可选地,所述装置还包括训练模块,用于训练生成概率神经网络,所述装置包括:
[0038]初始网络构建子模块,用于采用X个参数组成初始概率神经网络;
[0039]调整子模块,用于依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整,直至调整后的X个所述参数满足预设条件停止参数调整操作;
[0040]目标网络生成子模块,用于采用调整后的X个所述参数组成所述概率神经网络。
[0041]可选地,所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对初始概率神经网络的组成参数进行调整时,具体用于:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述X个参数中的Y个参数进行调整,其中,X大于Y。
[0042]可选地,所述调整子模块依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述X个参数中的Y个参数进行调整时,具体用于:
[0043]对所述X个参数中的Y个参数进行随机调整,并确定调整后的Y个参数的参数变化趋势;
[0044]采用调整后的X个参数组成中间概率神经网络;
[0045]确定所述中间概率神经网络对应的第一总评价分;
[0046]确定所述第一总评价分相较于本次调整前的中间概率神经网络对应的第二总评价分的分数变化趋势;
[0047]基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势。
[0048]可选地,所述调整子模块基于所述参数变化趋势和所述分数变化趋势,确定下一次参数调整时的参数调整趋势时,具体用于:
[0049]若所述分数变化趋势为分数上升,则确定下一次参数调整时的参数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于预训练深度神经网络模型的语音回复方法,其特征在于,包括:针对一轮与用户语音对话中的每次语音交互,采集用户输入的语音信号并生成语音输入;通过语言处理系统对所述语音输入进行分析得到语音处理结果;采用预先训练的概率神经网络,确定所述语音处理结果命中预设的各语言回复系统的概率;基于各所述概率筛选出目标语言回复系统;采用所述目标语言回复系统生成所述语音处理结果对应的回复语句,并反馈至用户。2.根据权利要求1所述的方法,其特征在于,所述预设的各语言回复系统包括以下至少之二:基于匹配规则建立的第一语言回复系统、基于人工标注语料对预先构建的语言回复模型进行训练生成的第二语言回复系统以及基于深度学习网络建立的第三语言回复系统。3.根据权利要求1所述的方法,其特征在于,所述概率神经网络通过如下方式训练生成:采用X个参数组成初始概率神经网络;依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整,直至调整后的X个所述参数满足预设条件停止参数调整操作;采用调整后的X个所述参数组成所述概率神经网络。4.根据权利要求1所述的方法,其特征在于,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述初始概率神经网络的组成参数进行调整的步骤,包括:依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述X个参数中的Y个参数进行调整,其中,X大于Y。5.根据权利要求4所述的方法,其特征在于,依据参数变化趋势和调整后的参数组成的中间概率神经网络的总评价分数变化趋势,循环对所述X个参数中的Y个参数进行调整的步骤,包括:对所述X个参数中的Y个参数进行随机调整,并确定调整后的Y个参数的参数变化趋势;采用调整后的X个参数组成中间概率神经网络;确定所述中间概率神经网络对应的第一总评价分;确定所...

【专利技术属性】
技术研发人员:吴新开李永伟霍向
申请(专利权)人:北京洛必德科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1