音频播放控制方法、装置及电子设备制造方法及图纸

技术编号:36247344 阅读:21 留言:0更新日期:2023-01-07 09:39
本发明专利技术提供一种音频播放控制方法、装置及电子设备,涉及语音处理技术领域。该音频播放控制方法包括:获取采样信号并将采样信号输入语音唤醒模型,得到语音唤醒模型输出的采样信号中包含唤醒词的置信度,语音唤醒模型用于进行唤醒词检测;在置信度大于预设置信度的情况下,从采样信号中截取包含唤醒词的信号段,并将包含唤醒词的信号段输入类型识别模型,得到类型识别模型输出的唤醒词的类别,类型识别模型用于进行唤醒词类型的识别;在类别为通话开头语唤醒词且检测到电子设备处于播放音频的状态的情况下,调整电子设备当前的音频播放状态。本发明专利技术的技术方案可以实现用户接通可通话设备时电子设备音频播放状态的自动调整。设备时电子设备音频播放状态的自动调整。设备时电子设备音频播放状态的自动调整。

【技术实现步骤摘要】
音频播放控制方法、装置及电子设备


[0001]本专利技术涉及语音处理
,尤其涉及一种音频播放控制方法、装置及电子设备。

技术介绍

[0002]随着人工智能技术的发展,具有音频播放功能的电子设备逐渐智能化,出现了诸如智能机器人、智能电视、智能音箱等可以进行语音交互的电子设备。这类电子设备在使用过程中,用户可能会接听手机、电话手表等其他可通话设备的来电或拨打电话,这时可能需要调节电子设备的音频播放状态以满足通话环境的需求,目前主要由用户手动调节电子设备的音频播放状态,操作比较麻烦。

技术实现思路

[0003]本专利技术提供一种音频播放控制方法、装置及电子设备,用以解决现有技术中用户接听可通话设备后需要手动调节电子设备的音频播放状态的缺陷,实现用户接通可通话设备时电子设备音频播放状态的自动调整。
[0004]本专利技术提供一种音频播放控制方法,包括:
[0005]获取采样信号,并将所述采样信号输入语音唤醒模型,得到所述语音唤醒模型输出的所述采样信号中包含唤醒词的置信度,所述语音唤醒模型用于进行唤醒词检测;
[0006]在所述置信度大于预设置信度的情况下,从所述采样信号中截取包含唤醒词的信号段,并将所述包含唤醒词的信号段输入类型识别模型,得到所述类型识别模型输出的所述唤醒词的类别,所述类型识别模型用于进行唤醒词类型的识别;
[0007]在所述类别为通话开头语唤醒词、且检测到电子设备处于播放音频的状态的情况下,调整所述电子设备当前的音频播放状态。
[0008]根据本专利技术提供的一种音频播放控制方法,所述调整所述电子设备当前的音频播放状态包括:
[0009]获取目标音频调整方式;
[0010]基于所述目标音频调整方式调整所述电子设备当前的音频播放状态。
[0011]根据本专利技术提供的一种音频播放控制方法,所述获取目标音频调整方式包括:
[0012]获取当前时间信息;
[0013]基于所述当前时间信息从音频调整方式信息库中匹配音频调整方式,得到所述目标音频调整方式;
[0014]其中,所述音频调整方式信息库中保存时间信息和音频调整方式的对应关系,所述对应关系是基于音频调整方式配置界面中的配置操作确定的。
[0015]根据本专利技术提供的一种音频播放控制方法,所述在所述置信度大于预设置信度的情况下,从所述采样信号中截取包含唤醒词的信号段,包括:
[0016]在确定出所述置信度大于预设置信度的情况下,将所述采样信号中的当前检测位
置确定为唤醒词尾端点位置;
[0017]基于所述唤醒词尾端点位置,从所述采样信号中截取包含唤醒词的信号段。
[0018]根据本专利技术提供的一种音频播放控制方法,所述基于所述唤醒词尾端点位置,从所述采样信号中截取包含唤醒词的信号段,包括:
[0019]从所述采样信号中,截取所述唤醒词尾端点位置前预设时间段的信号段,得到包含唤醒词的信号段;或者,
[0020]从所述采样信号中,截取所述唤醒词尾端点位置前预设音频帧数的信号段,得到包含唤醒词的信号段。
[0021]根据本专利技术提供的一种音频播放控制方法,在所述调整所述电子设备当前的音频播放状态之后,所述方法还包括:
[0022]在所述类别为通话结束语唤醒词的情况下,恢复所述电子设备的音频播放状态为调整前的音频播放状态。
[0023]根据本专利技术提供的一种音频播放控制方法,所述语音唤醒模型基于以下步骤训练得到:
[0024]获取样本唤醒词和非样本唤醒词,所述样本唤醒词包括样本设备唤醒词、样本通话开头语唤醒词和样本通话结束语唤醒词;
[0025]基于所述样本唤醒词、所述非样本唤醒词和各自对应的标签信息对初始语音唤醒模型进行训练,得到所述语音唤醒模型。
[0026]根据本专利技术提供的一种音频播放控制方法,所述类型识别模型基于以下步骤训练得到:
[0027]获取样本唤醒词,所述样本唤醒词包括样本设备唤醒词、样本通话开头语唤醒词和样本通话结束语唤醒词;
[0028]基于所述样本设备唤醒词、所述样本通话开头语唤醒词、所述样本通话结束语唤醒词和各自对应的标签信息对初始类型识别模型进行训练,得到所述类型识别模型。
[0029]本专利技术还提供一种音频播放控制装置,包括:
[0030]获取模块,用于获取采样信号,并将所述采样信号输入语音唤醒模型,得到所述语音唤醒模型输出的所述采样信号中包含唤醒词的置信度,所述语音唤醒模型用于进行唤醒词检测;
[0031]截取模块,用于在所述置信度大于预设置信度的情况下,从所述采样信号中截取包含唤醒词的信号段,并将所述包含唤醒词的信号段输入类型识别模型,得到所述类型识别模型输出的所述唤醒词的类别,所述类型识别模型用于进行唤醒词类型的识别;
[0032]调整模块,用于在所述类别为通话开头语唤醒词、且检测到电子设备处于播放音频的状态的情况下,调整所述电子设备当前的音频播放状态。
[0033]本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述音频播放控制方法。
[0034]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述音频播放控制方法。
[0035]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器
执行时实现如上述任一项所述音频播放控制方法。
[0036]本专利技术提供的音频播放控制方法、装置及电子设备,通过语音唤醒模型对采样信号进行唤醒词检测,获得采样信号中包含唤醒词的置信度,在该置信度大于预设置信度的情况下,可以判定采样信号中包含有唤醒词,这时从采样信号中截取包含唤醒词的信号段,并将该包含唤醒词的信号段输入类型识别模型,通过类型识别模型对该包含唤醒词的信号段进行唤醒词类型的识别,获得唤醒词的类别,在该类别为通话开头语唤醒词且检测到电子设备处于播放音频的状态的情况下,调整电子设备当前的音频播放状态。这样,可以在用户接听可通话设备后,根据用户通话时的通话开头语唤醒词唤醒电子设备,使电子设备进行音频播放状态的调整,实现了用户接通可通话设备时电子设备音频播放状态的自动调整。
附图说明
[0037]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1是本专利技术提供的音频播放控制方法的流程示意图;
[0039]图2是本专利技术提供的从采样信号中截取包含唤醒词的信号段的方法的流程示意图;
[0040]图3是本专利技术提供的调整电子设备当前的音频播放状态的方法的流程示意图;
[0041]图4是本专利技术提供的音频本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频播放控制方法,其特征在于,包括:获取采样信号,并将所述采样信号输入语音唤醒模型,得到所述语音唤醒模型输出的所述采样信号中包含唤醒词的置信度,所述语音唤醒模型用于进行唤醒词检测;在所述置信度大于预设置信度的情况下,从所述采样信号中截取包含唤醒词的信号段,并将所述包含唤醒词的信号段输入类型识别模型,得到所述类型识别模型输出的所述唤醒词的类别,所述类型识别模型用于进行唤醒词类型的识别;在所述类别为通话开头语唤醒词、且检测到电子设备处于播放音频的状态的情况下,调整所述电子设备当前的音频播放状态。2.根据权利要求1所述的音频播放控制方法,其特征在于,所述调整所述电子设备当前的音频播放状态包括:获取目标音频调整方式;基于所述目标音频调整方式调整所述电子设备当前的音频播放状态。3.根据权利要求2所述的音频播放控制方法,其特征在于,所述获取目标音频调整方式包括:获取当前时间信息;基于所述当前时间信息从音频调整方式信息库中匹配音频调整方式,得到所述目标音频调整方式;其中,所述音频调整方式信息库中保存时间信息和音频调整方式的对应关系,所述对应关系是基于音频调整方式配置界面中的配置操作确定的。4.根据权利要求1所述的音频播放控制方法,其特征在于,所述在所述置信度大于预设置信度的情况下,从所述采样信号中截取包含唤醒词的信号段,包括:在确定出所述置信度大于预设置信度的情况下,将所述采样信号中的当前检测位置确定为唤醒词尾端点位置;基于所述唤醒词尾端点位置,从所述采样信号中截取包含唤醒词的信号段。5.根据权利要求4所述的音频播放控制方法,其特征在于,所述基于所述唤醒词尾端点位置,从所述采样信号中截取包含唤醒词的信号段,包括:从所述采样信号中,截取所述唤醒词尾端点位置前预设时间段的信号段,得到包含唤醒词的信号段;或者,从所述采样信号中,截取所述唤醒词尾端点位置前预设音频帧数的信号段,得到包含唤醒词的信号段。6.根据权利要求1所述的音频播放控制方法,其特征在于,在所述调整所...

【专利技术属性】
技术研发人员:吴俊李良斌
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1