音频播放控制方法、装置及电子设备制造方法及图纸

技术编号：36247344 阅读：21 留言：0更新日期：2023-01-07 09:39

本发明专利技术提供一种音频播放控制方法、装置及电子设备，涉及语音处理技术领域。该音频播放控制方法包括：获取采样信号并将采样信号输入语音唤醒模型，得到语音唤醒模型输出的采样信号中包含唤醒词的置信度，语音唤醒模型用于进行唤醒词检测；在置信度大于预设置信度的情况下，从采样信号中截取包含唤醒词的信号段，并将包含唤醒词的信号段输入类型识别模型，得到类型识别模型输出的唤醒词的类别，类型识别模型用于进行唤醒词类型的识别；在类别为通话开头语唤醒词且检测到电子设备处于播放音频的状态的情况下，调整电子设备当前的音频播放状态。本发明专利技术的技术方案可以实现用户接通可通话设备时电子设备音频播放状态的自动调整。设备时电子设备音频播放状态的自动调整。设备时电子设备音频播放状态的自动调整。

全部详细技术资料下载

【技术实现步骤摘要】
音频播放控制方法、装置及电子设备

[0001]本专利技术涉及语音处理
，尤其涉及一种音频播放控制方法、装置及电子设备。

技术介绍

[0002]随着人工智能技术的发展，具有音频播放功能的电子设备逐渐智能化，出现了诸如智能机器人、智能电视、智能音箱等可以进行语音交互的电子设备。这类电子设备在使用过程中，用户可能会接听手机、电话手表等其他可通话设备的来电或拨打电话，这时可能需要调节电子设备的音频播放状态以满足通话环境的需求，目前主要由用户手动调节电子设备的音频播放状态，操作比较麻烦。

技术实现思路

[0003]本专利技术提供一种音频播放控制方法、装置及电子设备，用以解决现有技术中用户接听可通话设备后需要手动调节电子设备的音频播放状态的缺陷，实现用户接通可通话设备时电子设备音频播放状态的自动调整。
[0004]本专利技术提供一种音频播放控制方法，包括：
[0005]获取采样信号，并将所述采样信号输入语音唤醒模型，得到所述语音唤醒模型输出的所述采样信号中包含唤醒词的置信度，所述语音唤醒模型用于进行唤醒词检测；
[0006]在所述置信度大于预设置信度的情况下，从所述采样信号中截取包含唤醒词的信号段，并将所述包含唤醒词的信号段输入类型识别模型，得到所述类型识别模型输出的所述唤醒词的类别，所述类型识别模型用于进行唤醒词类型的识别；
[0007]在所述类别为通话开头语唤醒词、且检测到电子设备处于播放音频的状态的情况下，调整所述电子设备当前的音频播放状态。
[0008]根据本...

【技术保护点】

【技术特征摘要】
1.一种音频播放控制方法，其特征在于，包括：获取采样信号，并将所述采样信号输入语音唤醒模型，得到所述语音唤醒模型输出的所述采样信号中包含唤醒词的置信度，所述语音唤醒模型用于进行唤醒词检测；在所述置信度大于预设置信度的情况下，从所述采样信号中截取包含唤醒词的信号段，并将所述包含唤醒词的信号段输入类型识别模型，得到所述类型识别模型输出的所述唤醒词的类别，所述类型识别模型用于进行唤醒词类型的识别；在所述类别为通话开头语唤醒词、且检测到电子设备处于播放音频的状态的情况下，调整所述电子设备当前的音频播放状态。2.根据权利要求1所述的音频播放控制方法，其特征在于，所述调整所述电子设备当前的音频播放状态包括：获取目标音频调整方式；基于所述目标音频调整方式调整所述电子设备当前的音频播放状态。3.根据权利要求2所述的音频播放控制方法，其特征在于，所述获取目标音频调整方式包括：获取当前时间信息；基于所述当前时间信息从音频调整方式信息库中匹配音频调整方式，得到所述目标音频调整方式；其中，所述音频调整方式信息库中保存时间信息和音频调整方式的对应关系，所述对应关系是基于音频调整方式配置界面中的配置操作确定的。4.根据权利要求1所述的音频播放控制方法，其特征在于，所述在所述置信度大于预设置信度的情况下，从所述采样信号中截取包含唤醒词的信号段，包括：在确定出所述置信度大于预设置信度的情况下，将所述采样信号中的当前检测位置确定为唤醒词尾端点位置；基于所述唤醒词尾端点位置，从所述采样信号中截取包含唤醒词的信号段。5.根据权利要求4所述的音频播放控制方法，其特征在于，所述基于所述唤醒词尾端点位置，从所述采样信号中截取包含唤醒词的信号段，包括：从所述采样信号中，截取所述唤醒词尾端点位置前预设时间段的信号段，得到包含唤醒词的信号段；或者，从所述采样信号中，截取所述唤醒词尾端点位置前预设音频帧数的信号段，得到包含唤醒词的信号段。6.根据权利要求1所述的音频播放控制方法，其特征在于，在所述调整所...

【专利技术属性】
技术研发人员：吴俊，李良斌，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人