直播机器人唤醒方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23988020 阅读：36 留言：0更新日期：2020-04-29 14:32

本公开关于一种直播机器人唤醒方法、装置、电子设备及存储介质，所述方法包括：获取通过麦克风采集的第一音频信号，所述第一音频信号中包括通过扬声器播放的第二音频信号扩散后产生的回声信号；根据所述第一音频信号和所述第二音频信号确定对所述直播机器人的识别阈值；以所述第二音频信号为参考信号，对所述第一音频信号进行回声消除处理，得到消除回声信号后的目标音频信号；根据所述识别阈值和所述目标音频信号对所述直播机器人进行唤醒。本公开根据第一音频信号和第二音频信号确定对直播机器人的识别阈值，并根据目标音频信号和识别阈值对直播机器人进行唤醒，对直播机器人不使用固定的识别阈值，可以提高直播机器人的唤醒准确率和识别率。

Wake up method, device, electronic equipment and storage medium of live robot

全部详细技术资料下载

【技术实现步骤摘要】
直播机器人唤醒方法、装置、电子设备及存储介质
本公开涉及终端
，尤其涉及一种直播机器人唤醒方法、装置、电子设备及存储介质。
技术介绍
直播是可以同一时间透过网络系统在不同的交流平台观看影片，是一种新兴的网络社交方式，网络直播平台也成为了一种崭新的社交媒体。在直播进行中直播机器人可以提供语音助手功能以帮助主播方便的使用直播系统，例如播放音乐、讲故事、讲笑话和机器人聊天等功能，主播只需要通过麦克风说出唤醒词即可唤醒直播机器人，避免了直播过程中操作手机，提高直播效率和改善用户体验。然而，在直播进行中播放音乐或者用户连麦(通话)的过程中，经常会出现扬声器播放的声音经过多种路径传播后被麦克风拾取，并传回到系统形成回声现象。如果不对回声进行处理，将会影响通话质量和用户体验，严重时还会形成震荡，产生啸叫。为了避免回声带来的不利影响，通常采用AEC(AcousticEchoCancellation，回声消除)将扬声器播放出来的声音从麦克风采集的声音中消除，使得麦克风采集的声音只有用户说话的声音。目前语音助手大多出现在智能音箱产品中，由于大多数智能音箱产品使用定制的硬件方案，所以AEC的效果比较理想，回声残留较少，语音损伤也较少，但在手机上很难做这一点，这是因为与其他语音助手类产品相比，手机的种类比较多，声学结构千差万别，直播中又有播放音乐/与用户连麦(通话)核多人语音聊天等各种使用场景，因此麦克风采集的声音中包含有扬声器播放的声音存在的情况，由于扬声器播放的声音可能包括唤醒词，如果AEC的NLP(Non-lin...

【技术保护点】
1.一种直播机器人唤醒方法，其特征在于，所述方法包括：/n获取通过麦克风采集的第一音频信号，所述第一音频信号中包括通过扬声器播放的第二音频信号扩散后产生的回声信号；/n根据所述第一音频信号和所述第二音频信号确定对所述直播机器人的识别阈值；/n以所述第二音频信号为参考信号，对所述第一音频信号进行回声消除处理，得到消除回声信号后的目标音频信号；/n根据所述识别阈值和所述目标音频信号对所述直播机器人进行唤醒。/n

【技术特征摘要】
1.一种直播机器人唤醒方法，其特征在于，所述方法包括：
获取通过麦克风采集的第一音频信号，所述第一音频信号中包括通过扬声器播放的第二音频信号扩散后产生的回声信号；
根据所述第一音频信号和所述第二音频信号确定对所述直播机器人的识别阈值；
以所述第二音频信号为参考信号，对所述第一音频信号进行回声消除处理，得到消除回声信号后的目标音频信号；
根据所述识别阈值和所述目标音频信号对所述直播机器人进行唤醒。

2.根据权利要求1所述直播机器人唤醒方法，其特征在于，所述根据所述第一音频信号和所述第二音频信号确定对所述直播机器人的识别阈值包括：
计算所述第一音频信号和所述第二音频信号之间的相似度；
根据所述相似度确定对所述直播机器人的识别阈值。

3.根据权利要求1所述直播机器人唤醒方法，其特征在于，所述根据所述第一音频信号和所述第二音频信号确定对所述直播机器人的识别阈值包括：
根据所述第一音频信号计算第一音频能量，以及，根据所述第二音频信号计算第二音频能量；
根据所述第一音频能量和所述第二音频能量确定对所述直播机器人的识别阈值。

4.根据权利要求3所述直播机器人唤醒方法，其特征在于，所述根据所述第一音频能量和所述第二音频能量确定对所述直播机器人的识别阈值包括：
当所述第一音频能量没有落入预设能量区间，且所述第二音频信号能量落入预设能量区间时，确定识别阈值为预设识别阈值；
当所述第一音频能量和所述第二音频信号能量均没有落入所述预设能量区间时，计算所述第一音频信号和所述第二音频信号之间的相似度，并根据所述相似度确定对所述直播机器人的识别阈值；
当所述第一音频能量和所述第二音频信号能量均落入预设能量区间时，不对所述直播机器人进行唤醒。

5.根据权利要求2或4所述直播机器人唤醒方法，其特征在于，所述计算所述第一音频信号和所述第二音频信号之间的相似度包括：
将所述第一音频信号和所述第二音频信号输入互相关函数...

【专利技术属性】
技术研发人员：陈翔宇，张晨，邢文浩，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人