音区调整方法及相关装置、设备、系统和介质制造方法及图纸

技术编号：34465534 阅读：36 留言：0更新日期：2022-08-10 08:38

本申请公开了一种音区调整方法及相关装置、设备、系统和介质，其中，音区调整方法包括：获取车载拾音设备基于预设拾音区域采集的第一音频；其中，第一音频包含由车内的语音交互人所发出的预设语音指令；基于第一音频对语音交互人进行音区判断，得到第一拾音区域，并获取车载拾音设备基于第一拾音区域采集的第二音频；基于第二音频进行频域分析，得到第二音频的频域分布；其中，频域分布包括：形成第二音频的各个声源的声音频率；响应于频域分布满足第一条件，调整车载拾音设备的设备参数，得到车载拾音设备的优化拾音区域。上述方案，能够自适应调整拾音区域。自适应调整拾音区域。自适应调整拾音区域。

全部详细技术资料下载

【技术实现步骤摘要】
音区调整方法及相关装置、设备、系统和介质

[0001]本申请涉及语音识别
，特别是涉及一种音区调整方法及相关装置、设备、系统和介质。

技术介绍

[0002]随着汽车技术的发展，越来越多的车辆选择配置车载控制系统，以基于语音识别等技术，提升用户交互体验。
[0003]目前，车载控制系统通常将车内空间划分为不同拾音区域，以实现对目标音区的语音指令进行强化处理，同时降低非目标区域内声音信号的干扰。然而，现有拾音区域的划分，与车型、车内环境等因素强相关，一旦锁定，将无法根据实际的车内人员以及实际用车场景等来进行自适应调整。有鉴于此，如何自适应调整拾音区域成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种音区调整方法及相关装置、设备、系统和介质，能够自适应调整拾音区域。
[0005]为了解决上述技术问题，本申请第一方面提供了一种音区调整方法，包括：获取车载拾音设备基于预设拾音区域采集的第一音频；其中，第一音频包含由车内的语音交互人所发出的预设语音指令；基于第一音频对语音交互人进行音区判断，得到第一拾音区域，并获取车载拾音设备基于第一拾音区域采集的第二音频；基于第二音频进行频域分析，得到第二音频的频域分布；其中，频域分布包括：形成第二音频的各个声源的声音频率；响应于频域分布满足第一条件，调整车载拾音设备的设备参数，得到车载拾音设备的优化拾音区域。
[0006]为了解决上述技术问题，本申请第二方面提供了一种音区调整装置，包括：第一获取模块、音区判断模块、...

【技术保护点】

【技术特征摘要】
1.一种音区调整方法，其特征在于，包括：获取车载拾音设备基于预设拾音区域采集的第一音频；其中，所述第一音频包含由车内的语音交互人所发出的预设语音指令；基于所述第一音频对所述语音交互人进行音区判断，得到第一拾音区域，并获取所述车载拾音设备基于所述第一拾音区域采集的第二音频；基于所述第二音频进行频域分析，得到所述第二音频的频域分布；其中，所述频域分布包括：形成所述第二音频的各个声源的声音频率；响应于所述频域分布满足第一条件，调整所述车载拾音设备的设备参数，得到所述车载拾音设备的优化拾音区域。2.根据权利要求1所述的方法，其特征在于，所述调整所述车载拾音设备的设备参数，得到所述车载拾音设备的优化拾音区域，包括：基于预设调整步长调整所述设备参数，得到第二拾音区域；其中，所述第二拾音区域的中心线与所述第一拾音区域的中心线重合，且所述第一拾音区域、所述第二拾音区域两者的张角不同；将所述第二拾音区域作为新的第一拾音区域，并重新执行所述获取所述车载拾音设备基于所述第一拾音区域采集的第二音频的步骤以及后续步骤，直至所述频域分布不满足所述第一条件为止，将最新的第一拾音区域作为所述优化拾音区域。3.根据权利要求1所述的方法，其特征在于，所述车载拾音设备为麦克风阵列，且所述麦克风阵列包括若干麦克风，所述设备参数包括所述若干麦克风在车内的分布位置。4.根据权利要求1所述的方法，其特征在于，所述第一条件包括：所述频域分布在剔除第一声音频率之后存在第二声音频率；其中，所述第一声音频率为所述语音交互人的声音频率，所述第二声音频率为与所述第一声音频率不同的声音频率。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：响应于所述频域分布满足第二条件，确定所述语音交互人发生改变，并重新执行所述获取车载拾音设备基于预设拾音区域采集的第一音频的步骤以及后续步骤；其中，所述第二条件包括：所述频域分布不存在所述语音交互人的声音频率。6.根据权利要求1所述的方法，其特征在于，所述基于所述第一音频对所述语音交互人进行音区判断，得到第一拾音区域，包括：基于波束形成对所述第一音频进行处理，得到关于所述第一拾音区域的本端判断结果；以及，将所述第一音频上传至云端，并接收所述云端基于所述第一音频分析的关于所述第一拾音区域的云端判断结果；基于所述本端判断结果和所述云端判断结果，确定所述第一拾音区域。7.根据权利要求6所述的方法，其特征在于，所述本端判断结果包括本端判断音区，且所述云端判断结果包括云端判断音区；所述基于所述本端判断结果和所述云端判断结果，确定所述第一拾音区域，包括：获取所述本端判断音区和所述云端判断音区的重叠率；...

【专利技术属性】
技术研发人员：罗艳龙，张玉梅，邢猛，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人