音区调整方法及相关装置、设备、系统和介质制造方法及图纸

技术编号:34465534 阅读:30 留言:0更新日期:2022-08-10 08:38
本申请公开了一种音区调整方法及相关装置、设备、系统和介质,其中,音区调整方法包括:获取车载拾音设备基于预设拾音区域采集的第一音频;其中,第一音频包含由车内的语音交互人所发出的预设语音指令;基于第一音频对语音交互人进行音区判断,得到第一拾音区域,并获取车载拾音设备基于第一拾音区域采集的第二音频;基于第二音频进行频域分析,得到第二音频的频域分布;其中,频域分布包括:形成第二音频的各个声源的声音频率;响应于频域分布满足第一条件,调整车载拾音设备的设备参数,得到车载拾音设备的优化拾音区域。上述方案,能够自适应调整拾音区域。自适应调整拾音区域。自适应调整拾音区域。

【技术实现步骤摘要】
音区调整方法及相关装置、设备、系统和介质


[0001]本申请涉及语音识别
,特别是涉及一种音区调整方法及相关装置、设备、系统和介质。

技术介绍

[0002]随着汽车技术的发展,越来越多的车辆选择配置车载控制系统,以基于语音识别等技术,提升用户交互体验。
[0003]目前,车载控制系统通常将车内空间划分为不同拾音区域,以实现对目标音区的语音指令进行强化处理,同时降低非目标区域内声音信号的干扰。然而,现有拾音区域的划分,与车型、车内环境等因素强相关,一旦锁定,将无法根据实际的车内人员以及实际用车场景等来进行自适应调整。有鉴于此,如何自适应调整拾音区域成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种音区调整方法及相关装置、设备、系统和介质,能够自适应调整拾音区域。
[0005]为了解决上述技术问题,本申请第一方面提供了一种音区调整方法,包括:获取车载拾音设备基于预设拾音区域采集的第一音频;其中,第一音频包含由车内的语音交互人所发出的预设语音指令;基于第一音频对语音交互人进行音区判断,得到第一拾音区域,并获取车载拾音设备基于第一拾音区域采集的第二音频;基于第二音频进行频域分析,得到第二音频的频域分布;其中,频域分布包括:形成第二音频的各个声源的声音频率;响应于频域分布满足第一条件,调整车载拾音设备的设备参数,得到车载拾音设备的优化拾音区域。
[0006]为了解决上述技术问题,本申请第二方面提供了一种音区调整装置,包括:第一获取模块、音区判断模块、第二获取模块、频域分析模块和音区优化模块,第一获取模块,用于获取车载拾音设备基于预设拾音区域采集的第一音频;其中,第一音频包含由车内的语音交互人所发出的预设语音指令;音区判断模块,用于基于第一音频对语音交互人进行音区判断,得到第一拾音区域;第二获取模块,用于获取车载拾音设备基于第一拾音区域采集的第二音频;频域分析模块,用于基于第二音频进行频域分析,得到第二音频的频域分布;其中,频域分布包括:形成第二音频的各个声源的声音频率;音区优化模块,用于响应于频域分布满足第一条件,调整车载拾音设备的设备参数,得到车载拾音设备的优化拾音区域。
[0007]为了解决上述技术问题,本申请第三方面提供了一种控制设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面的音区调整方法。
[0008]为了解决上述技术问题,本申请第四方面提供了一种车载控制系统,包括车载拾音设备和上述第三方面的控制设备,车载拾音设备与控制设备通信连接,且车载拾音设备用于基于车载拾音设备当前所配置的拾音区域采集音频数据。
[0009]为了解决上述技术问题,本申请第五方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的音区调整方法。
[0010]上述方案,获取车载拾音设备基于预设拾音区域采集的第一音频,且第一音频包括由车内的语音交互人所发出的预设语音指令,再基于第一音频对语音交互人进行音区判断,得到第一拾音区域,并获取车载拾音设备基于第一拾音区域采集的第二音频,以及基于第二音频进行频域分析,得到第二音频的频域分布,且频域分布包括形成第二音频的各个声源的声音频率,从而响应于频域分布满足第一条件,调整车载拾音设备的设备参数,得到车载拾音设备的优化拾音区域,故在车内人员语音交互过程中,一旦采集到包含语音交互人的预设语音指令即可开启音区调整,且在调整过程中先根据第一音频进行初步音区判断,再根据第二音频的频域分布进一步调整,一方面能够随实际情况的变化而调整拾音区域,另一方面通过两个阶段确定出优化拾音区域,也能够提升拾音区域的准确性。故此,能够自适应调整拾音区域。
附图说明
[0011]图1是本申请音区调整方法一实施例的流程示意图;
[0012]图2是车内情况一实施例的示意图;
[0013]图3是第二音频在时域上一实施例的示意图;
[0014]图4是第二音频在频域上一实施例的示意图;
[0015]图5是车内情况另一实施例的示意图;
[0016]图6是本申请音区调整方法另一实施例的流程示意图;
[0017]图7是本申请音区调整装置一实施例的框架示意图;
[0018]图8是本申请控制设备一实施例的框架示意图;
[0019]图9是本申请车载控制系统一实施例的框架示意图;
[0020]图10是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0021]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0022]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0023]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0024]请参阅图1,图1是本申请音区调整方法一实施例的流程示意图。
[0025]具体而言,可以包括如下步骤:
[0026]步骤S11:获取车载拾音设备基于预设拾音区域采集的第一音频。
[0027]本公开实施例中,第一音频包含由车内的语音交互人所发出的预设语音指令。需要说明的是,车内人员可以有一个、两个、三个、四个等,在此不做限定,且语音交互人员为发出预设语音指令的车内人员。示例性地,请结合参阅图2,图2是车内情况一实施例的示意
图。如图2所示,车内人员可以包含甲和乙两人,分别位于驾驶座和后座,且位于驾驶座的甲可以为发出预设语音指令的语音交互人。当然,也可以是位于后座的乙为发出预设语音指令的语音交互人,在此不做限定。此外,图2仅仅示例性地给出实际应用过程中车内情况一种可能的实施方式,并不因此而限定实际应用过程中的车内情况。
[0028]在一个实施场景中,预设语音指令可以用于唤醒车载语音助手。示例性地,预设语音指令具体可以为包含唤醒词的语音信号。如预设语音指令可以为“魔飞魔飞”、“小飞小飞”等,在此不做限定。
[0029]在一个实施场景中,预设拾音区域可以视为车载拾音设备默认配置的拾音区域。具体而言,预设拾音区域可以覆盖车内尽可能多的车座。示例性地,预设拾音区域可以覆盖车内所有车座。此外,预设拾音区域具体可以为一个扇形区域,且该扇形区域的中心线与车载拾音设备的法线具有预设夹角,如预设夹角可以设置为零度,即预设拾音区域的中心线可以与车载拾音设备的法线重合,当然预设夹角也可以大于零度,如可以设置为1度、2度、3度等,在此不做限定。此外,该扇形区域的张角(即圆心角)可以根据需要覆盖的车座设置,如在需要覆盖车内所有车座的情况下,该扇形区域的张角(即圆心角)可以设置为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音区调整方法,其特征在于,包括:获取车载拾音设备基于预设拾音区域采集的第一音频;其中,所述第一音频包含由车内的语音交互人所发出的预设语音指令;基于所述第一音频对所述语音交互人进行音区判断,得到第一拾音区域,并获取所述车载拾音设备基于所述第一拾音区域采集的第二音频;基于所述第二音频进行频域分析,得到所述第二音频的频域分布;其中,所述频域分布包括:形成所述第二音频的各个声源的声音频率;响应于所述频域分布满足第一条件,调整所述车载拾音设备的设备参数,得到所述车载拾音设备的优化拾音区域。2.根据权利要求1所述的方法,其特征在于,所述调整所述车载拾音设备的设备参数,得到所述车载拾音设备的优化拾音区域,包括:基于预设调整步长调整所述设备参数,得到第二拾音区域;其中,所述第二拾音区域的中心线与所述第一拾音区域的中心线重合,且所述第一拾音区域、所述第二拾音区域两者的张角不同;将所述第二拾音区域作为新的第一拾音区域,并重新执行所述获取所述车载拾音设备基于所述第一拾音区域采集的第二音频的步骤以及后续步骤,直至所述频域分布不满足所述第一条件为止,将最新的第一拾音区域作为所述优化拾音区域。3.根据权利要求1所述的方法,其特征在于,所述车载拾音设备为麦克风阵列,且所述麦克风阵列包括若干麦克风,所述设备参数包括所述若干麦克风在车内的分布位置。4.根据权利要求1所述的方法,其特征在于,所述第一条件包括:所述频域分布在剔除第一声音频率之后存在第二声音频率;其中,所述第一声音频率为所述语音交互人的声音频率,所述第二声音频率为与所述第一声音频率不同的声音频率。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述频域分布满足第二条件,确定所述语音交互人发生改变,并重新执行所述获取车载拾音设备基于预设拾音区域采集的第一音频的步骤以及后续步骤;其中,所述第二条件包括:所述频域分布不存在所述语音交互人的声音频率。6.根据权利要求1所述的方法,其特征在于,所述基于所述第一音频对所述语音交互人进行音区判断,得到第一拾音区域,包括:基于波束形成对所述第一音频进行处理,得到关于所述第一拾音区域的本端判断结果;以及,将所述第一音频上传至云端,并接收所述云端基于所述第一音频分析的关于所述第一拾音区域的云端判断结果;基于所述本端判断结果和所述云端判断结果,确定所述第一拾音区域。7.根据权利要求6所述的方法,其特征在于,所述本端判断结果包括本端判断音区,且所述云端判断结果包括云端判断音区;所述基于所述本端判断结果和所述云端判断结果,确定所述第一拾音区域,包括:获取所述本端判断音区和所述云端判断音区的重叠率;...

【专利技术属性】
技术研发人员:罗艳龙张玉梅邢猛
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1