基于车载录音设备的多音区抢麦方法、系统、车辆和介质技术方案

技术编号：42865024 阅读：17 留言：0更新日期：2024-09-27 17:27

本申请涉及智能驾驶技术领域，具体涉及基于车载录音设备的多音区抢麦方法、系统、车辆和介质。本申请利用多个车载录音设备同时录取不同音区的声音，获得多路声音数据；按照预设数据格式和数据位深对多路声音数据进行分解，获得每个音区对应的单路声音数据；基于单路声音数据，获得每个音区对应的伴奏音频数据，并分别与相应的单路声音数据进行对比，获得最快最准确的目标声音数据，从而实现抢麦结果。本发明专利技术基于车辆座舱内多个方位已安装好的拾音麦克风，录取座舱内不同音区的单路声音数据，并与伴奏音频数据进行单独对比，从而筛选出最快最准确的目标声音数据，实现良好的K歌体验，能增强用户的交互和乘坐体验，并提高对硬件资源的利用率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能驾驶，具体是涉及一种基于车载录音设备的多音区抢麦方法、系统、车辆和介质。

技术介绍

1、随着智能驾驶技术的飞速发展，为了车内拥有更好的语音识别效果，很多汽车智能座舱内都安装有2音区、4音区等不同音区数量的麦克风录音设备。在检测到当前场景为k歌场景时，可以利用这些麦克风录音设备录取并播放演唱者的k歌声音。

2、目前，基于汽车智能座舱内的麦克风录音设备实现k歌功能的方案，通常是基于汽车智能座舱内的所有车内麦克风采集驾乘人员的声音信息，并基于声音信息定位至少一位演唱者的实际位置；根据声音信息提取实际位置发出的声音信号，并根据由声音信号生成的k歌信息控制车辆进行娱乐播放。这种k歌方案虽然无需外接手持话筒，减少了外接设备，但是需要根据声音信息定位演唱者的实际位置，并提取实际位置发出的声音信号生成k歌信息，可见如果存在多个演唱者时，来自不同位置的k歌信息可能无法准确识别，致使k歌效果无法得到保障。

3、综上所述，现有的基于汽车智能座舱内的麦克风录音设备的k歌方案，在存在多个演唱者时，由于来自不同位置的k歌信息可能无法准确识别，致使k歌效果无法得到保障。

4、因此，现有技术还有待改进和提高。

技术实现思路

1、本申请提供了一种基于车载录音设备的多音区抢麦方法、系统、车辆和介质，以解决相关技术的自动驾驶控制方法无法在陌生场景下执行的控制策略无法保障行驶的安全性的技术问题。

2、为实现上述目的，本申请采用了以下技术方案：

3、

4、利用若干个车载录音设备同时录取不同音区的声音，获得多路声音数据；

5、按照预设数据格式和数据位深对所述多路声音数据进行分解，获得每个音区对应的单路声音数据；

6、基于所述单路声音数据，获得每个音区对应的伴奏音频数据；

7、分别将每个音区对应的单路声音数据与伴奏音频数据进行对比，确定目标声音数据；

8、基于所述目标声音数据和所述伴奏音频数据，输出多音区抢麦结果。

9、根据上述技术手段，本申请实施例基于车辆座舱内多个方位已安装好的拾音麦克风，录取座舱内不同音区的单路声音数据，通过获取与每个单路声音数据匹配的伴奏音频数据，并将单路声音数据与对应的伴奏音频数据进行对比，从而筛选出最快最准确的目标声音数据，然后基于目标声音数据合成最终的k歌效果并输出。可见，本专利技术不仅能够增加车内的娱乐交互方式，显著提高用户的乘坐体验，使用户能够更多的利用车内环境去互动，加强用户对车机系统的依赖程度，而且能够充分利用车辆的硬件资源，提高资源利用率。

10、可选地，在本申请的一个实施例中，所述利用若干个车载录音设备分别录取不同音区的声音，获得多路声音数据，包括：

11、基于若干个车载录音设备，创建若干个设备文件节点；

12、按照预设的录音参数驱动每个所述设备文件节点同时录取对应音区的声音，获得多路声音数据。

13、根据上述技术手段，本申请实施例通过设置设备文件节点，按照预设的录音参数驱动每个设备文件节点同时录取音区的声音数字信号，获得多路声音数据可将座舱内的所有拾音麦克风的数据同时录取，获得多路声音数据组成的多路数据包，以保证多路数据到达的同时性，并将多路拾音麦克风数据存储在车机系统中。

14、可选地，在本申请的一个实施例中，在所述获得多路声音数据之后，还包括：

15、对所述多路声音数据进行预处理，更新所述多路声音数据，所述预处理包括但不限于降噪和回声消除处理。

16、根据上述技术手段，本申请实施例通过对多路声音数据进行预处理，能够达到降噪及回声消除等效果，得到清晰的多路声音数据，以避免影响后续对各路声音数据进行处理的效果。

17、可选地，在本申请的一个实施例中，所述基于所述单路声音数据，获得每个音区对应的伴奏音频数据，包括：

18、利用预装的媒体应用读取每个音区对应的所述单路声音数据，并下载各个所述单路声音数据对应的媒体音频数据；

19、将每个所述媒体音频数据分别进行解码，获得每个所述单路声音数据对应的音频流数据；

20、对每个所述音频流数据分别进行截取，获得每个所述单路声音数据对应的伴奏音频数据。

21、根据上述技术手段，本申请实施例根据每个音区中所有的单路声音数据，分别获取和每个单路声音数据匹配的媒体音频数据，并通过对媒体音频数据件解码和截取，获得每个所述单路声音数据对应的伴奏音频数据，以为后面准确判断每个单路声音数据与对应的伴奏音频数据之间的相似性奠定了良好的基础。

22、可选地，在本申请的一个实施例中，所述分别将每个音区对应的所述单路声音数据与伴奏音频数据进行对比，获得目标声音数据，包括：

23、根据每个所述单路声音数据的录取时间及数据幅值，确定每个音区中的主要声音数据；

24、分别将每个音区对应的主要声音数据与伴奏音频数据按照预设的匹配规则进行匹配，获得每个音区对应的主要声音数据与伴奏音频数据之间的相似度；

25、基于所述相似度，确定目标声音数据。

26、根据上述技术手段，本申请实施例通过声音录取的时间先后顺序，以及能量分析和信息准确性评估，通过综合多种判定规则，能够提高所确定出的最快最准确的目标声音数据的准确性。

27、可选地，在本申请的一个实施例中，所述分别将每个音区对应的主要声音数据与伴奏音频数据按照预设的匹配规则进行匹配，获得每个音区对应的主要声音数据与伴奏音频数据之间的相似度，包括：

28、将每个所述主要声音数据和相应的伴奏音频数据分别转换为文本信息，获得每个音区对应的声音文本信息和伴奏文本信息；

29、提取每个音区中的所述声音文本信息和所述伴奏文本信息中的关键字，得到每个音区对应的声音关键字和伴奏关键字；

30、按照关键字出现的时间，将每个音区对应的声音关键字和伴奏关键字进行匹配，获得每个音区对应的主要声音数据与伴奏音频数据之间的相似度。

31、根据上述技术手段，本申请实施例通过将每个单路声音数据中的文本信息分别与相应的伴奏音频数据中的文本信息进行对比，确定二者的文本信息之间的相似度，并比较单路声音数据中的文本信息出现的时间和伴奏音频数据中对应的文本信息出现的时间的接近程度，并根据相似度和时间上的偏差确定每个单路声音数据的准确性，从而精准地判断出最快最准确的目标声音数据。

32、可选地，在本申请的一个实施例中，所述基于所述目标声音数据和所述伴奏音频数据，输出多音区抢麦结果，包括：

33、获取抢麦模式，并根据所述抢麦模式，确定所述目标声音数据与除所述目标声音数据以外的所述主要声音数据和/或所述伴奏音频数据之间的混合方式；

34、基于所述混合方式进行数据融合，获得混合音频数据；

35、本文档来自技高网...

【技术保护点】

1.基于车载录音设备的多音区抢麦方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述利用若干个车载录音设备分别录取不同音区的声音，获得多路声音数据，包括：

3.如权利要求1所述的基于车载录音设备的多音区抢麦方法，其特征在于，在所述获得多路声音数据之后，还包括：

4.如权利要求1所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述基于所述单路声音数据，获得每个音区对应的伴奏音频数据，包括：

5.如权利要求1所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述分别将每个音区对应的单路声音数据与伴奏音频数据进行对比，确定目标声音数据，包括：

6.如权利要求5所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述分别将每个音区对应的主要声音数据与伴奏音频数据按照预设的匹配规则进行匹配，获得每个音区对应的主要声音数据与伴奏音频数据之间的相似度，包括：

7.如权利要求5所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述基于所述目标声音数据和所述伴奏音频

8.一种基于车载录音设备的多音区抢麦系统，其特征在于，包括：

9.一种车辆，其特征在于，所述车辆包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于车载录音设备的多音区抢麦程序，所述处理器执行所述基于车载录音设备的多音区抢麦程序时，实现如权利要求1-7任一项所述的基于车载录音设备的多音区抢麦方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于车载录音设备的多音区抢麦程序，所述基于车载录音设备的多音区抢麦程序被处理器执行时，实现如权利要求1-7任一项所述的基于车载录音设备的多音区抢麦方法的步骤。

...

【技术特征摘要】

1.基于车载录音设备的多音区抢麦方法，其特征在于，包括以下步骤：

3.如权利要求1所述的基于车载录音设备的多音区抢麦方法，其特征在于，在所述获得多路声音数据之后，还包括：

4.如权利要求1所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述基于所述单路声音数据，获得每个音区对应的伴奏音频数据，包括：

6.如权利要求5所述的基于车载录音设备的多音区抢麦方法，其特征在于，所述分别将每个音区对应的主要声音数据与伴奏音频数据按照预设的匹配规则进行匹配...

【专利技术属性】
技术研发人员：刘洋，汪洪波，沈洋，王倩，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人