System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及音频均衡器,尤其是涉及一种基于深度学习的高保真参数化音频均衡器控制方法及系统。
技术介绍
1、音频均衡器是一种能够调节不同频段音量的电子设备,被广泛应用于音乐制作、音频处理和高保真音响系统中。传统的音频均衡器通常采用固定参数或手动调节的方式,无法根据不同的音频环境和内容进行智能优化。随着深度学习技术的发展,将其应用于音频处理领域,为提高音频均衡器的性能提供了新的可能性。
2、传统均衡器的一个局限性在于它们往往无法根据不同的音频内容自动调整参数。这意味着在播放不同类型的音乐或音频时,均衡器的设置需要手动更改,以匹配特定音频内容的最佳听感。由于缺乏自动适应性,这可能导致在某些情况下音质不能达到最佳效果,特别是当音频内容频繁变化时,手动调整可能变得不切实际或耗时。
3、针对上述中的相关技术,认为传统均衡器无法根据不同的音频内容自动调整参数,导致音质不能达到最佳效果,影响用户体验。
技术实现思路
1、为了改善传统均衡器无法根据不同的音频内容自动调整参数,导致音质不能达到最佳效果,影响用户体验的问题,本申请提供一种基于深度学习的高保真参数化音频均衡器控制方法及系统。
2、第一方面,本申请提供的一种基于深度学习的高保真参数化音频均衡器控制方法,采用如下的技术方案:包括:
3、收集音频样本并进行预处理,提取音频特征,根据所述音频特征对预设的深度学习模型进行训练;
4、提取当前音频信号的时频特征,将所述时频特征输送至所述深度学习
5、根据所述参数信息实时调整参数化音频均衡器,以使参数化音频均衡器输出优化后的高保真音频信号。
6、可选的,在所述提取当前音频信号的时频特征,将所述时频特征输送至所述深度学习模型中,输出参数信息之后,还包括:基于预设的反馈机制算法对所述深度学习模型进行优化;
7、所述反馈机制算法如下:
8、;
9、其中,音频信号为 ,频域特征为,参数化均衡器的传递函数为,深度学习模型预测的参数为;
10、;
11、;
12、其中,表示第个频段的增益函数,参数包括中心频率、增益和带宽,深度学习模型根据输入的音频特征预测最优参数。
13、可选的,基于非结构化的参考人脸图像进行预处理,获取人脸数据;
14、基于深度神经网络对所述人脸数据以及预设的驱动音频进行快速网络微调;
15、将微调后的音频数据以及所述人脸数据输送至预设的音频人脸对应模型中进行训练;
16、将音频信号输送至所述音频人脸对应模型中,输出与所述音频信号对应的三维人脸关键点,实现音频到动态视频的映射。
17、可选的,基于nerf渲染器,对所述三维人脸关键点和所述参考人脸图像进行辐射场估计,获取辐射场估计结果;
18、根据所述辐射场估计结果,实现高保真度的神经重建和渲染,生成与所述音频信号和所述参考人脸图像一致的动态人脸。
19、可选的,基于减状态维特比算法,在每个时间步长t,计算从每个状态转移到每个可能的下一个状态的概率;
20、对于每个状态,保留转移概率最大的k个状态转移路径;
21、更新每个状态的概率为保留路径中概率最大的状态转移路径的概率;
22、基于所述最大的状态转移路径的概率对参数化音频均衡器的状态空间计算量进行降低。
23、可选的,基于分段路径回溯算法将整个路径追踪过程分为多个子路径段,每个所述子路径段包含若干时间步长t;
24、在每个所述子路径段的末尾,存储当前所有状态的最佳路径,从最后一个所述子路径段开始,进行路径回溯,确定所述最佳路径;
25、将每个所述子路径段回溯得到的所述最佳路径进行合并,得到全局最佳路径;
26、基于所述全局最佳路径对参数化音频均衡器进行调整。
27、第二方面,本申请一种基于深度学习的高保真参数化音频均衡器控制装置,采用如下技术方案,包括:
28、音频处理模块,用于收集音频样本并进行预处理,提取音频特征,根据所述音频特征对预设的深度学习模型进行训练;
29、模型输出模块,用于提取当前音频信号的时频特征,将所述时频特征输送至所述深度学习模型中,输出参数信息,所述参数信息包括:频率、增益和带宽参数;
30、音频调整模块,用于根据所述参数信息实时调整参数化音频均衡器,以使参数化音频均衡器输出优化后的高保真音频信号。
31、第三方面,本申请还提供一种控制设备,所述设备包括:
32、包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如上述基于深度学习的高保真参数化音频均衡器控制方法的计算机程序。
33、第四方面,本申请还提供一种计算机可读存储介质,存储有能够被处理器加载并执行如上述基于深度学习的高保真参数化音频均衡器控制方法的计算机程序。
34、综上所述,本申请中系统收集音频样本并进行预处理,提取音频特征,根据所述音频特征对预设的深度学习模型进行训练;提取当前音频信号的时频特征,将所述时频特征输送至所述深度学习模型中,输出参数信息,再根据参数信息实时调整参数化音频均衡器,以使参数化音频均衡器输出优化后的高保真音频信号,从而自动学习不同音频内容的最佳均衡参数,实现智能优化均衡器参数的效果,同时系统结合音频均衡器,利用深度学习模型进行多说话人视频合成,通过分析音频内容,生成与音频内容匹配的高保真视频输出,为任意说话人脸和驱动语音的高效生成提供了强有力的技术支持,最后在硬件算法实现方面,系统采用减状态维特比算法,通过分支状态缩减来降低计算复杂度,有效减少状态空间,显著减少了所需的计算资源,并采用分段路径回溯算法,通过将关键路径进行分割处理,减少了每个时钟周期内需要处理的路径数,从而提高了系统的时序性能。
本文档来自技高网...【技术保护点】
1.一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,在所述提取当前音频信号的时频特征,将所述时频特征输送至所述深度学习模型中,输出参数信息之后,还包括:
3.根据权利要求1所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,在所述将音频信号输送至所述音频人脸对应模型中,输出与所述音频信号对应的三维人脸关键点,实现音频到动态的映射之后,还包括:
5.根据权利要求4所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,所述方法还包括:
7.一种基于深度学习的高保真参数化音频均衡器控制装置,其特征在于,所述装置包括:
8.一种控制设备,其特征在于,所述设备包括:<
...【技术特征摘要】
1.一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,包括:
2.根据权利要求1所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,在所述提取当前音频信号的时频特征,将所述时频特征输送至所述深度学习模型中,输出参数信息之后,还包括:
3.根据权利要求1所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的一种基于深度学习的高保真参数化音频均衡器控制方法,其特征在于,在所述将音频信号输送至所述音频人脸对应模型中,输出与所述音频信号对应的三...
【专利技术属性】
技术研发人员:韦伟才,邓海蛟,马健莹,
申请(专利权)人:深圳市龙芯威半导体科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。