一种基于时序马尔科夫过程的自适应音量优化方法技术

技术编号：33765289 阅读：39 留言：0更新日期：2022-06-12 14:15

本发明专利技术公开了一种基于时序马尔科夫过程的自适应音量优化方法，包括以下步骤：设置多个声音采集单元和图像采集单元，进行不同音源信号采集；对采集到的音源信号进行特征提取并将声音提供者与音源信号进行匹配；将音源信号进行自适应音源增益、噪音识别和串音识别；将优化后的音源信号进行音源输出；本发明专利技术通过自适应音源增益、噪音识别和串音识别实现准确的音源识别，实时分析各通道的音源音量,判断出保持理想识别效果的音量增益参数，实时分析多路通道的声学信息,判断各通道是否存有干扰语音，并进行相应的防串音抑制，提高声音识别率，对于硬件要求低，不受周围环境影响，解决了声音小的音源丢失和各通道串音问题，有效提升语音识别效果。音识别效果。音识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时序马尔科夫过程的自适应音量优化方法

[0001]本专利技术涉及声音信号处理
，尤其涉及一种基于时序马尔科夫过程的自适应音量优化方法。

技术介绍

[0002]公共场所如广场、公共汽车站、地铁等具有人流量大、地域广等特点，且公共场所的安全防范一直受到各国政府和人民的广泛关注。目前以视频监控为主的监控技术为公共场所的安全防范起到了积极的作用，然而视频监控技术存在监控死角、阴雨天监控模糊等问题。众所周知，在异常事件发生时常常伴随着尖叫声、枪声、玻璃破碎声、爆炸声等异常声音，因此音频监控与视频监控的协作运行已经成为公共场所安全监控领域的发展方向。
[0003]而在进行以语音识别为基础的多人实录系统中，室内环境结构、麦克风硬件、说话人位置和声音，都显著影响现场识别效果，各因素的变动容易造成收音微弱、麦克风串音，进而导致明显的识别率下降和识别结果错误等。
[0004]例如，中国专利CN202010825664.7公开了声音优化方法及声音优化系统。系统能够根据客户属性为其配置相应的声音优化模式，将人工坐席或语音机器人的音色音调转换为目标优化模式，提升客户体验；但是对于音源的识别效率并没有有效改进。

技术实现思路

[0005]本专利技术主要解决现有的技术中多音源识别效率低的问题；提供一种基于时序马尔科夫过程的自适应音量优化方法。
[0006]本专利技术的上述技术问题主要是通过下述技术方案得以解决的：一种基于时序马尔科夫过程的自适应音量优化方法，包括以下步骤：设置多个声音采集单元和...

【技术保护点】

【技术特征摘要】
1.一种基于时序马尔科夫过程的自适应音量优化方法，其特征在于，包括以下步骤：设置多个声音采集单元和图像采集单元，进行不同音源信号采集；对采集到的音源信号进行特征提取并将声音提供者与音源信号进行匹配；将音源信号进行自适应音源增益、噪音识别和串音识别；将优化后的音源信号进行音源输出。2.根据权利要求1所述的一种基于时序马尔科夫过程的自适应音量优化方法，其特征在于，所述声音采集单元为相互之间距离小于1m的多个有线麦克风或相互之间距离大于5m的多个无线麦克风。3.根据权利要求1所述的一种基于时序马尔科夫过程的自适应音量优化方法，其特征在于，音源信号采集的方法为：在同一时间帧内将全部通道的音源信号进行汇集。4.根据权利要求1所述的一种基于时序马尔科夫过程的自适应音量优化方法，其特征在于，所述音源增益的方法为：获取当前帧某一音源通道内的音源信号，并获取该帧音源信号声音提供者K帧历...

【专利技术属性】
技术研发人员：麦联韬，唐海江，朱宇，袁宇豪，
申请(专利权)人：杭州云嘉云计算有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人