基于深度学习的音频优化处理方法及系统技术方案

技术编号:39806500 阅读:9 留言:0更新日期:2023-12-22 02:40
本发明专利技术公开了基于深度学习的音频优化处理方法及系统,涉及音频数据处理技术领域,包括:获取音频信号;基于深度学习,建立背景噪音模型,建立音频优化模型;利用背景噪音模型,将噪音分为易辨识噪音和难辨识噪音,将从属易辨识噪音的音频强度降低至预设强度;将第一正弦音频信号的音频强度降低至预设强度;对第二正弦音频信号进行扰动处理,得到第三正弦音频信号;对第三正弦音频信号进行音频关键帧提取,改变第三正弦音频信号中被音频关键帧截取的突变部分;输出优化音频信号

【技术实现步骤摘要】
基于深度学习的音频优化处理方法及系统


[0001]本专利技术涉及音频数据处理
,具体是涉及基于深度学习的音频优化处理方法及系统


技术介绍

[0002]随着互联网技术的发展,互联网应用也得到迅速发展;其中,互联网应用可包括但不限于:即时通信应用

社会性网络服务应用

语音通信应用等

诸如笔记本电脑

手机
、PAD
等终端中可安装上述互联网应用,终端侧用户可使用终端中的互联网应用与其他用户进行诸如语音电话

音频聊天等音频通话

音质是影响音频通话的一个重要因素

[0003]实践中发现,音响系统在进行音频播放时,扬声器中有时混有爆破音或出现变调

失真等现象

经反复实验找到了发生这种现象的原因:数据处理模块的优化处理方法按照设定的固定模式进行,即对接收到的所有音频数据不加区分地采取相同的降噪优化措施,导致有些音频数据降噪优化后的播放效果反而更差


技术实现思路

[0004]为解决上述技术问题,提供基于深度学习的音频优化处理方法及系统,本技术方案解决了上述
技术介绍
中提出的对接收到的所有音频数据不加区分地采取相同的降噪优化措施,导致有些音频数据降噪优化后的播放效果反而更差的问题

[0005]为达到以上目的,本专利技术采用的技术方案为:基于深度学习的音频优化处理方法,包括:获取音频信号,将连续信号数字化变成音频数字信号,数字化包括采样

量化和编码,使用傅里叶变换,将音频数字信号分解为至少一个正弦音频信号;基于深度学习,建立背景噪音模型,建立音频优化模型;利用背景噪音模型,得到噪音特征,根据噪音特征,将噪音分为易辨识噪音和难辨识噪音,捕获至少一个正弦音频信号中的从属易辨识噪音,将从属易辨识噪音的音频强度降低至预设强度,人耳无法识别低于所述预设强度的音频;对于难辨识噪音,使用傅里叶变换,将难辨识噪音分解为至少一个正弦噪声信号,在至少一个正弦音频信号中,捕获与正弦噪声信号差距在预设范围内的第一正弦音频信号,将第一正弦音频信号的音频强度降低至预设强度,其中,第一正弦音频信号与正弦噪声信号差距的计算方式为在二者定义域上对第一正弦音频信号与正弦噪声信号的差的绝对值进行积分;使用音频优化模型,获取至少一个特征优化音频信号,在至少一个正弦音频信号中,捕获与特征优化音频信号差距在预设范围内的第二正弦音频信号,对第二正弦音频信号进行扰动处理,得到第三正弦音频信号,其中,第二正弦音频信号与特征优化音频信号差距的计算方式为在二者定义域上对第二正弦音频信号与特征优化音频信号的差的绝对值进行积分;
对第三正弦音频信号进行音频关键帧提取,改变第三正弦音频信号中被音频关键帧截取的突变部分;将调整后的至少一个正弦音频信号进行傅里叶逆变换,得到优化后的音频数字信号,重新变换音频数字信号为优化音频信号,输出优化音频信号

[0006]优选的,所述采样

量化和编码包括以下步骤:作出音频信号的连续图像,横轴为时间,纵轴为音频信号强度;取有限个时间点,完成采样;采集时间点处对应的音频信号强度,完成量化;对得到的量化数据进行编码,表示成计算机能够识别的数字格式

[0007]优选的,所述基于深度学习,建立背景噪音模型包括以下步骤:大数据获取各种实际的噪声,剔除音频信号中不会出现的噪声,得到样本噪声;对于样本噪声进行采样

量化和编码,得到噪声数字信号

[0008]优选的,所述建立音频优化模型包括以下步骤:大数据获取各类标准音频信号;对于各类标准音频信号进行采样

量化和编码,得到标准音频数字信号

[0009]优选的,所述根据噪音特征,将噪音分为易辨识噪音和难辨识噪音包括以下步骤:获取背景噪音模型中的所有噪声数字信号;在噪声数字信号与音频数字信号的定义域上,对噪声数字信号与音频数字信号的差的绝对值进行积分,得到积分差值;若积分差值大于预设差值,则噪声数字信号为易辨识噪音;若积分差值不超过预设差值,则噪声数字信号为难辨识噪音

[0010]优选的,所述傅里叶变换具体如下:
[0011]其中,
F

x
)为傅里叶变换后的信号,
i
为单位虚数,
e
为自然常数,
f

t
)为傅里叶变换前的信号;傅里叶逆变换具体如下:
[0012]其中,
G

t
)为傅里叶逆变换前的信号,
i
为单位虚数,
e
为自然常数,
g

x
)为傅里叶逆变换后的信号

[0013]优选的,所述捕获至少一个正弦音频信号中的从属易辨识噪音,将从属易辨识噪音的音频强度降低至预设强度包括以下步骤:获取易辨识噪音,在至少一个正弦音频信号中进行检索,得到与易辨识噪音差距在预设范围内的从属易辨识噪音;获取从属易辨识噪音的第一拟合函数,在至少一个正弦音频信号中添加函数图像为的噪音逆反信号;从属易辨识噪音与噪音逆反信号叠加,得到噪声抵消信号,噪声抵消信号的音频
强度降低至预设强度;将第一正弦音频信号的音频强度降低至预设强度包括以下步骤:获得第一正弦音频信号的第二拟合函数,在至少一个正弦音频信号中添加函数图像为的正弦逆反信号;第一正弦音频信号与正弦逆反信号叠加,得到噪声消除信号,噪声消除信号的音频强度降低至预设强度

[0014]优选的,所述对第二正弦音频信号进行扰动处理包括以下步骤:获取拟合第二正弦音频信号的正弦函数,获取拟合特征优化音频信号的特征函数;将正弦函数与特征函数作差,得到补偿函数,在第二正弦音频信号中添加补偿逆反函数,得到第三正弦音频信号,完成扰动

[0015]优选的,所述对第三正弦音频信号进行音频关键帧提取,改变第三正弦音频信号中被音频关键帧截取的突变部分包括以下步骤:将第三正弦音频信号与特征优化音频信号在同一个坐标系中作出,横轴为时间,纵轴为音频信号强度;在坐标系中寻找至少一个关键时间点,第三正弦音频信号与特征优化音频信号满足于在所述关键时间点处的差值超出预设范围;截取关键时间点处的第三正弦音频信号作为音频关键帧,并在关键时间点处截取特征优化音频信号作为对比关键帧;获取音频关键帧中第三正弦音频信号的取值
p
,获取对比关键帧中特征优化音频信号的取值
q
;作出突变消除信号的函数,满足于在关键时间点处取值为,在除关键时间点之外的点处取值为0;将突变消除信号与第三正弦音频信号叠加输出,完成修正

[0016]基于深度学习的音频优化处理系统,用于实现上述的基于深度学习的音频优化处理方法,包括:音频本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于深度学习的音频优化处理方法,其特征在于,包括:获取音频信号,将连续信号数字化变成音频数字信号,数字化包括采样

量化和编码,使用傅里叶变换,将音频数字信号分解为至少一个正弦音频信号;基于深度学习,建立背景噪音模型,建立音频优化模型;利用背景噪音模型,得到噪音特征,根据噪音特征,将噪音分为易辨识噪音和难辨识噪音,捕获至少一个正弦音频信号中的从属易辨识噪音,将从属易辨识噪音的音频强度降低至预设强度,人耳无法识别低于所述预设强度的音频;对于难辨识噪音,使用傅里叶变换,将难辨识噪音分解为至少一个正弦噪声信号,在至少一个正弦音频信号中,捕获与正弦噪声信号差距在预设范围内的第一正弦音频信号,将第一正弦音频信号的音频强度降低至预设强度,其中,第一正弦音频信号与正弦噪声信号差距的计算方式为在二者定义域上对第一正弦音频信号与正弦噪声信号的差的绝对值进行积分;使用音频优化模型,获取至少一个特征优化音频信号,在至少一个正弦音频信号中,捕获与特征优化音频信号差距在预设范围内的第二正弦音频信号,对第二正弦音频信号进行扰动处理,得到第三正弦音频信号,其中,第二正弦音频信号与特征优化音频信号差距的计算方式为在二者定义域上对第二正弦音频信号与特征优化音频信号的差的绝对值进行积分;对第三正弦音频信号进行音频关键帧提取,改变第三正弦音频信号中被音频关键帧截取的突变部分;将调整后的至少一个正弦音频信号进行傅里叶逆变换,得到优化后的音频数字信号,重新变换音频数字信号为优化音频信号,输出优化音频信号
。2.
根据权利要求1所述的基于深度学习的音频优化处理方法,其特征在于,所述采样

量化和编码包括以下步骤:作出音频信号的连续图像,横轴为时间,纵轴为音频信号强度;取有限个时间点,完成采样;采集时间点处对应的音频信号强度,完成量化;对得到的量化数据进行编码,表示成计算机能够识别的数字格式
。3.
根据权利要求2所述的基于深度学习的音频优化处理方法,其特征在于,所述基于深度学习,建立背景噪音模型包括以下步骤:大数据获取各种实际的噪声,剔除音频信号中不会出现的噪声,得到样本噪声;对于样本噪声进行采样

量化和编码,得到噪声数字信号
。4.
根据权利要求3所述的基于深度学习的音频优化处理方法,其特征在于,所述建立音频优化模型包括以下步骤:大数据获取各类标准音频信号;对于各类标准音频信号进行采样

量化和编码,得到标准音频数字信号
。5.
根据权利要求4所述的基于深度学习的音频优化处理方法,其特征在于,所述根据噪音特征,将噪音分为易辨识噪音和难辨识噪音包括以下步骤:获取背景噪音模型中的所有噪声数字信号;在噪声数字信号与音频数字信号的定义域上,对噪声数字信号与音频数字信号的差的
绝对值进行积分,得到积分差值;若积分差值大于预设差值,则噪声数字信号为易辨识噪音;若积分差值不超过预设差值,则噪声数字信号为难辨识噪音
。6.
根据权利要求5所述的基于深度学习的音频优化处理方法,其特征在于,所述傅里叶变换具体如下:,其中,
F

x
)为傅里叶变换后的信号,
i
为单位虚数,
e
为自然常数,
f

t
)为傅里叶变换前的...

【专利技术属性】
技术研发人员:刘耀明翟立志
申请(专利权)人:深圳云盈网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1