基于制造技术

技术编号:39812479 阅读:11 留言:0更新日期:2023-12-22 19:29
本发明专利技术涉及语音处理技术领域,提出了基于

【技术实现步骤摘要】
基于VOIP呼叫的安防音视频数据增强方法及系统


[0001]本专利技术涉及语音处理
,具体涉及基于
VOIP
呼叫的安防音视频数据增强方法及系统


技术介绍

[0002]基于
IP
的语音传输(
Voice over Internet Protocol

VOIP
)是一种语音通话技术,经由网际协议(
IP
)来达成语音通话与多媒体会议,也就是经由互联网来进行通信

而基于
VOIP
呼叫的安防音视频数据则是指通过
IP
网络传输的用于安全监控

防范的音频和视频数据,可通过移动通信设备

监控摄像头

音频设备等收集实时的安防信息,并通过网络传输至监控中心或其它终端设备进行实时监视和录制

[0003]对于安防音频数据而言,其易受到环境

电磁

声学反射和回声等多种噪声的干扰,极大地影响安防音频数据的质量

相比较于传统的音频数据去噪算法,变分模态分解
(Variational mode decomposition

VMD)
对非线性

非平稳信号的适应性更强,模态函数分解更为准确,能够更好地分离出信号与噪声,进而使音频数据的增强效果也就越好

但是,由于其分解过程中的惩罚系数为全局先验值,容易造成音频数据的增强效果较差,即过高的惩罚系数会导致模态分解结果过于平滑,失去信号的细节和局部特征,使得分解出的成分过于简化,无法准确地反映原始信号的快速变化或局部波动状况;而过低的惩罚系数会导致模态分解结果过于细节化,引入本不应该存在的高频噪声或人为波动,使得分解出的子信号过度拟合于噪声或微小的干扰,不符合信号的实际特性


技术实现思路

[0004]本专利技术提供基于
VOIP
呼叫的安防音视频数据增强方法及系统,以解决音频数据的增强效果较差的问题,所采用的技术方案具体如下:第一方面,本专利技术一个实施例提供了基于
VOIP
呼叫的安防音视频数据增强方法,该方法包括以下步骤:获取原始音频信号的时域波形图;根据原始音频信号的时域波形图获取时域波形图的每个时序区间的频谱图中每个包络;根据时域波形图的每个时序区间的频谱图中每个包络的信息获取时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子;根据时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子获取时域波形图的每个时序区间的惩罚变化系数;根据时域波形图的所有时序区间的惩罚变化系数获取时域波形图的惩罚变化数据序列,利用聚类算法获取时域波形图的惩罚变化数据序列的聚类结果;根据时域波形图的惩罚变化数据序列的聚类结果获取时域波形图的惩罚系数调整因子;根据时域波形图的惩罚系数调整因子获取时域波形图的惩罚系数;利用
VMD
变分模态分解算法基于所述惩罚系数获取时域波形图的模态分量,根据
时域波形图的模态分量获取增强后的原始音频信号

[0005]优选的,所述根据原始音频信号的时域波形图获取时域波形图的每个时序区间的频谱图中每个包络的方法为:对于原始音频信号的时域波形图的时间轴,将以每个预设时间参数大小的区间作为每个时序区间,将每个时序区间的音频信号作为离散傅里叶变换的输入,将离散傅里叶变换的输出作为每个时序区间的音频信号的频谱图;对于每个时序区间的音频信号的频谱图,将频谱图中的每个极大值点作为频谱图中的每个极大强度点,将频谱图中的每个极小值点作为频谱图中的每个极小强度点,将频谱图中的所有极小强度点断开形成的每个能量强度变化线作为频谱图中每个包络

[0006]优选的,所述根据时域波形图的每个时序区间的频谱图中每个包络的信息获取时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子的方法为:对于时域波形图的每个时序区间的频谱图中每个包络,计算包络中的最大能量值与最小能量值之间的差值,将以自然常数为底数,以所述差值为指数的映射结果作为包络的信号强度变化因子;将每个包络的最大能量值的二分之一作为每个包络的
3dB
强度幅值,所述每个包络的
3dB
强度幅值在包络中对应两个坐标点,将所述两个坐标点的横坐标之间的差值的绝对值作为每个包络的
3dB
带宽;对于时域波形图的每个时序区间,根据时序区间的频谱图中每个包络获取时序区间的频谱图中每个包络的信号衰减带宽;对于时域波形图的每个时序区间的频谱图中每个包络,将包络的信号强度变化因子
、3dB
带宽

信号衰减带宽组成的向量作为包络的包络信号特征描述子,所述向量的第一个参数为信号强度变化因子,第二个参数为
3dB
带宽

第三个参数为信号衰减带宽

[0007]优选的,所述根据时序区间的频谱图中每个包络获取时序区间的频谱图中每个包络的信号衰减带宽的方法为:式中,表示第
i
个时序区间的频谱图中第
j
个包络的信号衰减带宽,表示第
i
个时序区间的频谱图中第
j
个包络的最大能量值,表示以自然常数为底数的指数函数,和分别表示第
i
个时序区间的频谱图中第
j
个包络的极大强度点的横坐标

频率较大的极小强度点的横坐标

[0008]优选的,所述根据时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子获取时域波形图的每个时序区间的惩罚变化系数的方法为:征描述子获取时域波形图的每个时序区间的惩罚变化系数的方法为:
式中,表示时域波形图的第
i
个时序区间的频谱图中第
j
个包络的信号差异因子,和分别表示时域波形图的第
i
个时序区间的频谱图中第
j



(j+1)
个包络的所有强度点的能量均值,表示以自然常数为底数的指数函数,表示余弦相似度函数,和分别表示时域波形图的第
i
个时序区间的频谱图中第
j



(j+1)
个包络的包络信号特征描述子,表示时域波形图的第
i
个时序区间的惩罚变化系数,表示时域波形图的第
i
个时序区间的频谱图中所有包络对应的能量均值的均值,表示时域波形图的第
i
个时序区间的频谱图中所有包络的信号差异因子的均值,表示时域波形图的第
i
个时序区间的频谱图中包络的数目

[0009]优选的,所述根据时域波形图的所有时序区间的惩罚变化系数获取时域波形图的惩罚变化数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于
VOIP
呼叫的安防音视频数据增强方法,其特征在于,该方法包括以下步骤:获取原始音频信号的时域波形图;根据原始音频信号的时域波形图获取时域波形图的每个时序区间的频谱图中每个包络;根据时域波形图的每个时序区间的频谱图中每个包络的信息获取时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子;根据时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子获取时域波形图的每个时序区间的惩罚变化系数;根据时域波形图的所有时序区间的惩罚变化系数获取时域波形图的惩罚变化数据序列,利用聚类算法获取时域波形图的惩罚变化数据序列的聚类结果;根据时域波形图的惩罚变化数据序列的聚类结果获取时域波形图的惩罚系数调整因子;根据时域波形图的惩罚系数调整因子获取时域波形图的惩罚系数;利用
VMD
变分模态分解算法基于所述惩罚系数获取时域波形图的模态分量,根据时域波形图的模态分量获取增强后的原始音频信号
。2.
根据权利要求1所述的基于
VOIP
呼叫的安防音视频数据增强方法,其特征在于,所述根据原始音频信号的时域波形图获取时域波形图的每个时序区间的频谱图中每个包络的方法为:对于原始音频信号的时域波形图的时间轴,将以每个预设时间参数大小的区间作为每个时序区间,将每个时序区间的音频信号作为离散傅里叶变换的输入,将离散傅里叶变换的输出作为每个时序区间的音频信号的频谱图;对于每个时序区间的音频信号的频谱图,将频谱图中的每个极大值点作为频谱图中的每个极大强度点,将频谱图中的每个极小值点作为频谱图中的每个极小强度点,将频谱图中的所有极小强度点断开形成的每个能量强度变化线作为频谱图中每个包络
。3.
根据权利要求1所述的基于
VOIP
呼叫的安防音视频数据增强方法,其特征在于,所述根据时域波形图的每个时序区间的频谱图中每个包络的信息获取时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子的方法为:对于时域波形图的每个时序区间的频谱图中每个包络,计算包络中的最大能量值与最小能量值之间的差值,将以自然常数为底数,以所述差值为指数的映射结果作为包络的信号强度变化因子;将每个包络的最大能量值的二分之一作为每个包络的
3dB
强度幅值,所述每个包络的
3dB
强度幅值在包络中对应两个坐标点,将所述两个坐标点的横坐标之间的差值的绝对值作为每个包络的
3dB
带宽;对于时域波形图的每个时序区间,根据时序区间的频谱图中每个包络获取时序区间的频谱图中每个包络的信号衰减带宽;对于时域波形图的每个时序区间的频谱图中每个包络,将包络的信号强度变化因子
、3dB
带宽

信号衰减带宽组成的向量作为包络的包络信号特征描述子,所述向量的第一个参数为信号强度变化因子,第二个参数为
3dB
带宽

第三个参数为信号衰减带宽
。4.
根据权利要求3所述的基于
VOIP
呼叫的安防音视频数据增强方法,其特征在于,所述根据时序区间的频谱图中每个包络获取时序区间的频谱图中每个包络的信号衰减带宽的方法为:
式中,表示第
i
个时序区间的频谱图中第
j
个包络的信号衰减带宽,表示第
i
个时序区间的频谱图中第
j
个包络的最大能量值,表示以自然常数为底数的指数函数,和分别表示第
i
个时序区间的频谱图中第
j
个包络的极大强度点的横坐标

频率较大的极小强度点的横坐标
。5.
根据权利要求1所述的基于
VOIP
呼叫的安防音视频数据增强方法,其特征在于,所述根据时域波形图的每个时序区间的频谱图中每个包络的包络信号特征描述子获取时域波形图的每个时序区间的惩罚变化系数的...

【专利技术属性】
技术研发人员:胡志强傅德谦熊云峰刘玉娇刘萌英杰
申请(专利权)人:临沂金诺视讯数码科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1