一种面向信号识别深度学习模型训练的数据增强方法技术

技术编号:37170911 阅读:14 留言:0更新日期:2023-04-20 22:42
本发明专利技术公开了一种面向信号识别深度学习模型训练的数据增强方法,该方法包括在电磁信号识别场景中,通过频谱可视化软件确定信号出联的频点及带宽并控制信号采集处理设备进行采集,获取实际信号的基带数据;将IQ基带数据根据信号的出现时间进行频域、时域提取等预处理操作,得到单信号基带时域波形数据;采用重采样、抖动变频、时域平移、增减噪声等手段,对时域波形数据进行数据增强扩充;将增强后的信号时域波形数据根据智能识别算法输入所需的长度进行切分或添补,形成定长信号时域数据样本集;最后,进行变换域变换,通过短时傅里叶变换将信号时域波形数据转换为时频矩阵数据。本发明专利技术能够有效提升信号识别深度学习算法性能。发明专利技术能够有效提升信号识别深度学习算法性能。发明专利技术能够有效提升信号识别深度学习算法性能。

【技术实现步骤摘要】
一种面向信号识别深度学习模型训练的数据增强方法


[0001]本专利技术涉及信号识别
,尤其涉及到一种面向信号识别深度学习模型训练的数据增强方法。

技术介绍

[0002]信号识别是对信号体制、网台类型的识别,对目标属性的判定有着重大意义,也可用于认知无线电、自适应通信等领域。传统的信号识别算法是通过对单一信号进行详细分析,人工提取高阶累积量、瞬时参数、循环平稳谱等特征,逐一形成单类别信号识别算法,研发难度大、周期长。随着通信技术的蓬勃发展,电磁环境中的信号种类迭代更新速度快、数量多、体制复杂,对信号识别算法的研发速度及识别准确度有更为严苛的要求。
[0003]基于神经网络的深度学习人工智能算法近年来引起了多个领域的关注,在计算机视觉、语音识别、自然语言处理等方向的应用都有远超传统算法的表现,智能信号识别已是大势所趋。鉴于计算机视觉领域的应用最为成熟,且时频数据同时反映了信号在时间和频率的二维信息,更有利于神经网络提取多维特征,目前大部分智能信号识别算法使用时频矩阵数据作为神经网络算法的输入。多项研究表明,神经网络的性能与模型大小是强相关的,而大模型需要的更多的样本数据训练优化参数,但对信号识别任务而言,复杂电磁环境应用背景下的目标信号,特别是短猝发、非协作类信号,数据样本的采集、分析、标注等环节所需时间成本、人力成本巨大,使得构建大规模样本数据集较为困难。

技术实现思路

[0004]本专利技术的主要目的在于提供一种面向信号识别深度学习模型训练的数据增强方法,旨在解决目前基于时频矩阵作为网络输入的人工智能信号识别算法的研发所存在的数据样本难以大量获取,数据标注专业性要求高、难度大,主流数据集构建及数据增强方法无法直接套用的技术问题。
[0005]为实现上述目的,本专利技术提供一种面向信号识别深度学习模型训练的数据增强方法,所述方法包括以下步骤:
[0006]S1:使用信号采集处理设备采集实际电磁环境下的基带信号样本数据;
[0007]S2:对信号进行预处理,形成单信号时域样本集,并确认样本标签信息;
[0008]S3:对单信号样本集进行多手段数据增强,形成扩充时域样本集;
[0009]S4:根据信号识别算法所需数据点数,对扩充时域样本集按信号属性进行切片或截取操作,形成定长时域样本集;
[0010]S5:根据信号识别算法输入时频图大小,对定长时域样本集进行短时傅里叶变换,形成可直接用于训练的数据增强后时域图像数据集。
[0011]可选的,所述步骤S2中,对信号进行预处理,分别在频域、时域对实际采集目标信号进行获取,具体包括:
[0012]对实际采集数据进行频域获取时,通过下变频、滤波、抽取,形成信号中心频率对
应0Hz,滤波带宽为信号带宽,抽取后信号采样率为四倍信号带宽的基带IQ数据,确保数据集单样本仅包含单一频点信号;
[0013]对实际采集数据进行时域获取时,通过时域波形信号幅度的变化,找到信号的开始时间与结束时间,进行截取,形成多个单突发信号基带IQ数据,确保数据集单样本仅包含单一频点的单突发信号。
[0014]可选的,所述步骤S3,具体包括:采用信号重采样技术、频域抖动、时域抖动、人工加噪、人工去噪手段中的一种或多种,对信号基带IQ数据进行数据增强扩充并进行定长处理后,再通过特征域变换,采用短时傅里叶变换进行时频域的转换。
[0015]可选的,所述对信号基带IQ数据进行数据增强时,采用基于数字上、下变频的频域抖动,表达式具体为:
[0016]f
shift
=αBw,α∈[

0.25,0.25][0017][0018]其中,x(n)为信号原始基带IQ数据,Bw为信号带宽,α是频域抖动系数,为

0.25到0.25间的随机数,x
fshift
(n)为随机频域抖动后的信号基带IQ数据,为基带IQ数据长度。
[0019]可选的,所述对信号基带IQ数据进行数据增强时,采用基于增添噪声点的时域抖动;
[0020]若时域抖动方向为向右,则为时域延迟,表达式具体为:
[0021]N
shift
=βN,β∈[

0.25,0.25][0022][0023]若时域抖动方向为向左,则为时域提前,表达式具体为:
[0024][0025]其中,β为时域抖动系数,为

0.25到0.25间的随机数,N为基带IQ数据长度。
[0026]可选的,所述对信号基带IQ数据进行数据增强时,采用基于能量计算的人工加噪,表达式具体为:
[0027][0028]P
addnoise
=P
x(n)
,γ∈(0,0.1][0029]x
addnoise
()=G(n)
×
P
addnoise
+x()
[0030]其中P
x(n)
为原始基带数据功率,γ为添加噪声功率与原始基带数据功率的比值系数,G(n)为与原始基带数据等长的均值为0,方差为1的正态分布随机序列。
[0031]可选的,所述对信号基带IQ数据进行数据增强时,采用基于小波变换的人工去噪,具体为:选取小波基函数为Harr基及分解层数为2,对信号原始基带数据进行小波分解,计算每一层的小波系数;对每一分解层采用固定阈值估计法设置全局阈值,按照设定的阈值对每一层的小波高阶系数进行软阈值处理;根据处理后的小波系数对信号进行重构,得到
去噪增强后的信号数据。
[0032]可选的,所述对信号基带IQ数据进行数据增强时,采用基于多相滤波器实现的信号重采样,具体为:采用先插值,再滤波,最后进行抽取的分数倍变采样处理流程,设重采样后采样率与原始信号采样率的比值关系为L/M,且L=100,M=δL,δ∈[

0.3,0.3],先将原始信号基带数据进行L倍上采样插值,再通过FIR低通滤波器进行滤波,再进行M倍抽取下采样,得到重采样L/M倍后的增强数据;其中,低通滤波器的截止频率为增益为L。
[0033]可选的,所述步骤S4,具体包括:根据样本数据的采样点数与智能信号识别算法设定的输入所需的采样点数之间的关系,每一条样本数据需选择进行如下三种操作之一:1)对数据点数大于算法输入所需5倍的数据样本进行定长切分,2)对数据点数大于算法输入所需1倍且小于5倍的数据样本从起始点处进行定长截取,3)对数据点数小于算法输入所需的数据样本先进行补零填充,获得算法所需的数据点数,再添加噪声,最终将所有扩充后的所有单信号、单突发时域波形数据样本转换为定长信号时域波形数据样本集。
[0034]可选的,所述方法还包括步骤S5:对处理后的定长信号时域波形数据样本集进行特征域变换;具体包括:采用短时傅里叶变换操作,对数据进行有重叠率的、从前往后的滑动窗操作,选择合适的窗函数限制窗内信号的时频域范围,计算每一时刻滑动窗内的信号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向信号识别深度学习模型训练的数据增强方法,其特征在于,所述方法包括以下步骤:S1:使用信号采集处理设备采集实际电磁环境下的基带信号样本数据;S2:对信号进行预处理,形成单信号时域样本集,并确认样本标签信息;S3:对单信号样本集进行多手段数据增强,形成扩充时域样本集;S4:根据信号识别算法所需数据点数,对扩充时域样本集按信号属性进行切片或截取操作,形成定长时域样本集;S5:根据信号识别算法输入时频图大小,对定长时域样本集进行短时傅里叶变换,形成可直接用于训练的数据增强后时域图像数据集。2.如权利要求1所述的面向信号识别深度学习模型训练的数据增强方法,其特征在于,所述步骤S2中,对信号进行预处理,分别在频域、时域对实际采集目标信号进行获取,具体包括:对实际采集数据进行频域获取时,通过下变频、滤波、抽取,形成信号中心频率对应0Hz,滤波带宽为信号带宽,抽取后信号采样率为四倍信号带宽的基带IQ数据,确保数据集单样本仅包含单一频点信号;对实际采集数据进行时域获取时,通过时域波形信号幅度的变化,找到信号的开始时间与结束时间,进行截取,形成多个单突发信号基带IQ数据,确保数据集单样本仅包含单一频点的单突发信号。3.如权利要求1所述的面向信号识别深度学习模型训练的数据增强方法,其特征在于,所述步骤S3,具体包括:采用信号重采样技术、频域抖动、时域抖动、人工加噪、人工去噪手段中的一种或多种,对信号基带IQ数据进行数据增强扩充并进行定长处理后,再通过特征域变换,采用短时傅里叶变换进行时频域的转换。4.如权利要求3所述的面向信号识别深度学习模型训练的数据增强方法,其特征在于,所述对信号基带IQ数据进行数据增强时,采用基于数字上、下变频的频域抖动,表达式具体为:f
shift
=αBw,α∈[

0.25,0.25]其中,x(n)为信号原始基带IQ数据,Bw为信号带宽,α是频域抖动系数,为

0.25到0.25间的随机数,x
fshift
(n)为随机频域抖动后的信号基带IQ数据,为基带IQ数据长度。5.如权利要求3所述的面向信号识别深度学习模型训练的数据增强方法,其特征在于,所述对信号基带IQ数据进行数据增强时,采用基于增添噪声点的时域抖动;若时域抖动方向为向右,则为时域延迟,表达式具体为:N
shift
=βN,β∈[

0.25,0.25]若时域抖动方向为向左,则为时域提前,表达式具体为:
其中,β为时域抖动系数,为

0.25到0.25间的随机数,N为基带IQ数据长度。6.如权利要求3所述的面向信号识别深度学习模型训练的数据增强方法,其特征在于,所述对信号基带IQ数据进行数据增强时,采用基于能量计算的人工加噪,表达式具体为:P
addnoise...

【专利技术属性】
技术研发人员:欧阳玫丹张宇阳解韦桐冯佳刘昊李贵
申请(专利权)人:中国电子科技集团公司第十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1