一种基于改进生成对抗网络的TSFS样本生成方法技术

技术编号：44676956 阅读：4 留言：0更新日期：2025-03-19 20:29

一种基于改进生成对抗网络的TSFS样本生成方法，所述方法包括以下步骤：步骤1：使用三维荧光光谱仪获取样品TSFS数据；步骤2：构建带有卷积注意力机制的CA‑WGAN‑GP优化模型，对原始TSFS样本进行数据增强；步骤3：在模型训练阶段，每经过一定次数的训练epoch，存储一次生成的数据，利用多个训练阶段的生成器模型，使生成样本覆盖面具有更高多样性；步骤4：使用预训练的CNN模型提取增强后的样本特征，使用线性判别分析LDA将样本特征投影，并根据马氏距离和设定的阈值初步筛选样本；步骤5：使用K‑means算法二次筛选以获取最终的训练样本集。本发明专利技术有效解决了TSFS样本获取的耗时耗力问题，并减少了模型过拟合现象，增加了对未知数据的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习，具体涉及一种基于改进生成对抗网络的tsfs样本生成方法。

技术介绍

1、tsfs技术在扫描过程中需要保持激发光和发射光波长之间的固定间隔(δλ)，这要求在宽波长范围内进行同步扫描。为了精确捕捉样品在多个激发和发射波长下的复杂特征，通常采用较小的波长步长进行高分辨率扫描。这种高分辨率的同步扫描显著增加了数据采集的点数，延长了总实验时间。此外，为了提高信噪比，必须在每个波长位置进行较长的积分时间，以增强信号强度并获得更佳的信噪比。这些技术要求使得tsfs样本的获取过程比传统荧光光谱技术耗时更长。

2、同时，tsfs技术旨在产生更尖锐和更窄的光谱，以有效消除光散射干扰。这需要对荧光信号进行精确的测量和处理，可能涉及多次扫描或信号平均化处理，进一步增加了实验时间。样品本身的特性也可能影响数据获取时间：对于具有复杂荧光特性或弱荧光强度的样品，需要更长的测量时间以获得足够的信号强度和分辨率。因此，技术要求和样品特性的综合影响使得tsfs样本的获取通常需要较长的时间。

技术实现思路

1、针对上述tsfs样本采集耗时的技术问题，本技术方案提供了一种基于改进生成对抗网络的tsfs样本生成方法，通过无监督学习掌握随机噪声与真实样本训练集之间的映射关系，用于生成高质量的tsfs样本，从而有效减少了获取tsfs样本所需的时间和资源；有效的解决上述问题。

2、本专利技术通过以下技术方案实现：

3、一种基于改进生成对抗网络的tsfs样本生成方法，所述方法包括以下步骤：

4、步骤1：使用三维荧光光谱仪获取样品tsfs数据；

5、步骤2：构建带有卷积注意力机制的ca-wgan-gp优化模型，对原始tsfs样本进行数据增强；所述的ca-wgan-gp优化模型由生成器generator和判别器discriminator构成，生成器generator包括线性层、卷积转置块、自注意力机制和残差块；判别器discriminator包括线性层和小批量判别层；

6、步骤3：在模型训练阶段，每经过一定次数的训练epoch，存储一次生成的数据，利用多个训练阶段的生成器模型，使生成样本覆盖面具有更高多样性；

7、步骤4：使用预训练的cnn模型提取增强后的样本特征，使用线性判别分析lda将样本特征投影，并根据马氏距离和设定的阈值初步筛选样本；

8、步骤5：使用k-means算法二次筛选以获取最终的训练样本集。

9、进一步的，步骤1所述的tsfs数据在扫描过程中保持激发光和发射光波长之间的固定间隔δλ。

10、进一步的，步骤2中所述生成器generator包含的线性层用于特征映射，自注意力机制捕捉数据中的长程依赖关系，残差块通过短路连接帮助生成更稳定的特征；卷积转置块通过反向卷积逐步增加特征图的尺寸，并引入高斯噪声以增强样本的多样性和鲁棒性；随后，标准卷积层、relu激活函数和批归一化层对生成特征进行后处理，引入非线性并稳定训练过程。

11、进一步的，步骤2中所述的生成器generator在设计时，首先通过噪声和标签嵌入来构建输入，噪声向量通过标准正态分布生成，而标签通过嵌入层转换为一个固定维度的向量，使得生成器能够根据标签生成特定类别的样本；再将噪声与标签嵌入拼接后，通过全连接层进行初步特征映射，再利用转置卷积层逐步放大特征维度，使其最终与真实数据维度匹配；并为了防止生成的样本过于单一或噪声过大，每个卷积层后都加入了高斯噪声层；同时，由残差块进一步增强生成器generator的特征表达能力，同时由自注意力机制捕捉输入数据的全局信息，确保生成样本具有长距离依赖关系，生成更具一致性和多样性的样本；最后，生成器generator的输出通过tanh激活函数将结果限制在合理范围内。

12、进一步的，步骤2中所述判别器discriminator包含的线性层逐步缩小数据维度，通过leaky relu激活函数引入非线性，使模型能够更好地捕捉复杂特征；小批量判别层则用于增强判别器对小批量样本的敏感性，提高对生成样本和真实样本的区分能力。

13、进一步的，步骤2中所述的判别器discriminator在设计时，旨在区分生成器generator生成的假样本和真实样本；通过标签嵌入层将标签信息与输入数据拼接在一起，使判别器discriminator能够同时处理数据和标签信息；在全连接网络中，通过多层线性变换和leakyrelu激活函数进行非线性映射，逐渐压缩输入数据的特征，并输出一个标量，表示输入数据的真实性；同时，为了防止生成器生成高度相似的样本，引入小批量判别层，计算批次内样本之间的差异性，确保判别器discriminator能够识别不同生成样本之间的微小差异；使得判别器discriminator能够提供有效的监督信号，帮助生成器generator生成更多样化和逼真的样本。

14、进一步的，在步骤3所述的模型训练阶段，生成器generator与判别器discriminator通过竞争机制共同训练，随着训练的进行，到达某个时刻之后，尽管损失趋于稳定，但不同时刻的模型仍具有一定程度的多样性，很难选择最佳模型。所以每经过一定次数的训练epoch，存储一次生成的数据，利用多个训练阶段的生成器模型，来生成具有更高多样性的样本，有效提升生成样本的多样性和覆盖面；

15、进一步的，在步骤3所述的在模型训练阶段，将步骤1所述的tsfs数据被划分为训练集、验证集和测试集，仅使用训练数据进行数据增强；在训练和优化过程中，生成器generator和判别器discriminator使用不同的学习率来达到各自的最优效果；生成器generator使用较高的学习率，确保在每个更新步骤中快速生成逼真的样本，而判别器discriminator使用较低的学习率，以保证对假样本的稳定判断；训练时，判别器discriminator的更新频率要远高于生成器generator，以保持判别器discriminator的优势地位，从而为生成器generator提供有效的学习反馈；每个训练周期中，生成器generator的损失通过最大化判别器discriminator的误判概率来改进生成样本，而判别器discriminator则通过最大化真实样本的评分和最小化生成样本的评分来提升其区分能力；在模型的训练过程中，生成器generator和判别器discriminator的损失被记录下来，以帮助分析模型的训练状态，并通过绘制损失曲线了解生成和判别的博弈情况；并在损失曲线稳定后，生成器generator每间隔一定的训练epoch保存一次模型，通过实际输出进行模型超参数调整。

16、进一步的，步骤4所述的马氏距离用于样本第一次筛选，ca-wgan-gp优化模型中样本选择策略首先将原始数据集划分为训练集、验证集和测试集；训练集中的图像数据使用预训练的cnn模型(例如vgg16、resnet50等)进行特征提取，并转换为特征向量；使用线性本文档来自技高网...

【技术保护点】

1.一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：所述方法包括以下步骤：

2.根据权利要求1所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：步骤1所述的TSFS数据在扫描过程中保持激发光和发射光波长之间的固定间隔。

3.根据权利要求1所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：步骤2中所述生成器Generator包含的线性层用于特征映射，自注意力机制捕捉数据中的长程依赖关系，残差块通过短路连接帮助生成更稳定的特征；卷积转置块通过反向卷积逐步增加特征图的尺寸，并引入高斯噪声以增强样本的多样性和鲁棒性；随后，标准卷积层、ReLU激活函数和批归一化层对生成特征进行后处理，引入非线性并稳定训练过程。

4.根据权利要求1或3所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：步骤2中所述的生成器Generator在设计时，首先通过噪声和标签嵌入来构建输入，噪声向量通过标准正态分布生成，而标签通过嵌入层转换为一个固定维度的向量，使得生成器能够根据标签生成特定类别的样本；再将噪声与标签嵌入拼

5.根据权利要求1所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：步骤2中所述判别器Discriminator包含的线性层逐步缩小数据维度，通过Leaky ReLU激活函数引入非线性；小批量判别层则用于增强判别器对小批量样本的敏感性。

6.根据权利要求1或5所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：步骤2中所述的判别器Discriminator在设计时，旨在区分生成器Generator生成的假样本和真实样本；通过标签嵌入层将标签信息与输入数据拼接在一起；在全连接网络中，通过多层线性变换和LeakyReLU激活函数进行非线性映射，逐渐压缩输入数据的特征，并输出一个标量；同时，引入小批量判别层，计算批次内样本之间的差异性，确保判别器Discriminator能够识别不同生成样本之间的微小差异。

7.根据权利要求1所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：在步骤3所述的模型训练阶段，生成器Generator与判别器Discriminator通过竞争机制共同训练，具体的为：将步骤1所述的TSFS数据被划分为训练集、验证集和测试集，仅使用训练数据进行数据增强；在训练和优化过程中，生成器Generator和判别器Discriminator使用不同的学习率来达到各自的最优效果；生成器Generator使用较高的学习率，判别器Discriminator使用较低的学习率；训练时，判别器Discriminator的更新频率要高于生成器Generator；每个训练周期中，生成器Generator的损失通过最大化判别器Discriminator的误判概率来改进生成样本，而判别器Discriminator则通过最大化真实样本的评分和最小化生成样本的评分来提升其区分能力；在模型的训练过程中，生成器Generator和判别器Discriminator的损失被记录下来，并通过绘制损失曲线了解生成和判别的博弈情况；并在损失曲线稳定后，生成器Generator每间隔一定的训练epoch保存一次模型，通过实际输出进行模型超参数调整。

8.根据权利要求1所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：步骤4所述的马氏距离用于样本第一次筛选，CA-WGAN-GP优化模型中样本选择策略首先将原始数据集划分为训练集、验证集和测试集；训练集中的图像数据使用预训练的CNN模型进行特征提取，并转换为特征向量；使用线性判别分析LDA将样本特征投影；根据马氏距离对每个类别的样本进行初步筛选；通过设定阈值，过滤掉在训练集特征空间中远离每个类别中心的样本；使用预训练的CNN模型提取每张图像的深度特征，然后根据类别计算特征的均值向量和协方差矩阵，进而通过马氏距离衡量每个样本与其类别中心的距离；为了评估样本的分布情况，模型计算每个类别中所有样本的马氏距离，并通过可视化工具展示每个类别的样本分布，直观显示出与类别中心距离较大的样本，便于进一步进行样本筛选和优化模型。

9.根据权利要求8所述的一种基于改进生成对抗网络的TSFS样本生成方法，其特征在于：所述...

【技术特征摘要】

1.一种基于改进生成对抗网络的tsfs样本生成方法，其特征在于：所述方法包括以下步骤：

2.根据权利要求1所述的一种基于改进生成对抗网络的tsfs样本生成方法，其特征在于：步骤1所述的tsfs数据在扫描过程中保持激发光和发射光波长之间的固定间隔。

3.根据权利要求1所述的一种基于改进生成对抗网络的tsfs样本生成方法，其特征在于：步骤2中所述生成器generator包含的线性层用于特征映射，自注意力机制捕捉数据中的长程依赖关系，残差块通过短路连接帮助生成更稳定的特征；卷积转置块通过反向卷积逐步增加特征图的尺寸，并引入高斯噪声以增强样本的多样性和鲁棒性；随后，标准卷积层、relu激活函数和批归一化层对生成特征进行后处理，引入非线性并稳定训练过程。

4.根据权利要求1或3所述的一种基于改进生成对抗网络的tsfs样本生成方法，其特征在于：步骤2中所述的生成器generator在设计时，首先通过噪声和标签嵌入来构建输入，噪声向量通过标准正态分布生成，而标签通过嵌入层转换为一个固定维度的向量，使得生成器能够根据标签生成特定类别的样本；再将噪声与标签嵌入拼接后，通过全连接层进行初步特征映射，再利用转置卷积层逐步放大特征维度，使其最终与真实数据维度匹配；并将每个卷积层后都加入了高斯噪声层；同时，由残差块进一步增强生成器generator的特征表达能力，同时由自注意力机制捕捉输入数据的全局信息；最后，生成器generator的输出通过tanh激活函数将结果限制在合理范围内。

5.根据权利要求1所述的一种基于改进生成对抗网络的tsfs样本生成方法，其特征在于：步骤2中所述判别器discriminator包含的线性层逐步缩小数据维度，通过leaky relu激活函数引入非线性；小批量判别层则用于增强判别器对小批量样本的敏感性。

6.根据权利要求1或5所述的一种基于改进生成对抗网络的tsfs样本生成方法，其特征在于：步骤2中所述的判别器discriminator在设计时，旨在区分生成器generator生成的假样本和真实样本；通过标签嵌入层将标签信息与输入数据拼接在一起；在全连接网络中，通过多层线性变换和leakyrelu激活函数进行非线性映射，逐渐压缩输入数据的特征，并输出一个标量；同时，引入小批量判别层，计算批次内样本之间的差异性，确保判别器discriminator能够识别不同生成样本之间的微小差异。

7.根据权利要...

【专利技术属性】
技术研发人员：王晓燕，汪涛，李世烽，季仁东，黄玲，王政伟，秦海淋，陈会昌，
申请(专利权)人：淮阴工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人