基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法技术

技术编号：42612953 阅读：7 留言：0更新日期：2024-09-03 18:19

本发明专利技术公开了一种基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，其包括1)建立用于对电子鼻数据进行分类的模型TS‑CATMA；2)对TS‑CATMA进行训练；3)使用训练得到的TS‑CATMA对电子鼻数据进行分类。本发明专利技术通过对抗训练所提出的TS‑CATMA模型，将训练得到的最终训练模型用于肺癌电子鼻数据分类，其不仅与传统MTSC方法相比具有显著优势，而且与现有InceptionTime、Resnet、FCN和LSTM‑FCN等深度学习方法相比，也是分类性能整体最优，在特异性和准确率方面具有明显优势，将其运用于肺癌筛查，能显著降低误诊率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及传感器数据分类技术，特别涉及一种肺癌电子鼻数据的分类方法。

技术介绍

1、肺癌(lung cancer,lc)是全球范围内发病率和死亡率最高的恶性肿瘤之一。根据世界卫生组织的统计，2020年全球新发肺癌病例约为228.2万例，死亡病例约为179.6万例。肺癌的高发病率和高死亡率，给患者、家庭和社会带来了沉重的负担。

2、肺癌的早期诊断对于提高患者生存率至关重要。目前，肺癌的常用诊断方法包括影像学检查(如胸部x线、ct等)、支气管镜检查、病理学检查等。然而，这些方法存在一些局限性，如影像学检查的假阳性率较高，支气管镜检查的创伤性较大，病理学检查需要进行组织活检，具有一定的风险。

3、电子鼻(electronic nose,e-nose)是一种模拟生物嗅觉系统的仪器，通过传感器阵列检测气体样本中的挥发性有机化合物(volatile organic compounds,vocs)，并结合模式识别算法对气体样本进行定性或定量分析。与传统的气相色谱-质谱联用(gaschromatography-mass spectrometry,gc-ms)等分析方法相比，电子鼻具有快速、便携、无需样品预处理等优点，在食品质量检测、环境监测、医疗诊断等领域具有广阔的应用前景。近年来，电子鼻在肺癌诊断领域受到了广泛关注。研究发现，肺癌患者呼出气体中的vocs组成与健康人存在显著差异，这为利用电子鼻进行肺癌筛查和诊断提供了可能。

4、尽管已有多篇基于电子鼻技术的肺癌检测研究发表，然而其准确率仍然较低，导致漏诊

5、肺癌电子鼻收集的肺癌数据是一种多维时间序列(multivariate time series,mts)数据，因此提高mts的分类性能是提高肺癌诊断准确性的关键。传统mts分类方法往往需要先提取特征再进行分类，特征工程比较复杂，难以自动建模多维变量之间复杂的交互关系，并且针对高维数据训练耗时；深度学习方法虽然能自动学习特征表示，但是需要大量标注数据训练，对于样本量较小的肺癌数据，深度模型容易出现过拟合，泛化性能较差，同时对mts中时空信息的提取能力仍然有限。

技术实现思路

1、有鉴于此，本专利技术的目的是提供一种基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，以解决提高肺癌电子鼻数据分类准确率的技术问题。

2、本专利技术基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法包括步骤：

3、1)建立用于对电子鼻数据进行分类的模型ts-catma，所述ts-catma包括特征提取器、标签分类器和域分类器，特征提取器和标签分类器组成分类网络；

4、所述特征提取器包括依次连接的主干网络、多尺度注意力模块和neck网络，所述特征提取器用于从电子鼻数据中提取特征；

5、所述标签分类器用于接收特征提取器输出的特征表示，并预测样本所属的类别标签；

6、所述域分类器同样接收特征提取器输出的特征表示，并区分样本来自源域还是目标域；

7、2)对ts-catma进行训练：

8、a)将训练数据作为源域数据、将测试数据作为目标域数据分别输入特征提取器；其中m表示输入样本，y表示标签，上标tr和te分别表示训练集和测试集，下标表示样本编号；定义di为第i个训练样本的域标签，其中di∈{0，1}，若xi～mtr，则di＝0；反之若xi～mte，则di＝1；

9、b)进行对抗训练：先固定特征提取器gf和标签预测器gy，优化域分类器gd来最大化lall，即最小化然后固定域分类器gd，优化gf和gy来最小化lall，即最小化最大化通过对抗训练，特征提取器gf学习提取域不变的特征，使得域分类器gd无法区分源域和目标域样本；同时，标签预测器gy在源域上进行监督学习，学习如何根据域不变特征进行分类；最终得到一个在目标域上泛化的分类模型；

10、其中，lall是总损失函数：

11、

12、其中，是标签分类任务的损失函数，是域分类任务的损失函数；参数λ是一个超参数，用于平衡两个损失函数的重要性；n是训练数据集的数量，n是训练数据集和测试数据集的总数量；

13、使用交叉熵函数计算，用于源域数据的分类任务：

14、

15、使用二元交叉熵损失函数计算，用于区分源域和目标域的数据：

16、

17、3)使用步骤2)训练得到的ts-catma对电子鼻数据进行分类。

18、进一步，所述主干网络包括依次连接的第一特征提取块、第二特征提取块和第三特征提取块，

19、所述第一特征提取块由一个一维卷积层、一个批量归一化层和一个relu激活层组成，卷积层的卷积核的尺寸为7；第一特征提取块以电子鼻数据作为输入；

20、所述第二特征提取块由一个一维卷积层、一个批量归一化层和一个relu激活层组成，卷积层的卷积核的尺寸为5；第二特征提取块以第一特征提取块的输出作为输入；

21、所述第三特征提取块由一个一维卷积层和一个批量归一化层组成，卷积层的卷积核的尺寸为3；第三特征提取块以第二特征提取块的输出作为输入；

22、所述主干网络还包括和一个残差连接块，所述残差连接块由一个一维卷积层和一个批量归一化层组成，残差连接块以电子鼻数据作为输入；

23、第三特征提取块的输出和残差连接块的输出相加后作为多尺度注意力模块的输入。

24、进一步，所述多尺度注意力模块通过如下步骤捕捉多尺度特征：

25、(1)将主干网络输出的特征x跨通道维度方向划分，使得特征在每个组内分布均匀，以学习不同的语义信息；对特征x在通道维度上进行分组表示如下：

26、x＝[x1，x2，...，xg] (4)

27、其中：其中c为序列通道数，l为序列长度；g为分组数，每组特征

28、(2)采用三个并行支路来提取各组特征的注意力权重；其中第一条支路使用1×1卷积核，第二条支路使用1×3卷积核，第三条支路使用1×5卷积核，以获取不同感受野的特征；对于第i组特征xi，定义一个1×1卷积分支、一个1×3卷积分支和一个1×5卷积分支：

29、

30、其中，表示1×1卷积分支的输出，表示1×3卷积分支的输出，表示1×5卷积分支的输出，conv1×1为1×1卷积层，conv1×3为1×3卷积层，conv1×5为1×5卷积层；

31、(3)利用全局平均池化对三个支路的输出分别进行特征通道的信息编码，并使用softmax进行变本文档来自技高网...

【技术保护点】

1.一种基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，其特征在于：包括步骤：

2.根据权利要求1所述的基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，其特征在于：所述主干网络包括依次连接的第一特征提取块、第二特征提取块和第三特征提取块，

3.根据权利要求1所述的基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，其特征在于：所述多尺度注意力模块通过如下步骤捕捉多尺度特征：

4.一种肺癌电子鼻数据分类智能机器系统，其特征在于：装载有权利要求1所述的TS-CATMA模型。

【技术特征摘要】

1.一种基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，其特征在于：包括步骤：

2.根据权利要求1所述的基于对抗训练和多尺度注意力的肺癌电子鼻数据分类方法，其特征在于：所述主干网络包括依次连接的第一特征提取块、第二特征提取块和第三特征提取块，<...

【专利技术属性】
技术研发人员：刘然，陈宇泽，毛虎，田逢春，王仕丹，夏江伟，杨帅，胡腾月，游忠宇，孙佳怡，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人