基于肺部CT与5hmC标志物融合的肺结节分类方法及产品技术

技术编号:38017383 阅读:16 留言:0更新日期:2023-06-30 10:44
本发明专利技术实施例中提供一种基于肺部CT与5hmC标志物融合的肺结节分类方法及产品,该方法:基于肺结节患者肺部CT影像而获得用于肺结节分类鉴别的影像特征,并将影像特征输入第一分类预测模型,得到第一分类预测结果;基于肺结节患者的血浆cfDNA的5

【技术实现步骤摘要】
基于肺部CT与5hmC标志物融合的肺结节分类方法及产品


[0001]本专利技术涉及医疗影像处理技术、基因甲基化标志物检测技术与人工智能技术,特别涉及一种基于肺部CT与5hmC标志物融合的肺结节分类方法及产品。

技术介绍

[0002]肺癌是所有恶性肿瘤中最常见最致命的一种。早期肺癌检出率低于25%,但是早期肺癌5年生存率达到70%,不过由于肺癌的早期特征不明显,采用影像学手段(如低剂量CT),存在假阳性率过高的问题,只有通过定期随访比较肺结节的外部特征和内部特征,才能够提高准确率;但是,CT 检查毕竟含有一定量的辐射,高频率多次的检查可能会对身体造成额外的损伤。
[0003]由于肿瘤细胞会主动(分泌)或被动(细胞凋亡或坏死)地将核酸分子释放到血液中,即循环肿瘤 DNA (circulating tumor DNA, ctDNA)。由于ctDNA 能更全面地反映肿瘤细胞的全局;所以,近年来,基于血液的液态活检逐渐成为癌症早筛和早诊的一种重要手段;同时,已有很多研究指出,DNA 羟甲基化与癌症的发生密切相关,将DNA羟甲基化相关的生物标志物用于癌症的早期筛查和诊断具有较好的前景,但目前尚缺乏高灵敏度和特异性的肿瘤标志物。
[0004]随着人工智能的广泛应用,利用人工智能技术辅助临床高效且准确鉴别肺结节,能够很大程度地降低临床医生的工作强度,并改善漏诊和误诊情况。然而目前,单维度的肺结节良恶性分类模型的灵敏度和准确率很难显著提高,比如基于CT影像的肺结节良恶性分类方法,主要通过不同的分类模型和不同的特征提取方式的改进,来提高分类灵敏度和准确率;比如基于影像组学和生物组学的肺结节良恶性分类模型已被认为是进一步提高分类灵敏度和准确率的有力手段,但仍处于研究探索阶段。

技术实现思路

[0005]本专利技术实施例中提供了一种基于肺部CT与5hmC标志物融合的肺结节分类方法,能够结合基于肺部CT影像而获得的影像特征与基于5hmC(5

hydroxymethylcytosine,即5

羟甲基胞嘧啶)测序结果而获得的标志物特征共同作用于肺结节分类预测,可提高肺结节分类预测准确率。
[0006]本专利技术的第一方面,提供一种基于肺部CT与5hmC标志物融合的肺结节分类方法,该方法包括以下步骤:基于肺结节患者肺部CT影像而获得用于肺结节分类鉴别的影像特征,并将所述影像特征输入第一分类预测模型,得到第一分类预测结果;基于所述肺结节患者的血浆cfDNA(circulating free DNA或循环游离DNA)的5hmC测序结果而获得用于肺结节分类鉴别的标志物特征,并将所述标志物特征输入第二分类预测模型,得到第二分类预测结果;将所述第一分类预测结果和所述第二分类预测结果输入至第三分类预测模型,得
到肺结节分类预测结果。
[0007]在一些可能的实施例中,基于肺结节患者肺部CT影像而获得用于肺结节分类鉴别的影像特征包括以下步骤:S1:基于肺部CT影像中肺结节的完整空间信息,生成用于包含对应肺结节的完整空间信息的正方体空间;S2:将所述正方体空间切分为若干个同等大小的正方体子空间,并获取经过每个所述正方体子空间中心的横切面、纵切面以及矢状切面;S3:对所述正方体空间内各个所述正方体子空间对应的横切面、纵切面以及矢状切面进行向量化,得到具有连贯性的浅特征;S4:将所述浅特征输入至具有至少一个注意力池化模块的第一神经网络进行特征提取,得到用于肺结节分类鉴别的影像特征。
[0008]在本实施例中,通过将肺部CT影像中每个肺结节的完整空间信息进行分块处理,并将肺结节的各个分块的不同切面信息进行向量化,再利用具有注意力机制的池化模块的神经网络进行特征提取,从而提取到更多具有代表性的用于肺结节分类鉴别的影像特征,应用在第一分类预测模型的训练过程中能够增强学习到信息的有效性,并降低模型的训练难度。
[0009]在一些可能的实施例中,基于所述肺结节患者的血浆cfDNA的5hmC测序结果而获得用于肺结节分类鉴别的标志物特征包括以下步骤:基于所述肺结节患者的血浆cfDNA的5hmC测序结果,获得被选定作为5hmC标志物的多个标志物的测序信号的峰值信息;基于所述多个标志物的测序信号的峰值信息,对所述多个标志物的测序信号峰值位置进行读段计数;根据每个标志物的测序信号峰值位置的读段数值,构建出作为所述标志物特征的多维向量。
[0010]进一步地,选定作为5hmC标志物的多个标志物包括以下步骤:基于多个良性肺结节样本和多个恶性肺结节样本的血浆cfDNA的5hmC测序结果,生成对应BED文件;对所述BED文件执行Callpeak命令,获取每个样本的测序信号的Peak信息,并生成每个样本对应的测序信号峰值位置集合;对每个样本的测序信号峰值位置集合进行去重处理,使测序信号峰值位置集合内的测序信号峰值位置无重叠;合并所有样本的测序信号峰值位置集合,得到第一测序信号峰值位置集合,并对所述第一测序信号峰值位置集合进行去重处理,得到第二测序信号峰值位置集合;筛除所述第二测序信号峰值位置集合中与全部良性肺结节样本或全部恶性肺结节样本对应的样本测序信号峰值集合存在交集的比例未达到设定阈值的测序信号峰值位置,得到第三测序信号峰值集合;对所述第三测序信号峰值集合中的测序信号峰值位置进行读段计数,并对测序信号峰值位置的读段数值进行标准化后,对每个测序信号峰值位置的读数数量进行秩和检验,得到每个测序信号峰值位置的q

value;
基于q

value 排名靠前多个的测序信号峰值位置构建第四测序信号峰值集合,并以所述第四测序信号峰值集合中各个测序信号峰值位置的读段数值为自变量,以肺结节的良性或恶性为因变量,筛选出所有与因变量具有相关性的测序信号峰值位置作为5hmC标志物。
[0011]在本实施例中,通过选定高灵敏度和特异性的标志物,能够提高第二分类预测模型的肺结节分类预测准确率。
[0012]如此,本专利技术结合基于肺部CT影像而获得的影像特征与基于5hmC测序结果而获得的标志物特征共同作用于肺结节分类预测,可提高肺结节分类预测准确率。
[0013]本专利技术的第二方面,提供一种肺结节分类装置,其包括:一个或多个处理器;以及,用于存储可执行指令的存储器;所述一个或多个处理器,用于从所述存储器中读取所述可执行指令,并执行所述可执行指令以实现本专利技术的第一方面提供的基于肺部CT与5hmC标志物融合的肺结节分类方法。
[0014]本专利技术的第三方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被一个或多个处理器执行时实现本专利技术第一方面提供的基于肺部CT与5hmC标志物融合的肺结节分类方法。
附图说明
[0015]图1为本专利技术实施例提供的肺结节分类方法的流程示意图;图2为本专利技术实施例提供的获取影像特征的流程示意图;图3为本专利技术实施例提供的获得第一分类预测结果的工作过程的示意图;图4为本专利技术实施例提供的第一神经网络的工作过程的示意图;图5为本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,包括:基于肺结节患者肺部CT影像而获得用于肺结节分类鉴别的影像特征,并将所述影像特征输入第一分类预测模型,得到第一分类预测结果;基于所述肺结节患者的血浆cfDNA的5hmC测序结果而获得用于肺结节分类鉴别的标志物特征,并将所述标志物特征输入第二分类预测模型,得到第二分类预测结果;将所述第一分类预测结果和所述第二分类预测结果输入至第三分类预测模型,得到肺结节分类预测结果。2.如权利要求1所述的基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,基于肺结节患者肺部CT影像而获得用于肺结节分类鉴别的影像特征包括以下步骤:S1:基于肺部CT影像中肺结节的完整空间信息,生成用于包含对应肺结节的完整空间信息的正方体空间;S2:将所述正方体空间切分为若干个同等大小的正方体子空间,并获取经过每个所述正方体子空间中心的横切面、纵切面以及矢状切面;S3:对所述正方体空间内各个所述正方体子空间对应的横切面、纵切面以及矢状切面进行向量化,得到具有连贯性的浅特征;S4:将所述浅特征输入至具有至少一个注意力池化模块的第一神经网络进行特征提取,得到用于肺结节分类鉴别的特征。3.如权利要求2所述的基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,在步骤S3中,采用第二神经网络对所述正方体空间内各个所述正方体子空间对应的横切面、纵切面以及矢状切面进行向量化;其中,所述浅特征的表达式为:;其中,为第i个正方体空间的第m个正方体子空间的特征向量,其包含,其中,为第m个三维正方体子空间的横切面信息,为第m个三维正方体子空间的纵切面信息,为第m个三维正方体子空间的矢状面信息。4.如权利要求3所述的基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,所述第一神经网络进行特征提取包括以下步骤:S401:将所述浅特征输入至第一注意力池化模块进行注意力池化操作,而得到第一状态浅特征;S402:将所述第一状态浅特征输入至多层感知机进行特征映射,而得到第二状态浅特征;S403:将所述第二状态浅特征输入至第二注意力池化模块进行注意力池化操作,而得到第三状态浅特征;S404:将所述第三状态浅特征输入至Transformer模块进行特征提取,得到用于肺结节分类鉴别的特征。5.如权利要求4所述的基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,所述步骤S404中,所述Transformer模块进行特征提取的方式为:对输入的所述第三状态浅特征分别进行Patch Embedding和Position Embedding,并将经Patch Embedding和Position Embedding处理的结果相叠加后输入至Transformer Encoder,得到用于肺结节
分类鉴别的影像特征。6.如权利要求4所述的基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,所述注意力池化操作包括:计算输入的特征中每个特征向量的注意力得分,并将输入的特征中每个特征向量与其注意力的乘积求和,得到输出的特征。7.如权利要求1所述的基于肺部CT与5hmC标志物融合的肺结节分类方法,其特征在于,基于所述肺结节患者的血浆cfDNA的5hmC测序结果而获得用于肺结节分类鉴别的标志物特征包括以下步骤:基于所述肺结节患者的血浆cfDNA的5hmC测序结果,获得被选定作为5hmC标志物的多个标志物的测序信号的峰值信息;基于所述多个标志物的测序信号的...

【专利技术属性】
技术研发人员:钟晟郑杰张俊叶伟星任翔严晓芹胡文刘丹
申请(专利权)人:成都泰莱生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1