System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于PCCTrans的医学图像分割方法技术_技高网

一种基于PCCTrans的医学图像分割方法技术

技术编号:41786621 阅读:2 留言:0更新日期:2024-06-24 20:14
本发明专利技术提出了一种基于PCCTrans的医学图像分割方法。该方法包括:第一,将医学图像分别经过两次下采样方法,得到三组不同尺寸大小的图像并输入到网络模型的前三层解码器;第二,本发明专利技术构建了分割模型PCCTrans,浅层编码器和解码器由提出的Contextual Transformer和卷积并行混合模块构建;第三,深层编码器和解码器由提出的Fully Convolutional Transformer和卷积并行混合模块构建;第四,将U型网络中的普通跳跃连接更换为挤压和激发注意力跳跃连接,增强网络对输入特征图中不同通道的关注;第五,在解码器的最后,使用提出的多尺度融合输出模块,融合模型学习到的特征以提升分割效果。本发明专利技术中的网络模型采用全并行结构,独立构建分层局部和全局表示,并在每个阶段融合它们,充分发挥CNN和Transformer的潜力。实验结果表明,所述基于PCCTrans的医学图像分割方法在各种医学图像分割任务上相对于其他竞争方法的优越性,能够实现不同器官的精准分割。

【技术实现步骤摘要】

本专利技术属于图像分割,具体地讲,设计一种基于pcctrans的医学图像分割方法,实现不同器官的精准分割。


技术介绍

1、医学图像分割在现代医学领域中扮演着至关重要的角色,它根据特定的相似性特征将医学图像划分为不同的区域。通过准确分割出图像中的组织、器官或病变区域,医学图像分割为医生和研究人员提供了深入洞察和全面理解疾病状态的机会。为临床诊断、治疗规划和疾病研究提供了无可替代的信息。随着深度学习技术的迅猛发展,自动化医学图像分割成为了提高效率和精度的关键手段。然而,由于医学图像的复杂性和多样性,传统的分割模型在应对这些挑战时仍然存在一系列限制,如复杂结构难以捕捉、缺乏上下文信息、边缘模糊以及难以兼顾全局和局部信息。这些限制大大增加了医学图像分割的难度和复杂性。

2、得益于深度学习出色的表征学习能力,基于编码器-解码器的网络(如全卷积网络)、u型结构(如u-net)的兴起,卷积神经网络(convolutional neural network,cnn)在医学图像分割任务中取得了显著的成功。许多优秀的u型网络模型(如3d u-net、v-net、resunet++、unet++、unet3+和attention u-net)不断涌现,不断刷新各种分割任务的性能上限。在这两种结构中,都采用跳转连接来体现编码器和解码器路径分别提供的高级和细粒度特征。尽管cnn模型在各种计算机视觉任务中取得了成功,但由于其有限的感受野和固有的归纳偏差,其性能受到了限制。上述原因阻碍了cnn在图像中建立全局上下文和长距离依赖关系,因此限制了其在图像分割中的表现。

3、研究者提出了各种方法来为cnn添加全局上下文,其中最著名的是引入注意力机制和扩大卷积核以增加核的感受野。不过,这些方法都有各自的缺点。如果卷积运算仍然是网络架构的核心,则无法从根本上解决这个问题。transformer能够高效处理长距离序列依赖关系,因此在语言学习任务中取得了巨大成功。这促使它们最近被应用于各种视觉任务。其中,vision transformer(vit)将图像分割成一系列标记,并通过堆叠的transformer块对其全局关系进行建模,给计算机视觉(computer vision,cv)领域带来了革命性的变化。但需要大量数据才能泛化,而且具有二次复杂性。swin transformer可以在可移动窗口中以较低的计算复杂度生成分层特征表示,在各种cv任务中取得了最先进的性能。但自我关注机制会导致低级特征缺失。由于医学图像数据集的规模远远小于上述作品中预训练所使用的数据集(如imagenet-21k和jft-300m),而且医学图像并不总是可用的,需要专业注释。因此,transformer在医学图像分割方面的表现并不令人满意。与此同时,出现了许多由cnn和transformer组合而成的混合结构,特别是医学图像分割中的transunet和levit-unet,它们利用cnn的局部性和transformer的长程依赖性来编码全局和局部特征。然而,这些方法存在一些障碍,使其无法获得更高的性能:

4、1)它们无法在保持特征一致性的同时有效地结合低层次和高层次特征;

5、2)它们没有充分利用邻近关键字之间的丰富上下文;

6、3)串行结构无法使卷积和注意力贯穿整个网络架构,导致难以连续建模局部和全局表示。


技术实现思路

1、本专利技术的目的在于克服现有技术的不足,提出一种基于pcctrans的医学图像分割方法,用于准确分割医学图像。

2、为了实现上述目的,本专利技术所采用的技术方案如下。

3、基于pcctrans的医学图像分割方法,具体实现步骤如下:

4、步骤一,将医学图像分别经过两次下采样方法,得到三组不同尺寸大小的图像并输入到网络模型的前三层解码器;

5、步骤二,本专利技术构建了分割模型pcctrans,浅层编码器和解码器由提出的contextual transformer和卷积并行混合模块(cot&conv并行混合模块)构建;

6、步骤三,深层编码器和解码器由提出的fully convolutional transformer和卷积并行混合模块(fct&conv并行混合模块)构建;

7、步骤四,将u型网络中的普通跳跃连接更换为挤压和激发注意力跳跃连接,增强网络对输入特征图中不同通道的关注;

8、步骤五,在解码器的最后,使用提出的多尺度融合输出(multiscale fusion,msf)模块,融合模型学习到的特征以提升分割效果。

9、在步骤一中,所述多尺度图像输入具体为:原始图像分别经过不同的下采样倍数得到多尺度图像,作为前三层编码器的输入。目的是突出显示不同类别和不同尺度下较小的感兴趣区域(region ofinterest,roi)特征。

10、在步骤二中,所述本专利技术构建了分割模型pcctrans,浅层编码器和解码器由提出的contextual transformer和卷积并行混合模块(cot&conv并行混合模块)构建。cot&conv并行混合模块包括:

11、cot&conv并行混合模块应用在编码器的前两层和解码器的后两层。cot&conv并行混合模块与前两层编码器中较大的尺寸输入形成高度适配。cot&conv并行混合模块接收较大尺寸的图像输入进行提取静态和动态上下文表征信息。

12、具体来说,输入二维特征图查询、键和值分别定义为q=x,k=x和v=xwv。首先对k×k网格内的所有相邻键进行k×k组卷积,在空间上对每个键进行上下文表示。学习到的上下文键自然反映了局部邻键之间的静态上下文信息,将k1作为输入x的静态上下文表示。之后,以上下文键k1和查询q的串联为条件,通过两个连续的1×1卷积(带relu激活函数的wθ和不带激活函数的wδ)实现注意力矩阵:

13、attention=wδ(wθ(concat(k1,q)))

14、对于每个头部,attenion的每个空间位置上的局部注意力矩阵都是基于查询特征和上下文化的关键特征来学习的,而不是孤立的查询-关键对。这种方法通过挖掘出的静态上下文k1的额外指导来增强自我注意力学习。接下来,根据上下文的注意力矩阵attenion,通过聚合所有值v计算出被注意力特征图k2:

15、

16、鉴于被注意的特征图k2能够捕捉输入之间的动态特征交互,将k2命名为输入的动态上下文表示。因此,cot模块的最终输出是通过注意力机制将静态上下文k1和动态上下文k2融合后的结果:

17、y=fusion(k1,k2)

18、在并行结构中,conv块以3×3卷积层、gelu非线性和实例归一化层为单位重复2次。最后,通过加法运算融合cot块和conv块的输出。编码器中cot&conv模块的计算过程可归纳如下:

19、yi=c本文档来自技高网...

【技术保护点】

1.一种基于PCCTrans的医学图像分割方法,具体的实现步骤如下:

2.根据权利要求1所述的基于PCCTrans的医学图像分割方法,其特征在于:所述步骤一多尺度图像输入具体为:原始图像分别经过不同的下采样倍数得到多尺度图像,作为前三层编码器的输入。目的是突出显示不同类别和不同尺度下较小的感兴趣区域(RegionofInterest,ROI)特征。

3.根据权利要求1所述的基于PCCTrans的医学图像分割方法,其特征在于:所述步骤二中,本专利技术构建了分割模型PCCTrans,浅层编码器和解码器由提出的ContextualTransformer和卷积并行混合模块(CoT&Conv并行混合模块)构建。CoT&Conv并行混合模块包括:

4.根据权利要求1所述的基于PCCTrans的医学图像分割方法,其特征在于:在步骤三中,深层编码器和解码器由提出的Fully Convolutional Transformer和卷积并行混合模块(FCT&Conv并行混合模块)构建。

5.根据权利要求1所述的基于PCCTrans的医学图像分割方法,其特征在于:在步骤四中,将U型网络中的普通跳跃连接更换为挤压和激发注意力跳跃连接,增强网络对输入特征图中不同通道的关注。

6.根据权利要求1所述的基于PCCTrans的医学图像分割方法,其特征在于:在步骤五中,在解码器的最后,使用提出的多尺度融合输出(Multiscale Fusion,MSF)模块,融合模型学习到的特征以提升分割效果。

...

【技术特征摘要】

1.一种基于pcctrans的医学图像分割方法,具体的实现步骤如下:

2.根据权利要求1所述的基于pcctrans的医学图像分割方法,其特征在于:所述步骤一多尺度图像输入具体为:原始图像分别经过不同的下采样倍数得到多尺度图像,作为前三层编码器的输入。目的是突出显示不同类别和不同尺度下较小的感兴趣区域(regionofinterest,roi)特征。

3.根据权利要求1所述的基于pcctrans的医学图像分割方法,其特征在于:所述步骤二中,本发明构建了分割模型pcctrans,浅层编码器和解码器由提出的contextualtransformer和卷积并行混合模块(cot&conv并行混合模块)构建。cot&conv并行混合模块包括:<...

【专利技术属性】
技术研发人员:冯云丛苏建瑜
申请(专利权)人:长春工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1