一种基于上下文注意力策略的三维肝脏影像语义分割方法技术

技术编号:28784132 阅读:22 留言:0更新日期:2021-06-09 11:18
本发明专利技术涉及一种基于上下文注意力策略的三维肝脏影像语义分割方法,包括如下步骤:选定待进行肝脏分割的医疗影像数据集,将其划分为训练集和测试集;对所述训练集中的三维肝脏影像进行预处理;在编码阶段,利用残差结构、卷积网络和空洞卷积得到肝脏的特征图;在解码阶段,利用上下文注意力策略模块、转置卷积和深度监督机制得到肝脏的分割图像;对语义分割后得到的肝脏图像进行后处理。该方法具有提高三维肝脏影像语义分割效果的特点,实现了较好的自动化分割效果,并可以辅助医生进行诊断。并可以辅助医生进行诊断。并可以辅助医生进行诊断。

【技术实现步骤摘要】
一种基于上下文注意力策略的三维肝脏影像语义分割方法


[0001]本专利技术涉及三维医学影像语义分割方法,特别是涉及一种基于上下文注意力策略的三维肝脏影像语义分割方法。

技术介绍

[0002]肝脏位于人体腹部,是腹部最大的重要实体器官,然而与肝脏相关的肝癌等疾病已成为世界上最常见,死亡率最高的疾病之一,这对人类的身体健康与生命产生了极大的威胁。近年来,计算机断层扫描(computered tomography,CT)已经成为发现,诊断和治疗肝肿瘤最广泛使用的医学成像方法。在治疗手术之前需要对CT图像中肝脏的形状和位置信息详细的了解,因此对肝脏的精确分割已成为肝癌治疗的首要任务。然而,人与人之间肿瘤的大小,形状和位置差异较大,肿瘤与其周围正常肝组织之间的界限不明确,肝脏与其周围器官组织对比度低,一些肿瘤还可能与其他器官和血管相邻,造成边界模糊。此外,肝肿瘤的多样性和密度的不均匀性使得肝脏和肝肿瘤分割成为一项具有挑战性的任务。因此,研究自动肝脏分割算法不仅可以减少医生手动细分的工作时间和结果的主观性,而且更为重要的是它可以提高肝脏和肿瘤分割的准确性,以提高肝肿瘤手术的成功率。
[0003]目前肝脏及肿瘤分割算法主要分为传统方法和基于深度学习的方法。传统分割方法主要有阈值法、区域生长法、主动轮廓模型、遗传算法等。但是传统的分割方法或多或少都存在一些局限,如阈值法仅考虑了像素本身的值,放弃了图像的空间性造成欠分割;区域生长法需要人工设置种子点,导致本来分开的区域连接,造成过度分割;主动轮廓模型对于初始位置十分敏感且无法检测到目标边界的凹陷处;遗传算法缺少局部搜索能力。
[0004]基于深度学习的分割方法也称为图像语义分割,本质上是一个逐像素点的二分类问题。近年来,这类方法被广泛应用于医疗影像处理领域,受到了极大的关注。在深度学习中最具有代表性的算法是卷积神经网络,它在图像识别和图像分割领域大放异彩。后来的研究者又根据医疗影像的特点对全卷积神经网络(Fully Convolutional Networks,FCN)改进提出了最经典的Unet和Vnet网络。二者都是一种类似U型的网络结构,使用skip

connection连接low level feature和high level feature。不同点在于Unet用于处理二维数据,Vnet用于处理三维数据,Vnet中还加入了Residual block。然而二维卷积网络无法充分利用医疗影像数据中的空间信息,缺少了对三维医疗数据切片间信息的处理,所以分割所得结果的边界较为粗糙,分割的整体效果不如三维分割。但这些研究都没有对医疗影像数据切片间的信息进行处理,对目标的低级语义特征和高级语义特征的融合利用不到位。

技术实现思路

[0005]本专利技术为了克服现有技术的不足,提供了一种基于上下文注意力策略的三维肝脏影像语义分割方法,采用如下技术方案实现:
[0006]一种基于上下文注意力策略的三维肝脏影像语义分割方法,包括如下步骤:
[0007]S1、选定待进行肝脏分割的医疗影像数据集,将其划分为训练集和测试集;
[0008]S2、对所述训练集中的三维肝脏影像进行预处理,并输入编解码网络模型;
[0009]S3、在编码阶段,利用残差结构、卷积网络和空洞卷积得到肝脏的特征图;
[0010]S4、在解码阶段,利用上下文注意力策略模块、转置卷积和深度监督机制得到肝脏的分割图像;
[0011]S5、对语义分割后得到的肝脏图像进行后处理。
[0012]进一步的,步骤S2具体包括:
[0013]S21、将训练集进行调窗处理,把灰度值设置在[

200,250]范围内;
[0014]S22、对训练集进行降采样和重采样,将图像数据的z轴间隔调整到1mm;
[0015]S23、找到肝脏区域的开始和结束切片,并在两个方向上向外扩张n个切片,n∈[15,20];
[0016]S24、对训练集中的图像进行三维区域直方图均衡化;
[0017]S25、对训练集中的图像进行最小最大归一化操作,最小最大归一化公式如下:
[0018][0019]其中,x
max
代表图像CT的最大值,x
min
代表图像CT的最小值,x为图像的CT值,x
*
代表最小最大归一化后的结果;
[0020]S26、随机选择48个连续的切片作为网络的输入,此时网络的输入尺寸为1
×
48
×
256
×
256。
[0021]进一步的,步骤S3具体包括:
[0022]S31、设置网络初始化参数,包括批处理大小、学习率、动量、最大迭代次数、L2权重和学习率衰减策略;
[0023]S32、使用kaiming正态分布初始化网络权重,常数初始化偏差参数;
[0024]S33、将预处理后的三维图像输入到卷积神经网络中,通过残差结构和空洞卷积进行训练得到若干特征信息;其中,在编码阶段共经过四层卷积,每层卷积由2

3个尺寸为3
×3×
3的三维卷积构成,倒数第二层分别加入膨胀率为2和4的空洞卷积,最后一层分别加入膨胀率为3,4,5的空洞卷积,最终得到肝脏的特征图。
[0025]进一步的,步骤S33中,卷积的输入输出尺寸关系为:
[0026]O=(I

K+2P)/S+1
[0027]其中,I为输入图片大小,K为卷积核大小,S为步长,P为填充的像素数,O代表卷积层输出的特征图大小;
[0028]空洞卷积的计算过程如下:
[0029][0030]其中,i代表输入图片大小,k为卷积核大小,p为填充的像素数,d代表膨胀率,s为步长,O代表输出的特征图大小;
[0031]残差结构如下:
[0032]x
l+1
=x
l
+F(x
l
,W
l
),F=W
l
*x
l
+b
l
[0033]其中,x
l
代表输入特征,F代表卷积操作,W
l
代表卷积中的权重,b
l
代表卷积中的偏置。
[0034]进一步的,步骤S4具体包括:
[0035]S41、在解码阶段,将步骤3得到的特征图进行反卷积,公式如下:
[0036]o=s(i

1)

2p+k
[0037]其中,o代表输出的尺寸大小,p代表填充的大小,s代表卷积核移动的步长,i代表输入的尺寸大小,k代表卷积核的尺寸大小;
[0038]S42、利用在编码阶段每层最后一次卷积得到的特征与步骤S41每层反卷积得到的特征,分别作为上层信息和下层信息来通过跳跃连接中的上下文注意力策略模块得到注意力图;
[0039]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于上下文注意力策略的三维肝脏影像语义分割方法,其特征在于,包括如下步骤:S1、选定待进行肝脏分割的医疗影像数据集,将其划分为训练集和测试集;S2、对所述训练集中的三维肝脏影像进行预处理,并输入编解码网络模型;S3、在编码阶段,利用残差结构、卷积网络和空洞卷积得到肝脏的特征图;S4、在解码阶段,利用上下文注意力策略模块、转置卷积和深度监督机制得到肝脏的分割图像;S5、对语义分割后得到的肝脏图像进行后处理。2.根据权利要求1所述的基于上下文注意力策略的三维肝脏影像分割方法,其特征在于,步骤S2具体包括:S21、将训练集进行调窗处理,把灰度值设置在[

200,250]范围内;S22、对训练集进行降采样和重采样,将图像数据的z轴间隔调整到1mm;S23、找到肝脏区域的开始和结束切片,并在两个方向上向外扩张n个切片,n∈[15,20];S24、对训练集中的图像进行三维区域直方图均衡化;S25、对训练集中的图像进行最小最大归一化操作,最小最大归一化公式如下:其中,x
max
代表图像CT的最大值,x
min
代表图像CT的最小值,x为图像的CT值,x
*
代表最小最大归一化后的结果;S26、随机选择48个连续的切片作为网络的输入,此时网络的输入尺寸为1
×
48
×
256
×
256。3.根据权利要求2所述的基于上下文注意力策略的三维肝脏影像分割方法,其特征在于,步骤S3具体包括:S31、设置网络初始化参数,包括批处理大小、学习率、动量、最大迭代次数、L2权重和学习率衰减策略;S32、使用kaiming正态分布初始化网络权重,常数初始化偏差参数;S33、将预处理后的三维图像输入到卷积神经网络中,通过残差结构和空洞卷积进行训练得到若干特征信息;其中,在编码阶段共经过四层卷积,每层卷积由2

3个尺寸为3
×3×
3的三维卷积构成,倒数第二层分别加入膨胀率为2和4的空洞卷积,最后一层分别加入膨胀率为3,4,5的空洞卷积,最终得到肝脏的特征图。4.根据权利要求3所述的基于上下文注意力策略的三维肝脏影像分割方法,其特征在于,步骤S33中,卷积的输入输出尺寸关系为:O=(I

K+2P)/S+1其中,I为输入图片大小,K为卷积核大小,S为步长,P为填充的像素数,O代表卷积层输出的特征图大小;空洞卷积的计算过程如下:
其中,i代表输入图片大小,k为卷积核大小,p为填充的像素数,d代表膨胀率,s为步长,O代表输出的特征图大小;残差结构如下:x
l+1
=x
l
+F(x
l
,W
l
),F=W
l
*x
l
+b
l
其中,x
l
代表输入特征,F代表卷积操作,W
l
代表卷积中的权重,b
l
代表卷积中的偏置。5.根据权利要求4所述的基于上下文注意力策略的三维肝脏影像分割方法,其特征在于,步骤S4具体包括:S41、在解码阶段,将步骤3得到的特征图进行反卷积,公式如下:o=s(i

1)

2p+k其中,o代表输出的尺寸大小,p代表填充的大小,s代表卷积核移动的步长,i代表输入的尺寸大小,k代表卷积核的尺寸大小;S42、利用在编码阶段每层最后一次卷积得到的特征与步骤S41每层反卷积得到的特征,分别作为上层信息和下层信息来通过跳跃连接中的...

【专利技术属性】
技术研发人员:张晓龙邵赛邓春华程若勤李波
申请(专利权)人:武汉科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1