一种基于门控注意力结构的眼底图像实例分割方法及系统技术方案

技术编号：33795334 阅读：31 留言：0更新日期：2022-06-12 14:57

本发明专利技术涉及一种基于门控注意力结构的眼底图像实例分割方法及系统，涉及图像处理技术领域，利用门控分割模型对图像进行分割，得到类别概率。首先对图像进行连续n层降采样，然后将第i层降采样输出特征与第n

全部详细技术资料下载

【技术实现步骤摘要】
一种基于门控注意力结构的眼底图像实例分割方法及系统

[0001]本专利技术涉及图像处理
，特别是涉及一种基于门控注意力结构的眼底图像实例分割方法及系统。

技术介绍

[0002]图像分割技术是根据某些规则将图像分割成若干特定的、具有独特性质的区域，并抽取出感兴趣的目标。实例分割除了抽取出感兴趣区域外，同时要区分出分割的区域归属与哪一类别。近年来，随着深度学习技术的逐步深入，图像分割技术有了突飞猛进的发展，其相关技术被广泛应用于无人驾驶、增强现实、医学图像病灶识别、安防监控等。
[0003]然而现有技术中为了提取到更丰富的特征，往往会将网络模型设置的很深，这不但导致了算法运行时间过长，同时还占用了过多的GPU资源。
[0004]因此，本领域亟需一种能够在保证分割精度的前提下，更加有效的利用GPU资源以及压缩推理时间的技术方案。

技术实现思路

[0005]本专利技术的目的是提供一种基于门控注意力结构的眼底图像实例分割方法及系统，引入一种门控注意力结构（AttentionGate，AG），并将此结构连接在原始UNet模型跳跃连接的末端，这样能够抑制UNet模型过多的学习背景区域信息，着重学习与感兴趣区域相关的特征，从而更加有效的利用GPU资源，降低算法运行时间。
[0006]为实现上述目的，本专利技术提供了如下方案：一种基于门控注意力结构的眼底图像实例分割方法，所述方法包括：获取待使用的眼底图像；利用门控分割模型对所述眼底图像进行实例分割，得到每个像素的类别概率；所述门控分割模型...

【技术保护点】

【技术特征摘要】
1.一种基于门控注意力结构的眼底图像实例分割方法，其特征在于，所述方法包括：获取待使用的眼底图像；利用门控分割模型对所述眼底图像进行图像分割，得到每个像素类别的概率；所述门控分割模型包括n层连续的下采样层和n层连续的上采样层，第n层下采样层与第一层上采样层连接：采用所述门控分割模型对所述眼底图像进行连续n层降采样，得到n层降采样输出特征；将第i层降采样输出特征与第n
‑
i+1层的上采样层的输出特征输入门控注意力结构，得到第n
‑
i+1层门控特征，并将第n
‑
i+1层门控特征与第n
‑
i+1层的上采样层的输出特征堆叠后输入第n
‑
i+2层上采样层，；其中，将第1层降采样输出特征与第n层的上采样层的输出特征输入门控注意力结构，得到第n层门控特征，并将第n层门控特征与第n层的上采样层的输出特征堆叠，得到堆叠特征；对所述堆叠特征进行分类卷积操作，得到每个像素的类别概率。2.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法，其特征在于，在所述获取待使用的眼底图像之后，还包括：将所述待使用的眼底图像的无效黑边区域裁掉。3.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法，其特征在于，在所述获取待使用的眼底图像之后，还包括：利用createCLAHE函数对所述待使用的眼底图像进行自适应直方图均衡化处理，得到均衡化图像；利用resize函数将所述均衡化图像统一缩放到标准大小。4.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法，其特征在于，所述采用所述门控分割模型对所述眼底图像进行连续n层降采样，得到n层降采样输出特征，具体包括：对所述眼底图像进行n次卷积操作、Relu函数激活操作和最大池化操作，得到n层降采样输出特征。5.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法，其特征在于，所述对所述堆叠特征进行分类卷积操作，得到每个像素的类别概率，具体包括：对所述堆叠特征进行卷积操作，得到每个像素的类别概率；其中，c表示分类的类别数目。6.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法，其特征在于，在所述对所述堆叠特征进行分类卷积操作之后，还包括：利用softmax归一化函数对卷积结果进行归一化。7.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法，其特...

【专利技术属性】
技术研发人员：张冬冬，
申请(专利权)人：北京至真互联网技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人