图像分割方法、装置、设备及存储介质制造方法及图纸

技术编号:36603423 阅读:23 留言:0更新日期:2023-02-04 18:21
本发明专利技术涉及人工智能领域,公开了一种图像分割方法、装置、设备及存储介质,该方法包括:响应于针对待分割图像的当前交互操作,将待分割图像输入预设的交互式图像分割模型,通过交互式图像分割模型根据当前交互操作对待分割图像进行图像分割,得到模型输出结果;判断模型输出结果是否符合分割标准;若不符合,则将模型输出结果映射至待分割图像,并返回至响应于针对待分割图像的当前交互操作的步骤,直至当前交互操作对应的模型输出结果符合分割标准;若符合,则将模型输出结果作为待分割图像的图像分割结果输出。本方法通过每次图像参考上一交互操作的图像分割进行循环分割,能够实现聚焦区域的动态扩张,提升不同尺度目标的分割精度。割精度。割精度。

【技术实现步骤摘要】
图像分割方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种图像分割方法、装置、设备及存储介质。

技术介绍

[0002]图像分割是图像处理的重要环节,传统的图像分割方法包括阈值法、区域生长法、水平集法等,这些方法实现简单,但分割精度较低,难以处理复杂的分割任务。近年来,包括卷积神经网络在内的深度学习技术大幅提升了图像的分割精度。
[0003]卷积神经网络是一种机器学习模型,在图像处理领域有广泛的应用。其中,FCN、U

Net等网络模型可被用于解决图像分割问题。但为了保证自动驾驶的安全性,现有的基于卷积神经网络的全自动分割方法仍无法达到足够高的精度,需要人工地、进一步地修复分割错误,由于人工修复过程极为繁琐,需耗费大量时间,这为图像分割技术的应用带来了较高的成本。
[0004]近年来有少量工作使用深度学习方法实现交互式图像分割与编辑,通过用户交互提高图像分割精度,并使用深度学习方法减少用户交互所需要的工作量。但这种交互方式下由于每次都是根据当前的交互方式进行图像分割,并未参考之前的图像分割结果,导致交互式图像分割的精度仍然不够高。

技术实现思路

[0005]本专利技术的主要目的在于解决现有的交互式图像分割准确度低的技术问题。
[0006]本专利技术第一方面提供了一种图像分割方法,包括:
[0007]响应于针对待分割图像的当前交互操作,将所述待分割图像输入预设的交互式图像分割模型,通过所述交互式图像分割模型根据当前交互操作对所述待分割图像进行图像分割,得到模型输出结果;
[0008]判断所述模型输出结果是否符合分割标准;
[0009]若不符合,则将所述模型输出结果映射至所述待分割图像,并返回至所述响应于针对待分割图像的当前交互操作的步骤,直至所述当前交互操作对应的模型输出结果符合分割标准;
[0010]若符合,则将所述模型输出结果作为所述待分割图像的图像分割结果输出。
[0011]可选的,在本专利技术第一方面的第一种实现方式中,所述响应于针对待分割图像的当前交互操作,将所述待分割图像输入预设的交互式图像分割模型,通过所述交互式图像分割模型根据当前交互操作对所述待分割图像进行图像分割,得到模型输出结果包括:
[0012]响应于针对待分割图像的当前交互操作,确定所述当前交互操作是否为所述待分割图像的首次交互;
[0013]若是,则将所述待分割图像调整至预设尺寸,并将尺寸调整后的待分割图像输入至所述交互式图像分割模型中,得到第一模型输出结果;
[0014]若否,则根据上一次交互操作对应的模型输出结果生成所述待分割图像的聚焦区
域,并将所述聚焦区域输入至所述交互式图像分割模型中,得到第二模型输出结果。
[0015]可选的,在本专利技术第一方面的第二种实现方式中,所述交互式图像分割模型包括融合网络、特征提取网络和分割网络;所述将尺寸调整后的待分割图像输入至所述交互式图像分割模型中,得到第一模型输出结果包括:
[0016]通过所述交互式图像分割模型中的融合网络根据所述当前交互操作识别所述待分割图像中的前景点和背景点,并将所述前景点和背景点与所述待分割图像进行融合;
[0017]通过特征提取网络将融合后的待分割图像进行特征提取,获得对应的图像特征;
[0018]通过所述分割网络根据所述图像特征对所述待分割图像进行图像分割,得到第一模型输出结果。
[0019]可选的,在本专利技术第一方面的第三种实现方式中,所述根据上一次交互操作对应的模型输出结果生成所述待分割图像的聚焦区域包括:
[0020]根据所述上一操作对应的模型输出结果在所述待分割图像中生成对应的最大外接框;
[0021]判断所述当前交互操作在所述待分割图像中的位置是否在所述最大外接框内;
[0022]若否,则基于当前交互操作在所述待分割图像中的位置对所述最大外接框进行扩展;
[0023]根据所述最大外接框生成所述待分割图像的聚焦区域。
[0024]可选的,在本专利技术第一方面的第四种实现方式中,在所述基于当前交互操作在所述待分割图像中的位置对所述最大外接框进行扩展之后,还包括:
[0025]判断所述最大外接框是否小于最小裁剪尺寸;
[0026]若是,则根据所述最小裁剪尺寸对所述聚焦区域进行调整。
[0027]可选的,在本专利技术第一方面的第五种实现方式中,在所述根据上一次交互操作对应的模型输出结果生成所述待分割图像的聚焦区域之后,还包括:
[0028]根据预设扩展比例对所述聚焦区域进行扩展;
[0029]根据预设裁剪算法将扩展后的聚焦区域裁剪至符合所述交互式图像分割模型的输入尺寸。
[0030]可选的,在本专利技术第一方面的第六种实现方式中,在所述响应于针对待分割图像的当前交互操作,将所述待分割图像输入预设的交互式图像分割模型,通过所述交互式图像分割模型根据当前交互操作对所述待分割图像进行图像分割,得到模型输出结果之前,包括:
[0031]获取初始化的交互式图像分割模型以及包含训练图像的训练集,其中所述训练图像为包含真值前景点和真值背景点的图像;
[0032]响应于针对所述训练图像的交互操作,将所述训练集中的训练图像以及对应的交互操作在所述训练图像中的位置输入所述初始化的交互式图像分割模型中,通过所述初始化的交互式图像分割模型对训练图像进行处理的,得到输出处理图像,所述输出处理图像包括预测前景点和预测背景点;
[0033]根据所述训练图像的真值前景点和真值背景点以及输出处理图像的预测前景点和预测背景点计算预设的损失函数,得到损失函数值;
[0034]判断所述损失值是否大于预设损失阈值;
[0035]若是,则根据所述损失函数对所述初始化的交互式图像分割模型进行反向传播,调整所述初始化的交互式图像分割模型的网络参数,并重新将所述训练集中的训练图像输入所述初始化的交互式图像分割模型;
[0036]若否,则网络训练结束,得到交互式图像分割模型。
[0037]本专利技术第二方面提供了一种图像分割装置,包括:
[0038]输入模块,用于响应于针对待分割图像的当前交互操作,将所述待分割图像输入预设的交互式图像分割模型,通过所述交互式图像分割模型根据当前交互操作对所述待分割图像进行图像分割,得到模型输出结果;
[0039]判断模块,用于判断所述模型输出结果是否符合分割标准;
[0040]迭代模块,用于当所述模型输出结果不符合分割标准时,将所述模型输出结果映射至所述待分割图像,并返回至所述响应于针对待分割图像的当前交互操作的步骤,直至所述当前交互操作对应的模型输出结果符合分割标准;
[0041]输出模块,用于当所述模型输出结果符合分割标准时,将所述模型输出结果作为所述待分割图像的图像分割结果输出。
[0042]可选的,在本专利技术第二方面的第一种实现方式中,所述输入模块具体包括:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分割方法,其特征在于,所述图像分割方法包括:响应于针对待分割图像的当前交互操作,将所述待分割图像输入预设的交互式图像分割模型,通过所述交互式图像分割模型根据当前交互操作对所述待分割图像进行图像分割,得到模型输出结果;判断所述模型输出结果是否符合分割标准;若不符合,则将所述模型输出结果映射至所述待分割图像,并返回至所述响应于针对待分割图像的当前交互操作的步骤,直至所述当前交互操作对应的模型输出结果符合分割标准;若符合,则将所述模型输出结果作为所述待分割图像的图像分割结果输出。2.根据权利要求1所述的图像分割方法,其特征在于,所述响应于针对待分割图像的当前交互操作,将所述待分割图像输入预设的交互式图像分割模型,通过所述交互式图像分割模型根据当前交互操作对所述待分割图像进行图像分割,得到模型输出结果包括:响应于针对待分割图像的当前交互操作,确定所述当前交互操作是否为所述待分割图像的首次交互;若是,则将所述待分割图像调整至预设尺寸,并将尺寸调整后的待分割图像输入至所述交互式图像分割模型中,得到第一模型输出结果;若否,则根据上一次交互操作对应的模型输出结果生成所述待分割图像的聚焦区域,并将所述聚焦区域输入至所述交互式图像分割模型中,得到第二模型输出结果。3.根据权利要求1所述的图像分割方法,其特征在于,所述交互式图像分割模型包括融合网络、特征提取网络和分割网络;所述将尺寸调整后的待分割图像输入至所述交互式图像分割模型中,得到第一模型输出结果包括:通过所述交互式图像分割模型中的融合网络根据所述当前交互操作识别所述待分割图像中的前景点和背景点,并将所述前景点和背景点与所述待分割图像进行融合;通过特征提取网络将融合后的待分割图像进行特征提取,获得对应的图像特征;通过所述分割网络根据所述图像特征对所述待分割图像进行图像分割,得到第一模型输出结果。4.根据权利要求2所述的图像分割方法,其特征在于,所述根据上一次交互操作对应的模型输出结果生成所述待分割图像的聚焦区域包括:根据所述上一操作对应的模型输出结果在所述待分割图像中生成对应的最大外接框;判断所述当前交互操作在所述待分割图像中的位置是否在所述最大外接框内;若否,则基于当前交互操作在所述待分割图像中的位置对所述最大外接框进行扩展;根据所述最大外接框生成所述待分割图像的聚焦区域。5.根据权利要求4所述的图像分割方法,其特征在于,在所述基于当前交互操作在所述待分割图像中的位置对所述最大外接框进行扩展之后,还包括:判断所述最大外接框是否小于最小裁剪尺寸;若是,则根据所述最小裁剪尺寸对所述聚焦区域进行调整。6.根据权利要求2所述的图像分割方法,其特征在于,在所述根据上一次交互操作对应的模型输出结果生成所述待...

【专利技术属性】
技术研发人员:傅佳美王贯安黄章帅韩旭
申请(专利权)人:广州文远知行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1