识别方法、装置、设备和存储介质制造方法及图纸

技术编号:30403691 阅读:18 留言:0更新日期:2021-10-20 10:56
本发明专利技术实施例提供一种识别方法、装置、设备和存储介质,该方法包括:响应于用户触发的输入操作,获取原始图像,并从原始图像中提取出目标部位对应的目标图像区域,其中,目标图像区域中可以包含目标对象。在第一条件下,根据目标图像区域中各像素点的像素值以及各像素点之间的位置关系,估计目标对象的位置。在第二条件下,可以利用分割模型来识别目标图像区域中目标对象的位置。可见,上述方法提供了两种不同的目标对象识别方式。将两种识别方式结合,可以满足在不同条件下的识别需求,能够准确识别出目标对象在原始图像中的位置,保证目标对象识别的效率和精度。目标对象识别的效率和精度。目标对象识别的效率和精度。

【技术实现步骤摘要】
识别方法、装置、设备和存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种识别方法、装置、设备和存储介质。

技术介绍

[0002]随着计算机视觉的发展,利用计算机的图像处理技术识别图像中是否存在目标对象也已经广泛应用到多种领域。比如,在智能交通领域中,可以通过对当前时段内道路上车辆的识别确定当前的车辆密度,以了解实时路况。又比如,在医学领域,需要识别医学影像中是否存在病灶。
[0003]因此,在上述场景下,如何保证识别的准确性就成为一个亟待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种识别方法、装置、设备和存储介质,用以保证目标对象识别的准确性。
[0005]第一方面,本专利技术实施例提供一种识别方法,包括:
[0006]响应于用户触发的输入操作,获取原始图像;
[0007]从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;
[0008]在第一条件下,根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的位置;
[0009]在第二条件下,将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置;
[0010]展示包含所述目标对象在所述目标图像区域中的位置的识别结果。
[0011]第二方面,本专利技术实施例提供一种识别装置,包括:
[0012]获取模块,用于响应于用户触发的输入操作,获取原始图像;
[0013]提取模块,用于从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;
[0014]估计模块,用于在第一条件下,根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的位置;
[0015]输入模块,用于在第二条件下,将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置;
[0016]展示模块,用于展示包含所述目标对象在所述目标图像区域中的位置的识别结果。
[0017]第三方面,本专利技术实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的识别方法。该电子设备还可以包括通信接口,用于与其他设备或通信网络通信。
[0018]第四方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第一方面所述的识别方法。
[0019]第五方面,本专利技术实施例提供一种识别方法,包括:
[0020]获取原始图像,其中,所述原始图像包括目标图像区域,所述目标图像区域包括目标对象;
[0021]在第一条件下,根据所述目标图像区域中至少部分像素点的像素值以及所述所述像素点之间的位置关系,计算所述目标对象在所述目标图像区域中的位置;
[0022]在第二条件下,将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置。
[0023]第六方面,本专利技术实施例提供一种识别装置,包括:
[0024]获取模块,用于获取原始图像,其中,所述原始图像包括目标图像区域,所述目标图像区域包括目标对象;
[0025]计算模块,用于在第一条件下,根据所述目标图像区域中至少部分像素点的像素值以及所述所述像素点之间的位置关系,计算所述目标对象在所述目标图像区域中的位置;
[0026]输入模块,用于在第二条件下,将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置。
[0027]第七方面,本专利技术实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第五方面中的识别方法。该电子设备还可以包括通信接口,用于与其他设备或通信网络通信。
[0028]第八方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第五方面中的识别方法。
[0029]第九方面,本专利技术实施例提供一种识别方法,包括:
[0030]响应于用户触发的输入操作,获取原始图像;
[0031]从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;
[0032]根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的第一位置;
[0033]将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第二位置;
[0034]分别展示包含所述第一位置和所述第二位置的识别结果。
[0035]第十方面,本专利技术实施例提供一种识别装置,包括:
[0036]获取模块,用于响应于用户触发的输入操作,获取原始图像;
[0037]提取模块,用于从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;
[0038]估计模块,用于根据所述目标图像区域中各像素点的像素值以及所述各像素点之
间的位置关系,估计所述目标对象在所述目标图像区域中的第一位置;
[0039]输入模块,用于将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第二位置;
[0040]展示模块,用于分别展示包含所述第一位置和所述第二位置的识别结果。
[0041]第十一方面,本专利技术实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第九方面中的识别方法。该电子设备还可以包括通信接口,用于与其他设备或通信网络通信。
[0042]第十二方面,本专利技术实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第九方面中的识别方法。
[0043]第十三方面,本专利技术实施例提供一种识别方法,包括:
[0044]响应于用户触发的输入操作,获取原始图像;
[0045]从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;
[0046]根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的第一位置;
[0047]将所述第一位置和所述目标图像区域发送至分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第二位本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别方法,其特征在于,包括:响应于用户触发的输入操作,获取原始图像;从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;在第一条件下,根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的位置;在第二条件下,将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置;展示包含所述目标对象在所述目标图像区域中的位置的识别结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述目标对象的尺寸;根据所述尺寸,确定所述目标对象在所述目标图像区域中的占比值;展示包含所述占比值的识别结果。3.根据权利要求1所述的方法,其特征在于,所述第一条件为:在预设时间段内获取的历史图像的数量小于预设数量,所述历史图像中标注有所述目标对象在所述历史图像中的位置。4.根据权利要求1所述的方法,其特征在于,所述第二条件为:在预设时间段内获取的历史图像的数量大于或等于预设数量,所述历史图像中标注有所述目标对象在所述历史图像中的位置;所述方法还包括:在所述历史图像中,提取目标部位对应的历史图像区域,所述历史图像区域中包含目标对象;以所述目标对象在历史图像区域中的位置为监督信息,将所述历史图像区域输入分割模型,以训练得到所述分割模型。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的位置,包括:确定所述目标图像区域中像素值满足预设范围的多个目标像素点;根据所述多个目标像素点之间的位置关系,修正所述多个目标像素点;根据修正后的目标像素点的位置,估计所述目标对象在所述目标图像区域中的位置。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述原始图像为医学影像。7.根据权利要求1所述的方法,其特征在于,所述将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置,包括:对所述目标图像区域进行膨胀处理;在所述原始图像中确定具有预设尺寸且包含膨胀结果的图像区域,所述预设尺寸大于所述目标图像区域的尺寸;将所述包含膨胀结果的图像区域输入所述分割模型,以由所述分割模型输出所述目标对象的位置。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据所述目标对象的尺寸和/或所述目标对象在所述包含膨胀结果的图像区域中的位置,对所述目标对象进行滤除;所述展示包含所述目标对象在所述目标图像区域中位置的检测结果,包括:展示包含剩余目标对象在所述目标图像区域中的位置的检测结果。9.根据权利要求8所述的方法,其特征在于,所述根据所述目标对象的尺寸和/或所述目标对象在所述包含膨胀结果的图像区域中的位置,对所述目标对象进行滤除,包括:若所述目标对象的尺寸小于预设阈值,则滤除所述目标对象;和/或,若所述目标对象不位于所述目标图像区域,则滤除所述目标对象。10.一种识别方法,其特征在于,包括:获取原始图像,其中,所述原始图像包括目标图像区域,所述目标图像区域包括目标对象;在第一条件下,根据所述目标图像区域中至少部分像素点的像素值以及所述所述像素点之间的位置关系,计算所述目标对象在所述目标图像区域中的位置;在第二条件下,将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的位置。11.根据权利要求10所述的方法,其特征在于,所述分割模型包括卷积神经网络。12.一种识别方法,其特征在于,包括:响应于用户触发的输入操作,获取原始图像;从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的第一位置;将所述目标图像区域输入分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第二位置;分别展示包含所述第一位置和所述第二位置的识别结果。13.一种识别方法,其特征在于,应用于终端设备,包括:响应于用户触发的输入操作,获取原始图像;从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;根据所述目标图像区域中各像素点的像素值以及所述各像素点之间的位置关系,估计所述目标对象在所述目标图像区域中的第一位置;将所述目标图像区域发送至分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第二位置;根据所述第一位置和所述第二位置,确定修正后位置;展示包含修正后位置的识别结果。14.一种识别方法,其特征在于,包括:响应于用户触发的输入操作,获取原始图像;从所述原始图像中提取目标部位对应的目标图像区域,所述目标图像区域中包含目标对象;
将所述目标图像区域输入第一分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第一位置;将所述目标图像区域发送至第二分割模型,以由所述分割模型输出所述目标对象在所述目标图像区域中的第二位置,所述第一分割模型与所述第二分割模型的识别精度不同;分别展示包含所述第一位置和所述第二位置的识别结果。15.根据权利要求14所述的方法,其特征在于,所述第一分割模型配置于所述用户使用的移动终端上,...

【专利技术属性】
技术研发人员:刘双瑞唐喆郭文超马建强许敏丰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1