图像识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35103995 阅读:23 留言:0更新日期:2022-10-01 17:13
本公开提供了一种图像识别方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理和计算机视觉等技术领域,可应用于智慧城市等场景下。具体实现方案为:对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理,得到第N级融合特征,其中,N为大于或等于1的整数;根据第N级融合特征,得到第N+1级第一特征和第N+1级第二特征;根据第N+1级第一特征和第N+1级第二特征,得到第N+M级第一特征和第N+M级第二特征,其中,M为大于1的整数;以及根据第N+M级第一特征和第N+M级第二特征,识别第二图像中相对于第一图像存在变化的目标区域。本公开还提供了一种图像识别装置、电子设备和存储介质。存储介质。存储介质。

【技术实现步骤摘要】
图像识别方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能
,尤其涉及深度学习、图像处理和计算机视觉等
,可应用于智慧城市等场景下。更具体地,本公开提供了一种图像识别方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,深度学习模型广泛地应用于智慧城市等场景下。在相关场景中,对于时间信息不同的多个图像,可以利用深度学习模型识别出多个图像之间的区别。

技术实现思路

[0003]本公开提供了一种图像识别方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种图像识别方法,该方法包括:对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理,得到第N级融合特征,其中,N为大于或等于1的整数;根据第N级融合特征,得到第N+1级第一特征和第N+1级第二特征;根据第N+1级第一特征和第N+1级第二特征,得到第N+M级第一特征和第N+M级第二特征,其中,M为大于1的整数;以及根据第N+M级第一特征和第N+M级第二特征,识别第二图像中相对于第一图像存在变化的目标区域。
[0005]根据本公开的另一方面,提供了一种图像识别装置,该装置包括:融合模块,用于对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理,得到第N级融合特征,其中,N为大于或等于1的整数;第一获得模块,用于根据第N级融合特征,得到第N+1级第一特征和第N+1级第二特征;第二获得模块,用于根据第N+1级第一特征和第N+1级第二特征,得到第N+M级第一特征和第N+M级第二特征,其中,M为大于1的整数;以及识别模块,用于根据第N+M级第一特征和第N+M级第二特征,识别第二图像中相对于第一图像存在变化的目标区域。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开提供的方法。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1是根据本公开的一个实施例的可以应用图像识别方法和装置的示例性系统架构示意图;
[0012]图2是根据本公开的一个实施例的图像识别方法的流程图;
[0013]图3是根据本公开的一个实施例的图像识别方法的原理图;
[0014]图4是根据本公开的另一个实施例的图像识别方法的原理图;
[0015]图5是根据本公开的另一个实施例的图像识别方法的原理图;
[0016]图6是根据本公开的另一个实施例的图像识别方法的原理图;
[0017]图7是根据本公开的另一个实施例的图像识别方法的原理图;
[0018]图8A和图8B是根据本公开的一个实施例的目标区域的示例性示意图;
[0019]图9是根据本公开的一个实施例的图像识别装置的框图;以及
[0020]图10是根据本公开的一个实施例的可以应用图像识别方法的电子设备的框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]图像中可以包括多个不同类型的对象。图像例如可以为遥感图像。遥感图像中不同类型的对象例如可以包括农业用地、建筑用地等等。不同类型的对象可以处于不同的图像区域。
[0023]对于同一地理区域在不同时刻采集的两个遥感图像,可以利用深度学习模型进行图像识别,以识别这两个遥感图像中对象类型的变化。
[0024]一种基于语义分割的图像识别方法,可以利用深度学习模型对上文所述的两个遥感图像分别进行语义分割,得到两个语义分割结果。将两个语义分割结果之间的差异作为识别结果,以识别两个遥感图像之间存在变化的图像区域。但应用该方法时,两个遥感图像的像素需要严格对齐。若两个遥感图像的像素未对齐,则可以产生像素级别的偏差,导致识别结果中包括多个微小变化的区域,导致识别结果不准确。
[0025]一种基于图像融合的图像识别方法,将上文所述的两个遥感图像拼接,得到拼接图像。利用深度学习模型对拼接图像进行语义分割,将分割结果作为识别结果,以识别两个遥感图像之间存在变化的图像区域。但两个遥感图像可以分别是3个通道的图像,拼接图像可以是6个通道的图像。对于6个通道的图像,深度学习模型需要过多的算力资源才能进行高效的语义分割。
[0026]一种基于孪生网络的图像识别方法,可以利用包括孪生网络的深度学习模型进行图像识别。例如,利用孪生网络的第一子网络对一个遥感图像进行多级特征提取后,得到第一图像特征。利用孪生网络的第二子网络对另一个遥感图像进行多级特征提取后,得到第二图像特征。将第一图像特征和第二图像特征融合,得到融合特征。根据融合特征确定识别结果。该方法广泛地应用于确定不同遥感图像中对象类型的变化。但在该方法中,在两个子
网络分别对两个遥感图像进行多级特征提取后,才进行特征融合。子网络中最后一个特征提取层的参数对融合特征有较大的影响,子网络中在前的一些特征提取层的参数对融合特征的影响较小,导致融合特征不能全面地反映遥感图像的特点,进而导致识别结果较差。
[0027]图1是根据本公开一个实施例的可以应用图像识别方法和装置的示例性系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0028]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0029]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,包括:对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理,得到第N级融合特征,其中,N为大于或等于1的整数;根据所述第N级融合特征,得到第N+1级第一特征和第N+1级第二特征;根据所述第N+1级第一特征和所述第N+1级第二特征,得到第N+M级第一特征和第N+M级第二特征,其中,M为大于1的整数;以及根据所述第N+M级第一特征和所述第N+M级第二特征,识别所述第二图像中相对于所述第一图像存在变化的目标区域。2.根据权利要求1所述的方法,其中,所述根据所述第N级融合特征,得到第N+1级第一特征和第N+1级第二特征包括:对所述第N级融合特征进行第N+1级第一特征提取,得到所述第N+1级第一特征;以及对所述第N级融合特征进行第N+1级第二特征提取,得到所述第N+1级第二特征。3.根据权利要求1或2所述的方法,其中,所述根据所述第N+1级第一特征和所述第N+1级第二特征,得到第N+M级第一特征和第N+M级第二特征包括:根据所述第N+1级第一特征和所述第N+1级第二特征中的至少一个,得到第N+2级第一特征至所述第N+M级第一特征;以及根据所述第N+1级第一特征和所述第N+1级第二特征中的至少一个,得到第N+2级第二特征至所述第N+M级第二特征。4.根据权利要求3所述的方法,其中,第N+i级第一特征是对第N+i

1级第一特征进行第一特征提取得到的,或所述第N+i级第一特征是对第N+i

1级融合特征进行第一特征提取得到的,所述第N+i

1级融合特征是对所述第N+i

1级第一特征和第N+i

1级第二特征进行融合处理得到的,i为大于1的整数,i为小于或等于I的整数,I为小于或等于M的整数。5.根据权利要求3所述的方法,其中,第N+i级第二特征是对第N+i

1级第二特征进行第二特征提取得到的,或所述第N+i级第二特征是对第N+i

1级融合特征进行第二特征提取得到的,所述第N+i

1级融合特征是对第N+i

1级第一特征和所述第N+i

1级第二特征进行融合处理得到的,i为大于1的整数,i为小于或等于I的整数,I为小于或等于M的整数。6.根据权利要求1所述的方法,其中,所述对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理,得到第N级融合特征包括:对所述第一图像进行N级第一特征提取,得到所述第N级第一特征;对所述第二图像进行N级第二特征提取,得到所述第N级第二特征;以及对所述第N级第一特征和所述第N级第二特征进行融合处理,得到所述第N级融合特征。7.根据权利要求1所述的方法,其中,所述根据所述第N+M级第一特征和所述第N+M级第二特征,识别所述第二图像中相对于所述第一图像存在变化的目标区域包括:对所述第N+M级第一特征和所述第N+M级第二特征进行融合处理,得到第N+M级融合特征;根据所述第N+M级融合特征,识别所述第二图像中相对于所述第一图像存在变化的目标区域。
8.根据权利要求1所述的方法,其中,所述第一图像是在第一时刻采集的与目标对象相关的图像,所述第二图像是在第二时刻采集的与所述目标对象相关的图像。9.根据权利要求1至8任一项所述的方法,其中,所述根据所述第N级融合特征,得到第N+1级第一特征和第N+1级第二特征包括:根据所述第N级第一特征和所述第N级第二特征中至多一个以及所述第N级融合特征,得到所述第N+1级第一特征和所述第N+1级第二特征。10.一种图像识别装置,包括:融合模块,用于对第一图像的第N级第一特征和第二图像的第N级第二特征进行融合处理,得到第N级融合特征,其中,N为大于或等于1的整数;第一获得模块,用于根据所述第N级融合特征,得到第N+1级第一...

【专利技术属性】
技术研发人员:郑弘晖冯原孙准韩树民
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1