图像识别方法、装置、设备、存储介质及计算机程序产品制造方法及图纸

技术编号:35095532 阅读:15 留言:0更新日期:2022-10-01 16:58
本申请公开了一种图像识别方法、装置、设备、存储介质及计算机程序产品,涉及机器学习领域。该方法包括:获取目标图像,目标图像中包括对象元素;对目标图像进行n次特征提取,得到n个候选特征,第i次特征提取是基于第i

【技术实现步骤摘要】
图像识别方法、装置、设备、存储介质及计算机程序产品


[0001]本申请涉及机器学习领域,特别涉及一种图像识别方法、装置、设备、存储介质及计算机程序产品。

技术介绍

[0002]目标检测(Object Decetion)是指针对一张图像中包含多个对象时,对多个对象进行识别,确定对象对应的类别以及对象位于图像中的位置信息。
[0003]相关技术中,针对目标检测任务,通常采用将传统检测网络中的卷积神经网络替换成一个转换网络(Tranformer网络),用于提取图像特征,此外,在Transformer网络后设计一个特征金字塔网络(Feature Pyramid Networks,FPN),用于提取不同尺度下的图像特征,从而根据不同尺度下的图像特征输出得到最终的预测结果。
[0004]然而相关技术中的方案,针对不同尺度的图像特征进行目标检测的方式,会导致在检测过程中的计算开销过高,造成检测结果的输出效率较低,输出结果的准确度较低。

技术实现思路

[0005]本申请实施例提供了一种图像识别方法、装置、设备、存储介质及计算机程序产品,能够提高图像识别效率。所述技术方案如下:
[0006]一方面,提供了一种图像识别方法,所述方法包括:
[0007]获取目标图像,所述目标图像中包括对象元素,所述对象元素作为图像内容处于所述目标图像中;
[0008]对所述目标图像进行n次特征提取,得到n个候选特征,其中,n为大于1的整数,且第i次特征提取是基于第i

1次提取得到的第i

1个候选特征执行的,0<i≤n;
[0009]对n个候选特征进行聚合编码,得到聚合特征;
[0010]对所述聚合特征进行对象识别,得到对象识别结果,其中,所述对象识别结果用于指示所述目标图像中所包含的对象元素信息,所述对象元素信息包括对象类别和对象显示位置中的至少一种。
[0011]另一方面,提供了一种图像识别装置,所述装置包括:
[0012]获取模块,用于获取目标图像,所述目标图像中包括对象元素,所述对象元素作为图像内容处于所述目标图像中;
[0013]提取模块,用于对所述目标图像进行n次特征提取,得到n个候选特征,其中,n为大于1的整数,且第i次特征提取是基于第i

1次提取得到的第i

1个候选特征执行的,0<i≤n;
[0014]编码模块,对n个候选特征进行聚合编码,得到聚合特征;
[0015]识别模块,用于对所述聚合特征进行对象识别,得到对象识别结果,其中,所述对象识别结果用于指示所述目标图像中所包含的对象元素信息,所述对象元素信息包括对象类别和对象显示位置中的至少一种。
[0016]另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述图像识别方法。
[0017]另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的图像识别方法。
[0018]另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的图像识别方法。
[0019]本申请实施例提供的技术方案带来的有益效果至少包括:
[0020]当对目标图像进行n次特征提取得到n个候选特征后,通过将n个候选特征进行聚合编码从而针对一个聚合特征进行对象识别从而输出得到对象识别结果的方式,替代直接采用对n个候选特征进行对象识别的方式,能够有效提高对象识别的识别效率,同时针对聚合编码的方式得到的聚合特征从而进行对象识别的方式,也能提高对对象识别的准确度。
附图说明
[0021]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本申请一个示例性实施例提供的图像识别方法相关技术示意图;
[0023]图2是本申请一个示例性实施例提供的图像识别方法示意图;
[0024]图3是本申请一个示例性实施例提供的实施环境示意图;
[0025]图4是本申请一个示例性实施例提供的图像识别方法流程图;
[0026]图5是本申请另一个示例性实施例提供的图像识别方法流程图;
[0027]图6是本申请一个示例性实施例提供的候选特征获取方法示意图;
[0028]图7是本申请一个示例性实施例提供的聚合编码过程示意图;
[0029]图8是本申请另一个示例性实施例提供的图像识别方法流程图;
[0030]图9是本申请一个示例性实施例提供的对象识别过程示意图;
[0031]图10是本申请另一个示例性实施例提供的图像识别方法示意图;
[0032]图11是本申请一个示例性实施例提供的结果对比示意图;
[0033]图12是本申请一个示例性实施例提供的图像识别装置结构图;
[0034]图13是本申请另一个示例性实施例提供的图像识别装置结构图;
[0035]图14是本申请一个示例性实施例提供的服务器的结构示意图。
具体实施方式
[0036]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方
式作进一步地详细描述。
[0037]首先,针对本申请实施例中涉及的名词进行简单介绍。
[0038]人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0039]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0040]在相关技术中,针对目标检测这类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取目标图像,所述目标图像中包括对象元素,所述对象元素作为图像内容处于所述目标图像中;对所述目标图像进行n次特征提取,得到n个候选特征,其中,n为大于1的整数,且第i次特征提取是基于第i

1次提取得到的第i

1个候选特征执行的,0<i≤n;对n个候选特征进行聚合编码,得到聚合特征;对所述聚合特征进行对象识别,得到对象识别结果,其中,所述对象识别结果用于指示所述目标图像中所包含的对象元素信息,所述对象元素信息包括对象类别和对象显示位置中的至少一种。2.根据权利要求1所述的方法,其特征在于,所述对n个候选特征进行聚合编码,得到聚合特征,包括:在聚合第k个候选特征时,将前k

1个候选特征聚合得到的候选聚合特征向第k个候选特征的特征尺寸进行采样,得到第k

1个待聚合特征,1<k<n;将第k个候选特征与所述第k

1个待聚合特征进行融合,得到第k

1个候选聚合特征,直至所述n个候选特征聚合完成,得到所述聚合特征。3.根据权利要求2所述的方法,其特征在于,所述将第k个候选特征与所述第k

1个待聚合特征进行融合,得到第k

1个候选聚合特征,包括:基于注意力机制对所述第k个候选特征与所述第k

1个待聚合特征进行加权融合,得到所述第k个候选聚合特征。4.根据权利要求1至3任一所述的方法,其特征在于,所述对所述目标图像进行n次特征提取,得到n个候选特征,包括:对所述目标图像进行n次下采样,得到n个下采样结果作为n个候选特征,其中,对第i

1次下采样得到的下采样结果进行第i次下采样,得到第i个下采样结果作为第i个候选特征。5.根据权利要求4所述的方法,其特征在于,所述对所述目标图像进行n次下采样,得到n个下采样结果作为n个候选特征,包括:对所述目标图像进行图像块分割,得到m个图像块,m为正整数;对所述m个图像块分别进行n次下采样,得到n个下采样结果作为n个候选特征,其中,m个图像块的第p次下采样结果组合得到第p个候选特征,1<p<n。6.根据权利要求1至...

【专利技术属性】
技术研发人员:陈珮娴张梦丹沈云航盛柯恺高雨婷李珂孙星
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1