【技术实现步骤摘要】
图像识别方法、装置、设备、存储介质及计算机程序产品
[0001]本申请涉及机器学习领域,特别涉及一种图像识别方法、装置、设备、存储介质及计算机程序产品。
技术介绍
[0002]目标检测(Object Decetion)是指针对一张图像中包含多个对象时,对多个对象进行识别,确定对象对应的类别以及对象位于图像中的位置信息。
[0003]相关技术中,针对目标检测任务,通常采用将传统检测网络中的卷积神经网络替换成一个转换网络(Tranformer网络),用于提取图像特征,此外,在Transformer网络后设计一个特征金字塔网络(Feature Pyramid Networks,FPN),用于提取不同尺度下的图像特征,从而根据不同尺度下的图像特征输出得到最终的预测结果。
[0004]然而相关技术中的方案,针对不同尺度的图像特征进行目标检测的方式,会导致在检测过程中的计算开销过高,造成检测结果的输出效率较低,输出结果的准确度较低。
技术实现思路
[0005]本申请实施例提供了一种图像识别方法、装置、设备、存储介质及计算机程序产品,能够提高图像识别效率。所述技术方案如下:
[0006]一方面,提供了一种图像识别方法,所述方法包括:
[0007]获取目标图像,所述目标图像中包括对象元素,所述对象元素作为图像内容处于所述目标图像中;
[0008]对所述目标图像进行n次特征提取,得到n个候选特征,其中,n为大于1的整数,且第i次特征提取是基于第i
‑
1次提取得到 ...
【技术保护点】
【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取目标图像,所述目标图像中包括对象元素,所述对象元素作为图像内容处于所述目标图像中;对所述目标图像进行n次特征提取,得到n个候选特征,其中,n为大于1的整数,且第i次特征提取是基于第i
‑
1次提取得到的第i
‑
1个候选特征执行的,0<i≤n;对n个候选特征进行聚合编码,得到聚合特征;对所述聚合特征进行对象识别,得到对象识别结果,其中,所述对象识别结果用于指示所述目标图像中所包含的对象元素信息,所述对象元素信息包括对象类别和对象显示位置中的至少一种。2.根据权利要求1所述的方法,其特征在于,所述对n个候选特征进行聚合编码,得到聚合特征,包括:在聚合第k个候选特征时,将前k
‑
1个候选特征聚合得到的候选聚合特征向第k个候选特征的特征尺寸进行采样,得到第k
‑
1个待聚合特征,1<k<n;将第k个候选特征与所述第k
‑
1个待聚合特征进行融合,得到第k
‑
1个候选聚合特征,直至所述n个候选特征聚合完成,得到所述聚合特征。3.根据权利要求2所述的方法,其特征在于,所述将第k个候选特征与所述第k
‑
1个待聚合特征进行融合,得到第k
‑
1个候选聚合特征,包括:基于注意力机制对所述第k个候选特征与所述第k
‑
1个待聚合特征进行加权融合,得到所述第k个候选聚合特征。4.根据权利要求1至3任一所述的方法,其特征在于,所述对所述目标图像进行n次特征提取,得到n个候选特征,包括:对所述目标图像进行n次下采样,得到n个下采样结果作为n个候选特征,其中,对第i
‑
1次下采样得到的下采样结果进行第i次下采样,得到第i个下采样结果作为第i个候选特征。5.根据权利要求4所述的方法,其特征在于,所述对所述目标图像进行n次下采样,得到n个下采样结果作为n个候选特征,包括:对所述目标图像进行图像块分割,得到m个图像块,m为正整数;对所述m个图像块分别进行n次下采样,得到n个下采样结果作为n个候选特征,其中,m个图像块的第p次下采样结果组合得到第p个候选特征,1<p<n。6.根据权利要求1至...
【专利技术属性】
技术研发人员:陈珮娴,张梦丹,沈云航,盛柯恺,高雨婷,李珂,孙星,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。