图像识别方法、装置、存储介质以及电子设备制造方法及图纸

技术编号：35069491 阅读：11 留言：0更新日期：2022-09-28 11:30

本公开涉及一种图像识别方法、装置、存储介质以及电子设备，涉及图像技术领域，该方法将图像对输入特征提取模型，获得目标融合特征向量，并基于该目标融合特征向量确定图像识别结果。其中，特征提取模型中的第一特征提取网络从第一图像中提取到不同维度的第一图像特征，特征提取模型中的第二特征提取网络从第二图像中提取到不同维度的第二图像特征，通过融合层从第一图像特征以及第二图像特征中捕捉多模态特征之间的互补性，并且将不同层级的融合特征向量进行整合，使得生成的目标融合特征向量能够充分表达第一图像以及第二图像具有的图像语义特征。以使得获得精细的图像识别结果，从而促进鲁棒的场景表示。从而促进鲁棒的场景表示。从而促进鲁棒的场景表示。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置、存储介质以及电子设备

[0001]本公开涉及图像
，具体地，涉及一种图像识别方法、装置、存储介质以及电子设备。

技术介绍

[0002]图像语义分割作为一种新兴的图像处理技术，其目的在于根据图像内容识别出图像中每一像素点的语义类别。作为图像和视频理解的基础，图像语义分割被广泛应用于自动驾驶、医疗辅助以及机器人环境感知等领域。
[0003]在相关技术中，为了提高图像语义分割的准确率，往往会使用多模态融合方法，但是相关的多模态融合方法未能有效挖掘多模态图像的上下文信息，导致图像语义分割模型的准确率较低。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种图像识别方法，包括：
[0006]获取图像对，其中，所述图像对包括采用不同拍摄方式对同一场景进行拍摄获得的第一图像和第二图像；
[0007]将所述图像对输入训练好的特征提取模型，获得所述图像对的目标融合特征向量；
[0008]基于所述目标融合特征向量，获得图像识别结果；
[0009]其中，所述特征提取模型包括用于提取所述第一图像的第一图像特征的第一特征提取网络以及用于提取所述第二图像的第二图像特征的第二特征提取网络，且所述第一特征提取网络以及所述第二特征提取网络具有...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：获取图像对，其中，所述图像对包括采用不同拍摄方式对同一场景进行拍摄获得的第一图像和第二图像；将所述图像对输入训练好的特征提取模型，获得所述图像对的目标融合特征向量；基于所述目标融合特征向量，获得图像识别结果；其中，所述特征提取模型包括用于提取所述第一图像的第一图像特征的第一特征提取网络以及用于提取所述第二图像的第二图像特征的第二特征提取网络，且所述第一特征提取网络以及所述第二特征提取网络具有相同数量级的依次连接的特征提取层，所述第一特征提取网络以及所述第二特征提取网络中相同层级的所述特征提取层与同一个融合层连接；所述融合层用于根据与该融合层连接的两个所述特征提取层分别提取到的所述第一图像特征、所述第二图像特征以及该特征提取层的前一特征提取层对应的融合层输出的特征向量，获得对应的融合特征向量；所述目标融合特征向量为任一所述融合层输出的融合特征向量。2.根据权利要求1所述的方法，其特征在于，所述融合层包括：级联交互模块，用于根据与该融合层连接的两个所述特征提取层提取到的所述第一图像特征以及所述第二图像特征，获得初始融合特征；第一卷积模块，用于将所述第一图像特征与所述初始融合特征进行融合，获得第一融合特征；第二卷积模块，用于将所述第二图像特征与所述初始融合特征进行融合，获得第二融合特征；融合模块，用于根据所述第一融合特征、所述第二融合特征以及该特征提取层的前一特征提取层对应的融合层输出的特征向量，获得对应的融合特征向量。3.根据权利要求2所述的方法，其特征在于，所述第一图像为RGB图像，所述级联交互模块具体用于：以所述第一图像特征为基准，融合所述第二图像特征与所述第一图像特征，获得所述初始融合特征。4.根据权利要求3所述的方法，其特征在于，所述级联交互模块包括：第一处理层，用于对所述第一图像特征以及所述第二图像特征进行逐元素求和运算，获得第一特征向量；第二处理层，用于对所述第一图像特征以及所述第一特征向量进行卷积处理，获得第一卷积特征向量，并对所述第一卷积特征向量以及所述第二图像特征进行对位元素相乘运算，获得第二特征向量；第三处理层，用于对所述第一图像特征以及所述第二特征向量进行卷积处理，获得第二卷积特征向量，并对所述第一卷积特征向量以及所述第二图像特征进行特征串联运算，获得第三特征向量；拼接层，用于融合所述第一特征向量、所述第二特征向量、所述第三特征向量以及所述第一图像特征，获得所述初始融合特征。5.根据权利要求2所述的方法，其特征在于，所述融合模块具体用于：
对该特征提取层的前一特征提取层对应的融合层输出的特征向量进行双线性插值操作，获得插值结果；对所述...

【专利技术属性】
技术研发人员：边成，张志诚，李永会，
申请(专利权)人：抖音视界北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人