开放世界目标检测方法、计算机设备及存储介质技术

技术编号：38994733 阅读：26 留言：0更新日期：2023-10-07 10:25

本发明专利技术实施例提供一种开放世界目标检测方法、计算机设备及存储介质。所述方法包括：获取待识别的图像数据以及对应的目标文本标签；确定待识别的图像数据的目标感兴趣区域，并通过预训练图像模型对目标感兴趣区域进行特征提取得到目标区域图向量；确定目标文本标签对应的类别信息，并通过预训练文本模型对类别信息进行特征提取，得到目标词向量；通过目标神经网络模型对目标区域图向量以及目标词向量进行分析，得到待识别的图像数据的识别结果，其中，目标神经网络为MLP多层感知机网络。本申请实施例旨在基于图像数据以及其对应的文本标签实现图片的识别，以实现提高识别结果的精确度以及识别效率。尤其是对于医学影像的识别，能够降低识别的难度。能够降低识别的难度。能够降低识别的难度。

全部详细技术资料下载

【技术实现步骤摘要】
开放世界目标检测方法、计算机设备及存储介质

[0001]本申请涉及深度学习领域，尤其涉及一种开放世界目标检测方法、计算机设备及计算机可读存储介质。

技术介绍

[0002]开放世界目标检测是计算机视觉领域中的一种技术，其目的是在无限制的场景中检测和识别目标，主要用于医学影像的病灶检测、智能交通、机器人导航、安防监控等领域。开放世界目标检测不同于传统的目标检测，它不仅需要识别出目标的位置，还需要在真实复杂场景中识别出新的目标类别。
[0003]传统的开放世界目标检测主要是通过深度学习模型利用有限的图像数据集进行训练，训练的分类器只具备识别标注类别的能力，但在非固定场景下，并不具备高效识别已知类别和未知类别的能力。尤其在医疗影像中，传统的开放世界目标检测具有明显的劣势，其识别结果容易受到场景的限制，且精度较低，识别难度较高。

技术实现思路

[0004]本申请提供了一种开放世界目标检测方法、计算机设备及计算机可读存储介质，旨在基于图像数据以及其对应的文本标签实现图片的识别，以实现提高识别结果的精确度以及识别效率。
[0005]为实现上述目的，本申请提供一种开放世界目标检测方法，所述方法包括：
[0006]获取待识别的图像数据以及其对应的目标文本标签；
[0007]确定所述待识别的图像数据的目标感兴趣区域，并通过预训练图像模型对所述目标感兴趣区域进行特征提取得到目标区域图向量；
[0008]确定所述目标文本标签对应的类别信息，并通过预训练文本模型对所述类别信息进行特征提取...

【技术保护点】

【技术特征摘要】
1.一种开放世界目标检测方法，其特征在于，所述方法包括：获取待识别的图像数据以及其对应的目标文本标签；确定所述待识别的图像数据的目标感兴趣区域，并通过预训练图像模型对所述目标感兴趣区域进行特征提取得到目标区域图向量；确定所述目标文本标签对应的类别信息，并通过预训练文本模型对所述类别信息进行特征提取，得到目标词向量；通过目标神经网络模型对所述目标区域图向量以及所述目标词向量进行分析，得到待识别的图像数据的识别结果，其中，所述目标神经网络为MLP多层感知机网络。2.根据权利要求1所述的方法，其特征在于，所述类别信息包括基类和新类，所述目标词向量包括第一词向量以及第二词向量，所述确定所述目标文本标签对应的类别信息，并通过预训练文本模型对所述类别信息进行特征提取，得到目标词向量，包括：确定所述目标文本标签对应的基类以及新类；通过所述预训练文本模型对所述目标文本标签对应的基类以及新类进行特征提取，得到对应的所述第一词向量以及所述第二词向量。3.根据权利要求2所述的开放世界目标检测方法，其特征在于，所述通过目标神经网络模型对所述目标区域图向量以及所述目标词向量进行分析，得到待识别的图像数据的识别结果，包括：通过所述MLP多层感知机网络分别对所述目标区域图向量和所述第一词向量、所述目标区域图向量和所述第二词向量进行分析，得到多个第一相似结果以及多个第二相似结果；将每一所述第一相似结果、每一所述第二相似结果分别通过函数归一化，得到函数归一化结果；基于所述函数归一化结果得到所述待识别的图像数据的识别结果。4.根据权利要求3所述的开放世界目标检测方法，其特征在于，所述方法还包括：所述MLP多层感知机网络将所述目标区域图向量和所述第一词向量进行点积操作，以及将所述目标区域图向量和所述第二词向量进行点积操作，得到多个所述第一相似结果以及多个所述第二相似结果。5.根据权利要求2所述的方法，其特征在于，所述将每一所述第一相似结果、每一所述第二相似结果分别通过函数归一化，得到函数归一化结果，包括：通过目标softmax函数归一化将每一所述第一相似结果以及每一所述第二相似结果进行加和，得到相似结果总和；将每一所述第一相似结果以及每一所述第二相似结果分别除以所述相似结果总和，得到函数归一化结果。6.根...

【专利技术属性】
技术研发人员：唐小初，谢亮晶，舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人