一种目标识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：39044801 阅读：21 留言：0更新日期：2023-10-10 11:57

本申请提供了一种目标识别方法、装置、电子设备及可读存储介质。所述方法包括：获取文本命令和待处理图像；提取文本命令中各待处理目标的文本向量；对待处理图像进行处理，获得各对象的图像向量，图像向量用于表征对象的图像信息；根据文本向量和图像向量，计算各待处理目标与各对象的相似度；选取目标相似度，目标相似度大于预设相似度；根据目标相似度，获得各待处理图像对应的图像向量。本申请通过相似度，查找到与文本命令中待处理目标对应的图像向量，以能在图像中识别对应待处理目标的对象，使得图中存在未知对象也能够识别。使得图中存在未知对象也能够识别。使得图中存在未知对象也能够识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种目标识别方法、装置、电子设备及可读存储介质

[0001]本申请属于图像
，尤其涉及一种目标识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]利用传统的目标检测算法或分割算法，例如基于深度学习的方法，进行识别、分割目标。利用深度学习方法识别、分割目标的方式，只能识别训练过程中出现的目标，使得无法识别未知的目标。

技术实现思路

[0003]本申请实施例提供了一种目标识别方法、装置、电子设备、可读存储介质及计算机程序产品，可以解决无法识别未知的目标的问题。
[0004]第一方面，本申请实施例提供了一种目标识别方法，包括：
[0005]获取文本命令和待处理图像；
[0006]提取所述文本命令中各待处理目标的文本向量；
[0007]对所述待处理图像进行处理，获得各对象的图像向量，所述图像向量用于表征所述对象的图像信息；
[0008]根据所述文本向量和所述图像向量，计算所述各待处理目标与所述各对象的相似度；
[0009]选取目标相似度，所述目标相似度大于预设相似度；
[0010]根据所述目标相似度，获得所述各待处理目标对应的图像向量。
[0011]在一个实施例中，获取文本命令之前，还包括：
[0012]获取用户的语音指令；
[0013]对所述语音指令进行处理，获得文本命令。
[0014]在一个实施例中，所述获得所述各待处理图像对应的图像向量之后，还包括：
[0015]根据所述文本命令和所述各待处...

【技术保护点】

【技术特征摘要】
1.一种目标识别方法，其特征在于，包括：获取文本命令和待处理图像；提取所述文本命令中各待处理目标的文本向量；对所述待处理图像进行处理，获得各对象的图像向量，所述图像向量用于表征所述对象的图像信息；根据所述文本向量和所述图像向量，计算所述各待处理目标与所述各对象的相似度；选取目标相似度，所述目标相似度大于预设相似度；根据所述目标相似度，获得所述各待处理目标对应的图像向量。2.根据权利要求1所述的方法，其特征在于，获取文本命令之前，还包括：获取用户的语音指令；对所述语音指令进行处理，获得文本命令。3.根据权利要求1所述的方法，其特征在于，所述获得所述各待处理图像对应的图像向量之后，还包括：根据所述文本命令和所述各待处理目标对应的图像向量，确定动作序列，所述动作序列包括至少一个动作指令；向智能体发送所述动作序列，所述动作序列用于指示所述智能体执行所述动作指令，以使所述智能体完成所述文本命令。4.根据权利要求1所述的方法，其特征在于，所述提取所述文本命令中各待处理目标的文本向量，包括：解析所述文本命令，获得所述各待处理目标的文本信息；对每个所述文本信息进行编码，获得每个所述待处理目标的文本向量。5.根据权利要求1所述的方法，其特征在于，所述对所述待处理图像进行处理，获得各对象的图像向量，包括：将所述待处理图像划分成多个图像块，每个所述图像块包括一个对象；利用掩码，提取各图像块中的所述对象，获得所述各对象的物体图像；对每个所述物体图像进行编码，获得每个所述对象的图像向量。6.根据权利要求1至5任一项所述的方法，其特征在于，所述根据所述文本向量和所述图像向量，计算所述各待处理目标与所述各对象的相似度，包括：将...

【专利技术属性】
技术研发人员：陈加壹，于非，贺颖，孙喜龙，董淳光，赵哲一，
申请(专利权)人：人工智能与数字经济广东省实验室深圳，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人