目标识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36263646 阅读:22 留言:0更新日期:2023-01-07 10:02
本发明专利技术提供一种目标识别方法、装置、电子设备及存储介质,其中方法包括:确定待识别的点云数据;对所述点云数据进行投影,得到多个第一投影图像;对所述多个第一投影图像进行反采样,得到多个第二投影图像;基于所述多个第二投影图像,以及与所述多个第二投影图像相对应的多个分类提示文本,对所述点云数据进行目标识别,以确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本,其中所述多个分类提示文本是基于多个分类标签以及提示文本而得到的,所述提示文本是基于投影参数和/或反采样参数而构建的。本发明专利技术提供的方法、装置、电子设备及存储介质,进一步提高了目标识别的准确率。了目标识别的准确率。了目标识别的准确率。

【技术实现步骤摘要】
目标识别方法、装置、电子设备及存储介质


[0001]本专利技术涉及目标识别
,尤其涉及一种目标识别方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,基于点云的目标识别算法成为实现自动驾驶的关键技术之一。传统的基于点云的目标识别算法需要大量的点云数据进行训练,采集训练样本的成本很高且很耗时。而训练好的基于点云的目标识别算法仅适用于同一来源的数据,对于不同条件下采集的点云数据,基于点云的目标识别算法不经过重新训练,因此,预测结果的准确率低。
[0003]现有技术中零样本/小样本算法使用CLIP(Contrastive Language

Image Pre

training,)算法实现基于点云的目标识别。而CLIP算法训练采用的是自然图像的点云数据,点云数据是三维数据,需要先将三维点云投影到二维空间,由此产生的二维投影图像中的目标的边缘不连续,产生了噪声,投影图像的分布与自然图像的分布不一致进一步降低了目标识别的准确率。

技术实现思路

[0004]本专利技术提供一种目标识别方法、装置、电子设备及存储介质,用以解决现有技术中二维图像中的目标的边缘不连续,产生了噪声,进一步降低了目标识别的准确率的缺陷。
[0005]本专利技术提供一种目标识别方法,包括:
[0006]确定待识别的点云数据;
[0007]对所述点云数据进行投影,得到多个第一投影图像;
[0008]对所述多个第一投影图像进行反采样,得到多个第二投影图像;
[0009]基于所述多个第二投影图像,以及与所述多个第二投影图像相对应的多个分类提示文本,对所述点云数据进行目标识别,以确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本,其中所述分类提示文本是基于多个分类标签以及提示文本而得到的,所述提示文本是基于投影参数和/或反采样参数而构建的。
[0010]根据本专利技术提供的一种目标识别方法,所述投影参数是对所述点云数据进行投影所应用的参数,所述反采样参数是对所述多个第一投影图像进行反采样所应用的参数。
[0011]根据本专利技术提供的一种目标识别方法,所述投影参数包括投影数量和/或投影方向。
[0012]根据本专利技术提供的一种目标识别方法,所述基于所述多个第二投影图像,以及与所述多个第二投影图像相对应的多个分类提示文本,对所述点云数据进行目标识别,以确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本,包括:
[0013]基于图像编码器,对所述多个第二投影图像进行编码,得到图像编码特征;
[0014]基于文本编码器,对所述多个分类提示文本进行编码,得到多个文本编码特征;
[0015]基于所述图像编码特征和所述多个文本编码特征之间的相似度,确定所述多个分
类提示文本中与所述多个第二投影图像唯一对应的分类提示文本。
[0016]根据本专利技术提供的一种目标识别方法,所述相似度至少包括所述图像编码特征和所述文本编码特征的内积。
[0017]根据本专利技术提供的一种目标识别方法,所述对所述多个第一投影图像进行反采样,得到多个第二投影图像,包括:
[0018]基于低通滤波器对所述多个第一投影图像进行反采样,得到多个第二投影图像。
[0019]根据本专利技术提供的一种目标识别方法,所述低通滤波器包括至少两个高斯滤波器。
[0020]根据本专利技术提供的一种目标识别方法,所述点云数据是三维数据,所述多个第一投影图像和所述多个第二投影图像是二维数据。
[0021]本专利技术还提供一种目标识别装置,包括:
[0022]确定单元,用于确定待识别的点云数据;
[0023]投影单元,用于对所述点云数据进行投影,得到多个第一投影图像;
[0024]反采样单元,用于对所述多个第一投影图像进行反采样,得到多个第二投影图像;
[0025]目标识别单元,用于基于所述多个第二投影图像,以及与所述多个第二投影图像相对应的多个分类提示文本,对所述点云数据进行目标识别,以确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本,其中所述多个分类提示文本是基于多个分类标签以及提示文本而得到的,所述提示文本是基于投影参数和/或反采样参数而构建的。
[0026]根据本专利技术提供的目标识别装置,所述投影参数是对所述点云数据进行投影所应用的参数,所述反采样参数是对所述多个第一投影图像进行反采样所应用的参数。
[0027]根据本专利技术提供的目标识别装置,所述投影参数包括投影数量和/或投影方向。
[0028]根据本专利技术提供的目标识别装置,目标识别单元具体用于:
[0029]基于图像编码器,对所述多个第二投影图像进行编码,得到图像编码特征;
[0030]基于文本编码器,对所述多个分类提示文本进行编码,得到多个文本编码特征;
[0031]基于所述图像编码特征和所述多个文本编码特征之间的相似度,确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本。
[0032]根据本专利技术提供的目标识别装置,所述相似度至少包括所述图像编码特征和所述文本编码特征的内积。
[0033]根据本专利技术提供的目标识别装置,反采样单元具体用于:
[0034]基于低通滤波器对所述多个第一投影图像进行反采样,得到多个第二投影图像。
[0035]根据本专利技术提供的目标识别装置,所述低通滤波器包括至少两个高斯滤波器。
[0036]根据本专利技术提供的目标识别装置,所述点云数据是三维数据,所述多个第一投影图像和所述多个第二投影图像是二维数据。
[0037]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述目标识别方法。
[0038]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述目标识别方法。
[0039]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述目标识别方法。
[0040]本专利技术提供的目标识别方法、装置、电子设备及存储介质,多个第二投影图像是对多个第一投影图像进行反采样得到的,由此得到的多个第二投影图像中的目标的边缘是连续分布的,从而更接近实际采集的自然图像;基于多个第二投影图像,以及与多个第二投影图像相对应的多个分类提示文本,对点云数据进行目标识别,进一步提高了目标识别的准确率,并且分类提示文本是与多个第二投影图像相对应的,可以进一步提高目标识别的准确率。
附图说明
[0041]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标识别方法,其特征在于,包括:确定待识别的点云数据;对所述点云数据进行投影,得到多个第一投影图像;对所述多个第一投影图像进行反采样,得到多个第二投影图像;基于所述多个第二投影图像,以及与所述多个第二投影图像相对应的多个分类提示文本,对所述点云数据进行目标识别,以确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本,其中所述多个分类提示文本是基于多个分类标签以及提示文本而得到的,所述提示文本是基于投影参数和/或反采样参数而构建的。2.根据权利要求1所述的目标识别方法,其特征在于,所述投影参数是对所述点云数据进行投影所应用的参数,所述反采样参数是对所述多个第一投影图像进行反采样所应用的参数。3.根据权利要求1所述的目标识别方法,其特征在于,所述投影参数包括投影数量和/或投影方向。4.根据权利要求1所述的目标识别方法,其特征在于,所述基于所述多个第二投影图像,以及与所述多个第二投影图像相对应的多个分类提示文本,对所述点云数据进行目标识别,以确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本,包括:基于图像编码器,对所述多个第二投影图像进行编码,得到图像编码特征;基于文本编码器,对所述多个分类提示文本进行编码,得到多个文本编码特征;基于所述图像编码特征和所述多个文本编码特征之间的相似度,确定所述多个分类提示文本中与所述多个第二投影图像唯一对应的分类提示文本。5.根据权利要求4所述的目标识别方法,其特征在于,所述相似度至少包括所述图像编码特征和所述文本编码特征的内积。6.根据权利要求1至5中任一项所述的目标识别方法,其特征在于,所述对所述多个第一投影图像进行反采样,得到多个第二投影图像,包括:基于低通滤波器对所述多个第一投影图像进行反采样,得到多个第二投影图像。7.根据权利要求6所述的目标识别方法,其特征在于,所述低通滤波器包括至少两个高斯滤波器。8.根据权利要求1至5中任一项所述的目标识别方法,其特征在于,所述点云数据是三维数据,所述多个第一投影图像和所述多个第二投影图像是二维数据。9.一种目标识别装置,其特征在于,包括:确定单元,用于确定待识别的点云数据;投影单元,用于对所述点云数据进行投影,得到多个第一投影图像;反采样单元,用于对所述多个第一投影图像进行反采样,得到多个第二...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:上海壁仞智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1