System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机视觉和神经网络,更具体地,涉及一种三维目标检测模型的训练方法、三维目标检测方法、三维目标检测模型的训练装置、三维目标检测装置、电子设备、计算机可读存储介质、计算机程序产品。
技术介绍
1、三维目标检测是计算机视觉领域中的重要技术之一,旨在通过点云数据准确识别和定位三维空间中的目标。该技术在自动驾驶、机器人导航、三维重建等应用场景中具有重要的应用价值。
2、目前,三维目标检测主流方法将三维点云体素化后再序列化,接着将其分组为多个子序列,输入自注意力模型进行特征提取,提取后的点云特征被用于进行目标检测。然而自注意力模型存在一个显著问题,即其具有二次复杂度,计算成本高,对于点云这样输入数据规模较大的场景,模型的速度和准确度难以平衡。
3、为了解决三维目标检测方法所存在的技术问题,相关技术人员提出了诸多技术方案,例如尝试使用通用线性复杂度模型代替自注意力模型,但缺乏针对性的设计,导致性能表现不佳。另一些方法则试图通过利用大量数据集来提升模型的表现,而这无法解决自注意力模型本身计算复杂度较高的问题,进而导致训练时间过长,精度提升小。
技术实现思路
1、有鉴于此,本申请提供了一种三维目标检测模型的训练方法、三维目标检测方法、三维目标检测模型的训练装置、三维目标检测装置、电子设备、计算机可读存储介质、计算机程序产品。
2、本申请的一个方面提供了一种三维目标检测模型的训练方法,包括:
3、获取训练数据集合,其中,上述训练数据集合包括多
4、针对每个上述点云训练数据,基于预设三维体素化规则,对上述点云训练数据进行体素化处理,得到多个网格点云特征;
5、利用第一初始编码网络处理多个上述网格点云特征,得到目标点云特征,其中,上述第一初始编码网络是基于序列化模块和目标线性复杂度模型构建的;
6、利用第二初始编码网络对上述目标点云特征进行目标检测处理,得到目标预测结果,其中,初始检测模型包括上述第一初始编码网络和上述第二初始编码网络;
7、对上述目标预测结果和与上述点云训练数据对应的目标边界框属性信息进行匹配处理,得到目标匹配结果;
8、将上述目标匹配结果输入目标损失函数,得到目标损失值,以根据上述目标损失值迭代地调整上述初始检测模型的网络参数,从而得到上述三维目标检测模型。
9、根据本申请的实施例,上述点云训练数据包括多个点云信息。
10、根据本申请的实施例,基于预设三维体素化规则,对上述点云训练数据进行体素化处理,得到多个网格点云特征,包括:
11、基于体素位置计算公式对每个上述点云信息进行计算以映射在初始三维网格图上,得到目标三维网格图,其中,上述目标三维网格图包括多个体素网格;
12、针对每个上述体素网格,对上述体素网格内的多个上述点云信息进行平均池化处理,得到一个上述网格点云特征。
13、根据本申请的实施例,上述第一初始编码网络包括m个数据处理结构,上述数据处理结构包括上述序列化模块和上述目标线性复杂度模型。
14、根据本申请的实施例,利用第一初始编码网络处理多个上述网格点云特征,得到目标点云特征,包括:
15、针对第i数据处理结构,对输入数据进行下采样处理,得到采样数据,其中,上述输入数据包括在i=1时的上述网格点云特征或在1<i<m时的第i-1目标采样特征;
16、利用上述序列化模块处理上述采样数据,得到体素序列;
17、利用上述目标线性复杂度模型处理上述体素序列,得到第i目标采样特征,其中,在i=m时,上述第i目标采样特征表征上述目标点云特征。
18、根据本申请的实施例,利用上述序列化模块处理上述采样数据,得到体素序列,包括:
19、对上述采样数据进行二进制转换处理,得到格式数据,其中,上述格式数据包括二进制比特;
20、基于预设调整规则,对上述格式数据中的二进制比特进行比特调整处理,得到调整后的数据;
21、对上述调整后的数据进行格雷码解码处理,得到解码数据;
22、对上述解码数据进行十进制转换处理,得到对应每个上述体素网格的体素位置数据;
23、利用希尔伯特曲线处理多个上述体素位置数据,得到上述体素序列。
24、根据本申请的实施例,利用上述目标线性复杂度模型处理上述体素序列,得到第i目标采样特征,包括:
25、利用状态空间模型处理上述体素序列,得到上述状态空间模型的模型权重;
26、根据状态向量、上述体素序列和参数矩阵集合,生成输出向量,其中,上述状态向量是根据上述模型权重确定的;
27、对上述输出向量进行上采样处理,得到上述第i目标采样特征。
28、根据本申请的实施例,利用第二初始编码网络对上述目标点云特征进行目标检测处理,得到目标预测结果,包括:
29、利用卷积结构对上述目标点云特征进行下采样处理,得到目标卷积特征,其中,上述卷积结构包括依次连接的多个三维卷积层;
30、利用分类回归结构对上述目标卷积特征进行分类预测处理,得到每个上述检测目标的预测类别向量和上述检测目标所处的预测边界框属性向量,其中,上述目标预测结果包括上述预测类别向量和上述预测边界框属性向量。
31、根据本申请的实施例,上述目标预测结果包括多个上述检测目标的预测类别向量和预测边界框属性向量。
32、根据本申请的实施例,对上述目标预测结果和与上述点云训练数据对应的目标边界框属性信息进行匹配处理,得到目标匹配结果,包括:
33、针对每个上述检测目标,根据上述预测边界框属性向量和上述目标边界框属性信息中的多个上述真实边界框,生成上述检测目标的重叠匹配矩阵,其中,上述重叠匹配矩阵包括多个矩阵参数;
34、针对任一上述矩阵参数,在上述矩阵参数满足预设阈值的情况下,将与上述矩阵参数对应的检测目标的类型参数确定为目标类型,并计算上述检测目标为上述目标类型的类型得分,其中,上述目标匹配结果包括上述重叠匹配矩阵和上述目标类型。
35、根据本申请的实施例,将上述目标匹配结果输入目标损失函数,得到目标损失值,包括:
36、根据多个上述目标类型和与每个上述目标类型的类型得分,计算分类损失值;
37、根据上述重叠匹配矩阵计算回归损失值;
38、根据上述分类损失值和上述回归损失值,生成上述目标损失值。
39、本申请的另一个方面提供了一种三维目标检测方法,包括:
40、获取包含至少一个检测对象的待处理点云数据;
41、将上述待处理点云数据输入至三维目标检测模型中,输出目标检本文档来自技高网...
【技术保护点】
1.一种三维目标检测模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述点云训练数据包括多个点云信息;
3.根据权利要求1或2所述的方法,其特征在于,所述第一初始编码网络包括m个数据处理结构,所述数据处理结构包括所述序列化模块和所述目标线性复杂度模型;
4.根据权利要求3所述的方法,其特征在于,利用所述序列化模块处理所述采样数据,得到体素序列,包括:
5.根据权利要求3所述的方法,其特征在于,利用所述目标线性复杂度模型处理所述体素序列,得到第i目标采样特征,包括:
6.根据权利要求1所述的方法,其特征在于,利用第二初始编码网络对所述目标点云特征进行目标检测处理,得到目标预测结果,包括:
7.根据权利要求1所述的方法,其特征在于,所述目标预测结果包括多个所述检测目标的预测类别向量和预测边界框属性向量;
8.一种三维目标检测方法,其特征在于,包括:
9.一种三维目标检测模型的训练装置,其特征在于,包括:
10.一种三维目标检测装置,其特征在于,包括
...【技术特征摘要】
1.一种三维目标检测模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述点云训练数据包括多个点云信息;
3.根据权利要求1或2所述的方法,其特征在于,所述第一初始编码网络包括m个数据处理结构,所述数据处理结构包括所述序列化模块和所述目标线性复杂度模型;
4.根据权利要求3所述的方法,其特征在于,利用所述序列化模块处理所述采样数据,得到体素序列,包括:
5.根据权利要求3所述的方法,其特征在于,利用所述目标线性复杂度模...
【专利技术属性】
技术研发人员:张天柱,艾煜博,杨文飞,张勇东,吴枫,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。