【技术实现步骤摘要】
一种基于视图过滤的聚合卷积三维模型分类方法
[0001]本专利技术属于计算机视觉
,尤其涉及一种基于视图过滤的聚合卷积三维模型分类方法。
技术介绍
[0002]目前,三维模型识别是计算机图形学和计算机视觉的一个重要研究方向。三维模型是真实物体虚拟化表示,它通常可以用不同的格式表示,比较有代表性的如点云,体积网格和从单一视角捕捉的二维图像。近年来,随着3D采集技术(比如苹果深度相机和Kinect)的快速发展,三维模型在医疗、虚拟现实/增强现实和自动驾驶等领域被应用,推动了三维模型识别的发展。
[0003]近年来,大量的方法被提出,在三维模型识别上实现了良好的性能。按照三维形状的表示,可以将这些方法分为基于点的方法、基于体积的方法和基于多视图的方法。基于多视图的方法主要的问题是如何将多视图的特征融合成一个紧凑且可分辨的全局的三维形状描述符。基于体积的方法通常是先将点云转化成三维网格,然后从三维网格中学习三维形状的特征以实现形状分类。在基于点的方法中,每个点都用于特征学习,可以分为逐点MLP方法、基于卷积的方法、基于图的方法等经典方法。
[0004]现有的基于多视图的方法在三维形状识别方面有着最优的性能,但是仍然受到了一些限制。多视图序列可以有效地利用连续的多视图中所包含的特征信息,但更普遍的情况,如相机在正十二面体顶点上拍摄的多视图包含的三维几何信息被多视图序列所忽略,而且无法处理视图缺失问题。基于点的方法虽然使用了具有完整信息的点云作为输入,但是由于点云的非结构化和高维化等因素,严重影响了基于点的 ...
【技术保护点】
【技术特征摘要】
1.一种基于视图过滤的聚合卷积三维模型分类方法,其特征在于,所述基于视图过滤的聚合卷积三维模型分类方法包括:将所有三维模型通过视图捕获的方式,转换成三维模型多视图数据;利用二维图像分类网络,对多视图数据进行训练,投票排序,生成视图序列;提取视图序列中前k个视图的特征,对k视图特征进行拆分重组,将重塑的k视图特征输入聚合卷积,聚合多视图特征,生成一个三维模型全局形状描述符;采用全连接层和全局形状描述符进行三维模型分类。2.如权利要求1所述的基于视图过滤的聚合卷积三维模型分类方法,其特征在于,所述将所有三维模型通过视图捕获的方式,转换成三维模型多视图数据具体包括:将所有三维模型通过视图渲染捕获的方式,转换成三维模型多视图数据三维模型数据集为ModelNet40,训练集和测试集中的三维模型数分别为9843和2468个。3.如权利要求1所述的基于视图过滤的聚合卷积三维模型分类方法,其特征在于,所述利用二维图像分类网络,对多视图数据进行训练,投票排序,生成视图序列具体包括:多视图数据中的每个视图图像I
i
通过一个二维图像分类网络得到每个视图的预测标签其中l
i
∈{0,1,...,c
‑
1},c表示分类任务中共有c个类别,比较预测标签与真实标签1},c表示分类任务中共有c个类别,比较预测标签与真实标签得到预测结果表示预测错误,p
i
=1表示预测正确,N=20。4.如权利要求1所述的基于视图过滤的聚合卷积三维模型分类方法,其特征在于,所述提取视图序列中前k个视图的特征,对k视图特征进行拆分重组,将重塑的k视图特征输入聚合卷积,聚合多视图特征,生成一个三维模型全局形状描述符具体包括:首先将所有三维模型的多视图预测结果定义为其中M是分类任务中所有形状的数量,基于预测结果P,进行实例级投票:所有模型的同一视点的预测结果累加,给构造一个辅助序列再对实例级投票结果进行排序:V
′
ins.
=ψ
ins.
(V
ins.
,A
ins.
)其中,排序函数ψ
ins.
将V
ins.
从大到小排列,序列A
ins.
记录了排序过程中,V
ins.
中每个数字的位置变化,最终生成序列V
′
ins.
={i}
i∈{1,2,...,N}
,序列V
′
ins.
中的每个数字代表了一个视点的视图,生成实例级投票的视图序列。5.如权利要求1所述的基于视图过滤的聚合卷积三维模型分类方法,其特征在于,所述采用全连接层和全局形状描述符进行三维模型分类具体包括:继续用定义的预测结果再将所有三维模型多视图的预测标签定义为对同一
类别的...
【专利技术属性】
技术研发人员:张雨禾,刘泽华,高健,郭宝,王淑睿,
申请(专利权)人:西北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。