本发明专利技术提供一种基于卷积神经网络的体素标记方法、装置、终端及介质,包括:获取历史场景体素化数据,并对其进行人工标记以得到历史体素标记数据;将历史场景体素化数据作为输入以及将历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型;利用其对目标场景体素化数据进行自动化标记,以得到目标体素标记数据。本申请提供的VoxelAI模型通过对3D体素化数据进行数据展开以形成多层二维特征图,可以实现卷积神经网络对3D体素化数据进行学习,进而实现对3D体素化数据的自动化标记,不仅解决了人工标记成本过高的问题,而且提高了标记效率。了标记效率。了标记效率。
【技术实现步骤摘要】
基于卷积神经网络的体素标记方法、装置、终端及介质
[0001]本申请涉及计算机
,特别是涉及一种基于卷积神经网络的体素标记方法、装置、终端及介质。
技术介绍
[0002]体素(Voxel)是体积元素(Volume Pixel)的简称,包含体素的立体可以通过立体渲染或者提取给定阈值轮廓的多边形等值面表现出来。一如其名,是数字数据于三维空间分割上的最小单位,体素用于三维成像、科学数据与医学影像等领域。体素(Voxel)也可理解为像素(pixel)、体积(volume)和元素(element)的组合词,相当于3D空间中的像素。如图1所示,展示为某一包围盒的体素示意图,其中,每一个立方体都表示一个体素(Voxel);height表示该包围盒的高度,本图以5个体素高度为例;depth表示该包围盒的深度,本图以5个体素深度为例;width表示该包围盒的宽度,本图以5个体素宽度为例;boundsMin(local origin)表示该包围盒的最小位置(局部原点);boundsMax表示该包围盒的最大位置;cellHeight表示栅格高度即体素高度;cellSize表示栅格尺寸即体素尺寸(包括体素的深度和宽度);Cell Column表示单元格列。
[0003]当前对于体素的应用非常广泛,在游戏行业中,一般会用于对大型3D场景进行体素化处理,结合图2A、2B所示,分别展示为原始3D场景示意图和体素化后的3D场景示意图。现有体素化的技术都比较成熟,一般游戏制作时,首先会将3D场景体素化,然后对每个体素进行标记,比如有些地方禁止让玩家走上去,可以标记为不可行走;有些地方禁止用于相机碰撞,可以标记为不可碰撞等等,如图2C所示,展示为标记后的3D栋场景示意图,根据不同颜色进行不同标记,其中区域
①
的颜色表示不可行走标记;区域
②
的颜色表示不可碰撞标记;区域
③
的颜色表示可行走标记。现有标记过程一般需要人工标记,适用于场景较小的情况,当面对超大型场景,生成的体素会有千万的量级,如果单纯靠人工进行标记,将产生巨大的工作量。
[0004]目前对于一张1024*1024大小的场景,基于现有的标记工具,一个人需要几个小时的时间才能粗略标记完成,如果要进行精细化标记,甚至要以天为单位。而且面对在开发阶段的项目,场景的变化是非常频繁的,每天都在变化;每次场景发生变化,就需要人工进行标记处理,对此,标记的人工成本也会持续增加。如图3所示,展示为现有体素标记方法的流程示意图。现有技术中通过人工进行标记不仅人工成本高,而且工作效率低下,费时又费力。
[0005]深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
[0006]目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉、分类等领域上,都取得了非常好的效果。但是现有的卷积神经网络却无法直接处理3D体素数据。
技术实现思路
[0007]鉴于以上所述现有技术的缺点,本申请的目的在于提供一种基于卷积神经网络的体素标记方法、装置、终端及介质,用于解决现有技术中卷积神经网络无法处理3D体素数据、通过人工标记体素化数据费时费力且成本高效率低的技术问题。
[0008]为实现上述目的及其他相关目的,本申请的第一方面提供一种基于卷积神经网络的体素标记方法,所述方法包括:获取历史场景体素化数据,并对其进行人工标记以得到历史体素标记数据;将所述历史场景体素化数据作为输入以及将所述历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型;利用所述VoxelAI模型对目标场景体素化数据进行自动化标记,以得到目标体素标记数据。
[0009]于本申请的第一方面的一些实施例中,所述获取历史场景体素化数据包括:获取历史三维场景中所有物体的多边形网格数据并进行体素化处理,以得到历史场景体素化数据;其中,所述历史场景体素化数据表征历史三维场景中所有体素的属性信息的集合;所述体素的属性信息包括对应体素的定位数据、层级数据、高度数据。
[0010]于本申请的第一方面的一些实施例中,将所述历史场景体素化数据作为输入以及将所述历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型,具体过程包括:将所述历史场景体素化数据根据实际需求进行数据展开,以得到对应场景中所有体素的多层二维特征图;其中,所述二维特征图用以表征当前体素与周边体素的关联特征信息;所述多层二维特征图包括多个不同维度的所述二维特征图;对所述多层二维特征图进行卷积、池化操作,并结合所述历史场景体素化数据作为卷积神经网络的全连接层的输入,并将所述历史体素标记数据作为输出进行监督学习,以训练基于卷积神经网络的VoxelAI模型。
[0011]于本申请的第一方面的一些实施例中,将所述历史场景体素化数据根据实际需求进行数据展开,以得到对应场景中所有体素的多层二维特征图,具体包括以下任意一种或多种的组合:当实际需求为判断场景中对应当前体素与周边体素是否平滑时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在预设平滑度范围内,以得到当前体素与周边体素的二维平滑度特征图;当实际需求为判断场景中对应当前体素与周边体素是否可行走时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在行走高度范围内,以得到当前体素与周边体素的二维行走高度特征图;当实际需求为判断场景中对应当前体素与周边体素是否可跳跃时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在跳跃高度范围内,以得到当前体素与周边体素的二维跳跃高度特征图;当实际需求为分析场景中对应当前体素的周边层级关系时,提取当前体素与周边体素的层级信息,并依次分析周边体素与当前体素的层级关系,以得到当前体素与周边体素的二维层级差特征图;当实际需求为判断场景中对应当前体素是否孤立时,提取当前体素与周边体素的层级信息,并依次判断周边体素与当前体素的层级差是否在相同层级范围内,以得到当前体素与周边体素的二维同层级特征图;其中,所述多层二维特征图包括所述二维平滑度特征图、二维行走高度特征
图、二维跳跃高度特征图、二维同层级特征图、二维层级差特征图中任意一种或多种组合。
[0012]于本申请的第一方面的一些实施例中,所述VoxelAI模型包括:依次连接的输入层、展开层、卷积层、池化层、全连接层、输出层。
[001本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于卷积神经网络的体素标记方法,其特征在于,所述方法包括:获取历史场景体素化数据,并对其进行人工标记以得到历史体素标记数据;将所述历史场景体素化数据作为输入以及将所述历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型;利用所述VoxelAI模型对目标场景体素化数据进行自动化标记,以得到目标体素标记数据。2.根据权利要求1所述的一种基于卷积神经网络的体素标记方法,其特征在于,所述获取历史场景体素化数据包括:获取历史三维场景中所有物体的多边形网格数据并进行体素化处理,以得到历史场景体素化数据;其中,所述历史场景体素化数据表征历史三维场景中所有体素的属性信息的集合;所述体素的属性信息包括对应体素的定位数据、层级数据、高度数据。3.根据权利要求2所述的一种基于卷积神经网络的体素标记方法,其特征在于,将所述历史场景体素化数据作为输入以及将所述历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型,具体过程包括:将所述历史场景体素化数据根据实际需求进行数据展开,以得到对应场景中所有体素的多层二维特征图;其中,所述二维特征图用以表征当前体素与周边体素的关联特征信息;所述多层二维特征图包括多个不同维度的所述二维特征图;对所述多层二维特征图进行卷积、池化操作,并结合所述历史场景体素化数据作为卷积神经网络的全连接层的输入,并将所述历史体素标记数据作为输出进行监督学习,以训练基于卷积神经网络的VoxelAI模型。4.根据权利要求3所述的一种基于卷积神经网络的体素标记方法,其特征在于,将所述历史场景体素化数据根据实际需求进行数据展开,以得到对应场景中所有体素的多层二维特征图,具体包括以下任意一种或多种的组合:当实际需求为判断场景中对应当前体素与周边体素是否平滑时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在预设平滑度范围内,以得到当前体素与周边体素的二维平滑度特征图;当实际需求为判断场景中对应当前体素与周边体素是否可行走时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在行走高度范围内,以得到当前体素与周边体素的二维行走高度特征图;当实际需求为判断场景中对应当前体素与周边体素是否可跳跃时,提取当前体素与周边体素的高度信息,并依次判断周边体素...
【专利技术属性】
技术研发人员:迟庆鹏,
申请(专利权)人:上海灵刃网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。