【技术实现步骤摘要】
道路元素的提取方法、装置、电子设备、存储介质及车辆
[0001]本公开涉及人工智能
,具体涉及图像处理、计算机视觉和深度学习等领域,尤其涉及智能交通、智慧城市等
技术介绍
[0002]自动驾驶是人类专利技术汽车以来的颠覆性创新。随着人工智能、自动驾驶技术的成熟,自动驾驶的影响不只体现在汽车工业。自动驾驶对社会发展、出行体系也都存在巨大影响。
[0003]自动驾驶需要感知车辆周围的环境。其中提取道路元素是感知道路环节的重要环节。道路元素一般包括车道线、行人、车辆等。
[0004]自动驾驶过程中提取道路元素有利于准确的进行驾驶控制,因此,如何能够准确的提取道路元素至今仍是需要解决的问题。
技术实现思路
[0005]本公开提供了一种道路元素的提取方法、装置、电子设备、存储介质及车辆。
[0006]根据本公开的一方面,提供了一种道路元素的提取方法,包括:
[0007]获取目标道路的多个视角的道路图像,得到图像组;
[0008]对图像组进行特征提取,得到第一特征图;
[0009]基于第一特征图生成鸟瞰图视角的第二特征图;
[0010]从第一特征图中,提取出多个目标位置点的特征信息,得到待融合特征图;
[0011]将待融合特征图和第二特征图进行融合处理,得到目标特征图;
[0012]基于目标特征图,确定目标道路上的道路元素。
[0013]根据本公开的另一方面,提供了一种道路元素的提取装置,包括:
[0014]获 ...
【技术保护点】
【技术特征摘要】
1.一种道路元素的提取方法,包括:获取目标道路的多个视角的道路图像,得到图像组;对所述图像组进行特征提取,得到第一特征图;基于所述第一特征图生成鸟瞰图视角的第二特征图;从所述第一特征图中,提取出多个目标位置点的特征信息,得到待融合特征图;将所述待融合特征图和所述第二特征图进行融合处理,得到目标特征图;基于所述目标特征图,确定所述目标道路上的道路元素。2.根据权利要求1所述的方法,其中,所述从所述第一特征图中,提取出多个目标位置点的特征信息,得到待融合特征图,包括:基于所述多个视角决定的目标可视范围,确定所述多个目标位置点;从所述第一特征图中,提取出所述多个目标位置点各自的特征值;基于所述多个目标位置点各自的特征值,生成所述待融合特征图。3.根据权利要求2所述的方法,其中,所述基于所述多个视角决定的目标可视范围,确定所述多个目标位置点,包括:将所述多个视角决定的目标可视范围划分为多个格子;将所述第二特征图中每个位置点分别确定为一个待融合位置点;从所述目标可视范围内为每个待融合位置点选择至少一个格子作为目标位置点,得到所述多个目标位置点。4.根据权利要求2或3所述的方法,其中,所述基于所述多个目标位置点各自的特征值,生成所述待融合特征图,包括:针对所述第二特征图中各待融合位置点分别执行:在所述待融合位置点对应多个目标位置点的情况下,将所述第一特征图中所述待融合位置点对应的所述多个目标位置点的特征值进行加权处理,得到所述待融合位置点对应的待融合特征值;基于各待融合位置点对应的待融合特征值,生成所述待融合特征图。5.根据权利要求2
‑
4中任一项所述的方法,其中,所述从所述第一特征图中,提取出所述多个目标位置点各自的特征值,包括:将所述多个目标位置点映射到所述图像组的道路图像上,得到多个图像点;从所述第一特征图中获取所述多个图像点各自的特征值,得到所述多个目标位置点各自的特征值。6.根据权利要求1
‑
5中任一项所述的方法,其中,所述基于所述第一特征图生成鸟瞰图视角的第二特征图,包括:生成所述图像组中各道路图像的第一位置编码;以及,针对采集所述多个视角的道路图像的多个图像采集装置,生成第二位置编码;将所述第一特征图、所述第一位置编码和所述第二位置编码进行融合处理,得到第一查询向量;并,将所述第一特征图分别作为第一键向量和第一值向量;对所述第一查询向量、所述第一键向量和所述第一值向量进行编码处理,得到编码特征;基于所述编码特征,确定所述第二特征图。
7.根据权利要求6所述的方法,其中,所述基于所述编码特征,确定所述第二特征图,包括:将所述编码特征输入解码器,得到所述第二特征图。8.根据权利要求7所述的方法,所述解码器包括多个解码块,每个解码块包括自注意力模块和交叉注意力模块,其中,所述将所述编码特征输入解码器,得到所述第二特征图,包括:针对每个解码块执行以下操作,以得到最后一个解码块输出的解码特征:在所述解码块为第一个解码块的情况下,基于所述多个视角决定的目标可视范围,构建所述解码块中所述自注意力模块所需的第二查询向量、第二键向量和第二值向量;在所述解码块为第一个解码块之后的解码块的情况下,基于所述解码块的上一解码块输出的解码特征,构建所述解码块中所述自注意力模块所需的第二查询向量、第二键向量和第二值向量;将所述第二查询向量、所述第二键向量和所述第二值向量输入所述解码块的自注意力模块,得到交叉特征;基于所述交叉特征和所述编码特征构建所述解码块的交叉注意力模块所需的第三查询向量、第三键向量和第三值向量;将所述第三查询向量、所述第三键向量和所述第三值向量输入所述解码块的交叉注意力模块,得到所述解码块输出的解码特征;在得到最后一个解码块输出的解码特征的情况下,将所述最后一个解码块输出的解码特征进行上采样,得到所述第二特征图。9.根据权利要求8所述的方法,其中,所述基于所述多个视角决定的目标可视范围,构建所述解码块中所述交叉注意力模块所需的第二查询向量、第二键向量和第二值向量,包括:将划分了多个格子的所述目标可视范围内的每个格子分别进行位置编码,得到第三位置编码;以及,对每个格子的特征值进行初始化,得到初始化鸟瞰图;将所述初始化鸟瞰图和所述第三位置编码之间的融合特征作为所述自注意力模块的所述第二查询向量,将所述初始化鸟瞰图分别作为所述自注意力模块的所述第二键向量和所述第二值向量。10.根据权利要求8所述的方法,其中,所述基于所述交叉特征和所述编码特征构建所述解码块的交叉注意力模块所需的第三查询向量、第三键向量和第三值向量,包括:将多模态位置编码和所述编码特征之间的融合特征作为所述交叉注意力模块的所述第三键向量;其中,所述多模态特征是对所述第一位置编码和所述第二位置编码进行融合处理得到的;将所述自注意力模块输出的交叉特征和所述第三位置编码之间的融合特征作为所述交叉注意力模块的所述第三查询向量;将所述编码特征作为所述交叉注意力模块的所述第三值向量。11.根据权利要求1
‑
10中任一项所述的方法,所述第一特征图中包括多个尺度的第一子特征图,所述待融合特征图中包括多个目标尺度的待融合特征子图,其中,所述从所述第
一特征图中,提取出多个目标位置点的特征信息,得到待融合特征图,包括:从每个目标尺度的第一子特征图中分别提取出所述多个目标位置点的特征信息,得到各目标尺度的待融合特征子图。12.根据权利要求11所述的方法,其中,所述将所述待融合特征图和所述第二特征图进行融合处理,得到目标特征图,包括:将最小目标尺度的待融合特征子图和所述第二特征图进行融合处理,得到第一中间特征图;循环执行如下操作,直至不存在剩余待融合特征子图的情况下,得到最终输出的第一中间特征图:存在剩余待融合特征子图的情况下,将所述第一中间特征图进行上采样,得到第二中间特征图;从剩余待融合特征子图中选择最小目标尺度的待融合特征子图和所述第二中间特征图进行融合处理,得到新的第一中间特征图;将最终输出的第一中间特征图上采样至指定尺度,得到所述目标特征图。13.一种道路元素的提取装置,包括:获取模块,用于获取目标道路的多个视角的道路图像,得到图像组;特征提取模块,用于对所述图像组进行特征提取,得到第一特征图;转换模块,用于基于所述第一特征图生成鸟瞰图视角的第二特征图;提取模块,用于从所述第一特征图中,提取出多个目标位置点的特征信息,得到待融合特征图;融合模块,用于将所述待融合特征图和所述第二特征图进行融合处理,得到目标特征图;提取模块,用于基于所述目标特征图,确定所述目标道路上...
【专利技术属性】
技术研发人员:叶晓青,龚石,李莹莹,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。