System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于使用变换器块来执行密集预测的方法和设备技术_技高网
当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于使用变换器块来执行密集预测的方法和设备技术

技术编号:43728254 阅读:0 留言:0更新日期:2024-12-20 12:54
本文所公开的方法、设备、系统和制品使用图像处理系统的重组件级处和编码器级处的变换器来执行输入图像的密集预测。所公开的设备包括编码器,其具有将输入图像转换成表示从输入图像所提取的特征的多个标记的嵌入器。采用可学习位置嵌入来嵌入所述标记。编码器还包括一个或多个变换器,所述变换器配置在级序列中以将标记彼此相关。所述设备进一步包括解码器,所述解码器包括将标记组装为特征表示的重组器的一个或多个、组合特征表示以生成最终特征表示的融合块的一个或多个以及基于最终特征表示并且基于输出任务来生成密集预测的输出头端。

【技术实现步骤摘要】

本公开一般涉及计算机视觉中的密集预测,更特别涉及使用变换器块来执行密集预测以用于改进计算机视觉中的密集预测的方法和设备。


技术介绍

1、计算机视觉表示计算机化技术,所述计算机化技术允许计算机系统获得对数字图像或视频的高级理解。高级理解然后能够用来通知关于动作是否将被采取/推荐。通常使用全卷积深度网络来执行称作密集预测的计算机视觉的一个方面。

2、密集预测表示预测将与图像中的每一个像素关联的标签(或者多个标签)的任务。例如,语义分割标签标识与图像中被表示的内容(例如建筑物、天空、汽车、人等)对应的类。另外,深度估计标签标识被处理的图像与图像的观察者之间的距离。进一步,关键点检测标签表示像素是关键点的可能性。关键点像素占据图像中与图像中感兴趣的内容(例如突出的内容)相关的点。光流标签标识当前帧中被标记的像素相对于另一个帧的视运动(apparent motion)。


技术实现思路

【技术保护点】

1.一种用于向图像的像素指配标签的设备,所述设备包括:

2.根据权利要求1所述的装置,其中,所述编码器包括应用于所述图像的卷积神经网络。

3.根据权利要求1所述的设备,其中,所述第二组特征独立于所述图像的贴片。

4.根据权利要求1所述的设备,其中,所述变换器包括多头自注意力块。

5.根据权利要求4所述的设备,其中,所述变换器包括多个归一化器和加法器。

6.根据权利要求1所述的设备,其中,所述解码器包括重组器、融合块和输出头,并且其中所述融合块包括所述第一卷积单元和所述第二卷积单元。

7.根据权利要求1所述的设备,其中,所述标签识别与所述图像中的所述像素相关联的至少一个类别。

8.一个或多个其上存储有指令的机器可读介质,所述指令可由机器执行以实现:

9.根据权利要求8所述的一个或多个机器可读介质,其中,所述编码器包括应用于所述图像的卷积神经网络。

10.根据权利要求8所述的一个或多个机器可读介质,其中,所述第二组特征独立于所述图像的贴片。

11.根据权利要求8所述的一个或多个机器可读介质,其中,所述变换器包括多头自注意力块。

12.根据权利要求11所述的一个或多个机器可读介质,其中,所述变换器包括多个归一化器和加法器。

13.根据权利要求8所述的一个或多个机器可读介质,其中,所述解码器包括重组器、融合块和输出头,并且其中所述融合块包括所述第一卷积单元和所述第二卷积单元。

14.根据权利要求8所述的一个或多个机器可读介质,其中,所述标签识别与所述图像中的所述像素相关联的至少一个类别。

15.一种计算装置,包括:

16.根据权利要求15所述的计算装置,其中,所述编码器包括应用于所述图像的卷积神经网络。

17.根据权利要求15所述的计算装置,其中,所述第二组特征独立于所述图像的贴片。

18.根据权利要求15所述的计算装置,其中,所述变换器包括多头自注意力块。

19.根据权利要求18所述的计算装置,其中,所述变换器包括多个归一化器和加法器。

20.根据权利要求15所述的计算装置,其中,所述解码器包括重组器、融合块和输出头,并且其中所述融合块包括所述第一卷积单元和所述第二卷积单元。

21.根据权利要求15所述的计算装置,其中,所述标签识别与所述图像中的所述像素相关联的至少一个类别。

...

【技术特征摘要】

1.一种用于向图像的像素指配标签的设备,所述设备包括:

2.根据权利要求1所述的装置,其中,所述编码器包括应用于所述图像的卷积神经网络。

3.根据权利要求1所述的设备,其中,所述第二组特征独立于所述图像的贴片。

4.根据权利要求1所述的设备,其中,所述变换器包括多头自注意力块。

5.根据权利要求4所述的设备,其中,所述变换器包括多个归一化器和加法器。

6.根据权利要求1所述的设备,其中,所述解码器包括重组器、融合块和输出头,并且其中所述融合块包括所述第一卷积单元和所述第二卷积单元。

7.根据权利要求1所述的设备,其中,所述标签识别与所述图像中的所述像素相关联的至少一个类别。

8.一个或多个其上存储有指令的机器可读介质,所述指令可由机器执行以实现:

9.根据权利要求8所述的一个或多个机器可读介质,其中,所述编码器包括应用于所述图像的卷积神经网络。

10.根据权利要求8所述的一个或多个机器可读介质,其中,所述第二组特征独立于所述图像的贴片。

11.根据权利要求8所述的一个或多个机器可读介质,其中,所述变换器包括多头自注意力块。

1...

【专利技术属性】
技术研发人员:R·兰夫特尔A·博奇科夫斯基V·科尔通
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1