用于视频压缩的基于时间注意力的神经网络制造技术

技术编号：42445289 阅读：8 留言：0更新日期：2024-08-16 16:52

公开了用于使用人工神经网络(例如，卷积神经网络或循环神经网络)、注意力和/或具有空间属性的注意力进行视频编码和/或视频解码的系统、方法和手段。例如，一种装置，该装置可被配置为执行以下中的一者或多者：获得上下文块、当前块和与该上下文块相关联的潜在向量；对该上下文块、参考块和该潜在向量执行至少一次卷积；基于该至少一次卷积生成与该当前块相关联的运动流数据；或者生成包括对该运动流数据的指示的比特流。该运动流数据可被量化。所生成的比特流可包括对经量化的运动流数据的指示。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

技术介绍

1、视频译码系统可用于压缩数字视频信号，例如以减少此类信号需要的存储和/或发送带宽。

技术实现思路

1、公开了用于使用人工神经网络(例如，卷积神经网络或循环神经网络)、注意力和/或具有空间属性的注意力进行视频编码和/或视频解码的系统、方法和手段。例如，一种视频编码设备，该视频编码设备可被配置为执行以下中的一者或多者：获得上下文块、当前块和与该上下文块相关联的潜在向量；对该上下文块、参考块和该潜在向量执行至少一次卷积；基于该至少一次卷积生成与该当前块相关联的运动流数据；或者生成包括对该运动流数据的指示的视频数据。该运动流数据可被量化。所生成的视频数据可包括对经量化的运动流数据的指示。

2、例如，与该上下文块相关联的该潜在向量可指示对与该上下文块相关联的上下文帧的注意力。可使用与该上下文块相关联的上下文来获得该潜在向量。可使用与该上下文块相关联的加权注意力值来获得该潜在向量。可基于先前重建的块中的相应块的一个或多个注意力值来获得与该上下文块相关联的该加权注意力值。可执行空间特征提取。例如，可使用siamese网络来执行空间特征提取。

3、例如，一种视频解码设备，该视频解码设备可被配置为执行以下中的一者或多者：获得与当前块相关联的经编码的运动流数据(例如，经量化的运动流数据)；使用循环神经网络对该经编码的运动流数据执行至少一次去卷积；基于该至少一次去卷积获得针对该当前块的预测块；或基于该预测块和残差来重建该当前块。例如，可基于与上下文块相关联的潜在向量

4、系统、方法和手段可涉及解码器。在一些示例中，本文所述的系统、方法和手段可涉及编码器。在一些示例中，本文所述的系统、方法和手段可涉及信号(例如，来自编码器和/或由解码器接收的信号)。计算机可读介质可包括用于使得一个或多个处理器执行本文所述的方法的指令。计算机程序产品可包括指令，当程序由一个或多个处理器执行时，该指令可使得一个或多个处理器执行本文所述的方法。

本文档来自技高网...

【技术保护点】

1.一种视频解码设备，所述视频解码设备包括处理器，所述处理器被配置为：

2.一种方法，所述方法包括：

3.根据权利要求1所述的视频解码设备或根据权利要求2所述的方法，其中使用对所述经编码的运动流数据和所述潜在向量的去卷积来获得经解码的运动数据。

4.根据权利要求1或3所述的视频解码设备，其中使用循环神经网络来执行所述去卷积。

5.根据权利要求1或3和4所述的视频解码设备，其中所述处理器还被配置为：

6.根据权利要求1或3至5所述的视频解码设备，其中所述处理器还被配置为：

7.根据权利要求6所述的视频解码设备，其中所述状态信息指示潜在表示。

8.根据权利要求1或3至5所述的视频解码设备，其中所述处理器还被配置为：

9.根据权利要求8所述的视频解码设备，其中与多个先前重建的块相关联的所述状态信息包括所述多个先前重建的块的相应潜在表示。

10.根据权利要求1或3至9所述的视频解码设备，其中所述处理器还被配置为：

11.根据权利要求1或3至9所述的视频解码设备，其中所述处理器还被配置为：

12.根据权利要求1或3至11所述的视频解码设备，其中与所述当前块相关联的所述潜在向量被配置为指示与所述当前块相关联的注意力。

13.一种视频编码设备，所述视频编码设备包括：

14.一种方法，所述方法包括：

15.根据权利要求13所述的视频编码设备或根据权利要求14所述的方法，其中基于对所述当前块、所述参考块和所述潜在向量执行卷积来生成所述运动流数据。

16.根据权利要求15所述的视频编码设备，其中所述处理器还被配置为：基于对所述当前块执行的所述卷积，来生成所述当前块的潜在表示，所述潜在表示用于生成与第二块相关联的运动流数据。

17.根据权利要求12或14至16所述的视频编码设备，其中基于与先前编码的块相关联的状态信息来获得与所述当前块相关联的所述潜在向量。

18.根据权利要求12或14至16所述的视频编码设备，其中基于与多个先前编码的块相关联的状态信息来获得与所述当前块相关联的所述潜在向量。

19.根据权利要求12或14至18所述的视频编码设备，其中所述处理器还被配置为：

20.根据权利要求12或14至19所述的视频编码设备，其中与所述当前块相关联的所述潜在向量被配置为指示与所述当前块相关联的注意力。

21.根据权利要求12或14至20所述的视频编码设备，其中所述处理器还被配置为：

22.一种计算机可读介质，所述计算机可读介质包括用于使一个或多个处理器执行根据权利要求2和3或14和15中任一项所述的方法的指令。

23.一种设备，所述设备包括：

24.一种信号，所述信号包括根据权利要求14和15中任一项所述的方法使用所述参考块和所述潜在向量生成的运动流数据。

25.根据权利要求2和3或14和15中任一项所述的方法，其中所述方法由解码器或编码器执行。

26.根据权利要求1、3至13或15至21中任一项所述的设备，其中所述设备包括存储器。

...

【技术特征摘要】
【国外来华专利技术】