编解码器速率失真补偿降采样器制造技术

技术编号：37271765 阅读：15 留言：0更新日期：2023-04-20 23:40

一种系统，其包括基于机器学习(ML)模型的视频降采样器，该视频降采样器配置为接收具有第一显示分辨率的输入视频序列，并且将该输入视频序列映射到具有第二显示分辨率的较低分辨率视频序列，该第二显示分辨率低于所述第一显示分辨率。该系统还包括基于神经网络(基于NN)的代理视频编解码器，该代理视频编解码器被配置成将较低分辨率视频序列变换成经解码的代理比特流。另外，该系统包括升采样器，其配置为使用经解码的代理比特流来产生输出视频序列。序列。序列。

全部详细技术资料下载

【技术实现步骤摘要】
编解码器速率失真补偿降采样器

技术介绍

[0001]降采样是内容流系统中的操作，以产生不同类型的客户端设备可用的比特率和分辨率方面的不同表示。在现代流系统中，流服务器在分辨率和比特率方面提供不同的编码表示，使得客户端设备可以动态地下载与其回放上下文(例如，显示大小和网络条件)最佳匹配的表示。为了提供这样的表示，流服务器需要在编码之前将源视频降采样到不同的分辨率。降采样可以用在感知上不是最佳的滤波器来执行。
附图说明
[0002]图1示出了根据一个实施方式的示例性视频处理系统的图，该示例性视频处理系统包括基于训练的机器学习(Machine Learning，ML)模型的编解码器速率失真(rate distortion)补偿降采样器；
[0003]图2示出根据一个实施方式的用于训练图1所示的基于ML模型的编解码器速率失真补偿降采样器的训练流水线系统的图；
[0004]图3描绘根据各种实施方案的图1中所示的基于ML模型的编解码器速率失真补偿降采样器的替代示范性架构；
[0005]图4示出了一个流程图，其概述了根据一个实施方式的用于训练基于ML模型的编解码器速率失真补偿降采样器的示例性方法；
[0006]图5A示出了根据本专利技术构思的一个方面的、描述了由图1的视频处理系统实现的示例性条件降采样网络的图；以及
[0007]图5B示出了根据本专利技术构思的另一方面的、描述了由图1的视频处理系统实现的示例性条件降采样网络的图。
具体实施方式
[0008]以下描述包含与本公开中的实施方...

【技术保护点】

【技术特征摘要】
1.一种系统，包括：(a)基于机器学习(ML)模型的视频降采样器，其配置为：接收具有第一显示分辨率的输入视频序列；以及将所述输入视频序列映射到较低分辨率视频序列，所述较低分辨率视频序列具有低于所述第一显示分辨率的第二显示分辨率；(b)基于神经网络(基于NN)的代理视频编解码器，其配置为将所述较低分辨率视频序列变换成经解码的代理比特流；以及(c)升采样器，配置为使用所述经解码的代理比特流来产生输出视频序列。2.根据权利要求1所述的系统，其中产生所述输出视频序列包括：接收所述经解码的代理比特流；以及产生与所述输入视频序列相对应的输出视频序列，所述输出视频序列具有高于第二显示分辨率的显示分辨率。3.根据权利要求1所述的系统，其中所述基于机器学习模型的视频降采样器是使用所述输入视频序列、所述输出视频序列、以及基于所述较低分辨率视频序列的估计速率和多个感知损失函数的目标函数来训练的。4.根据权利要求3所述的系统，其中所述目标函数包括所述较低分辨率视频序列的估计速率与所述多个感知损失损失函数的加权和的组合。5.根据权利要求4所述的系统，其中所述基于机器学习模型的视频降采样器还配置为接收包括在所述多个感知损失函数的加权和中的多个加权因子，并且其中所述基于机器学习模型的视频降采样器还被使用所述多个加权因子训练。6.根据权利要求1所述的系统，其中，所述基于神经网络的代理视频编解码器被预先训练成复制标准视频编解码器的速率失真特性。7.根据权利要求1所述的系统，其中所述基于神经网络的代理视频编解码器是可微分的。8.根据权利要求1所述的系统，其中，所述升采样器包括基于机器学习模型的升采样器。9.根据权利要求8所述的系统，其中所述基于机器学习模型的升采样器和所述基于机器学习模型的视频降采样器被同时训练。10.一种用于训练基于机器学习(ML)模型的视频降采样器的方法，所述方法包括：向所述基于机器学习模型的视频降采样器提供具有第一显示分辨率的输入视频序列；使用所述基于机器学习模型的视频降采样器将所述输入视频序列映射到较低分辨率视频序列，所述较低分辨率视频序列具有低于第一显示分辨率的第二显示分辨率；使用基于神经网络(基于NN)的代理视频编解码器将所述较低分辨率视频序列变换成经解码的代理比特流；使用接收所述经解码的代理比特流的升采样器产生输出视频序列，所述输出视频序列对应于所述输入视频序列并且所述输出视频序列具有高于所述第二显示分辨率的显示分辨率；以及使用所述输入视频序列、所述输出视频序列和基于所述较低分辨率视频序列的估计速率以及多个感知损失函数的目标函数来训练所述基于机器学习模型的视频降采样器。11.根据权利要求10所述的方法，其中，所述基于神经网络的代理视频...

【专利技术属性】
技术研发人员：C，
申请(专利权)人：苏黎世联邦理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人