用于视频编码速率控制的平均决定差预测制造技术

技术编号:16067460 阅读:17 留言:0更新日期:2017-08-22 18:33
本发明专利技术涉及用于视频编码速率控制的平均决定差预测。可提供用于视频编码的平均绝对差(MAD)预测。在接收到包括多个质量层级的视频流后,可根据与第二帧相关联的第二量化参数(QP)以及与第三帧相关联的第三QP来选择该视频流的第一帧的第一QP。随后可根据所选择的第一QP来编码第一帧。

Average decision difference prediction for rate control of video coding

The present invention relates to average decision difference prediction for video coding rate control. Mean absolute difference (MAD) prediction for video coding can be provided. After receiving a video stream comprising a plurality of quality levels, the first QP of the first frame of the video stream can be selected based on the second quantization parameter (QP) associated with the second frame and the third QP associated with the third frame. The first frame may then be encoded in accordance with the selected first QP.

【技术实现步骤摘要】
用于视频编码速率控制的平均决定差预测本申请是申请日为2012年3月9日、申请日为201210062614.3的同名中国专利技术专利申请的分案申请。
本专利技术涉及预测平均绝对差的技术。
技术介绍
平均绝对差(MAD)可用作H.264速率控制模型中的视频编码复杂度的索引。在常规系统中,MAD是由线性回归模型使用先前存储的帧的实际MAD来预测的。对于用时间和质量可伸缩性来编码的比特流(诸如可伸缩视频编码(SVC)的H.264的附录G扩展)而言,选择应使用哪个回归量来获得对当前MAD的精确预测可能是困难的。在一些情况下,MAD的不精确性可导致对量化参数(QP)的不合适的选择,结果导致较差的控制性能。
技术实现思路
可提供用于视频编码速率控制的MAD预测。提供本
技术实现思路
以便以简化的形式介绍将在以下具体实施方式中进一步描述的一些概念。此
技术实现思路
既不旨在标识所要求保护的主题的关键特征或必要特征。本
技术实现思路
也不旨在用于限制所要求保护的主题的范围。可提供用于视频编码的平均绝对差(MAD)预测。在接收包括多个质量层级(qualitylayer)的视频流后,可根据与第二帧相关联的第二量化参数(QP)以及与第三帧相关联的第三QP来选择该视频流的第一帧的第一QP。随后可根据所选择的第一QP来编码第一帧。以上概括描述和以下详细描述两者都提供了示例,并且只是说明性的。因此,以上概括描述和以下详细描述不应当被认为是限制性的。此外,除了本文中所阐述的那些特征或变体以外,还可以提供其他特征或变体。例如,实施例可涉及具体实施方式中所描述的各种特征组合和子组合。附图说明合并在本公开中并构成其一部分的附图示出本专利技术的实施例。在附图中:图1是操作环境的框图;图2是示出SVC比特流的图示;图3是用于提供用于视频编码的MAD预测的方法的流程图;以及图4是包括计算设备的系统的框图。具体实施方式以下详细描述参考各个附图。只要可能,就在附图和以下描述中使用相同的附图标记来指示相同或相似的元件。尽管可能描述了本专利技术的实施例,但修改、改编、以及其他实现是可能的。例如,可对附图中所示的元件进行置换、添加、或修改,并且可通过对所公开的方法置换、重新排序、或添加阶段来修改本文中所描述的方法。因此,以下详细描述并不限制本专利技术。相反,本专利技术的正确范围由所附权利要求书定义。可提供用于视频编码速率控制的平均绝对差(MAD)预测。根据本专利技术的各实施例,在单个线性回归模型中可使用两个回归量。第一回归量可包括要被编码的当前帧的最近帧跨较高、较低或当前时间层级的MAD。第二回归量可包括最近帧的与速率失真(RD)特性有关的MAD。根据这两个回归量所预测的MAD可随后被二次速率量化模型用来决定用于当前帧的编码的合适的量化参数(QP)。图1是包括捕捉源110和网络头端120的操作环境100的框图,网络头端120至少包括视频编码器130和信道多路复用器135。捕捉源110可包括例如诸如视频相机的实时视频捕捉设备、视频会议服务器和/或经由供应商网络(例如,光纤和/或卫星网络)来提供的实况视频流。头端120可被耦合到诸如混合光纤同轴(HFC)电缆电视网络之类的接入网络130,该网络可被进一步连接到观众场所140,该观众场所140包括耦合到显示器155的视频解码器150。根据本专利技术的各实施例,其他操作环境可用于提供在此描述的系统和方法。例如,耦合到诸如因特网之类的公共网络的服务器用于使用MAD预测来编码视频,以提供给与耦合至该网络的、能够解码的计算设备相关联的用户。图2是示出可伸缩视频编码(SVC)比特流200的示图。比特流200可包括两个层级(layer):基本层级210和增强层级220。根据本专利技术的各实施例,除了基本层级210以外,SVC比特流还可包括多个质量增强层级。根据本专利技术的各实施例,基本层级210可包括多个时间层级。比特流可包括与每一层级相关联的多个帧,这些帧中的每一个由指示该帧的时间位置的编号以及指示该帧与基本层级210相关联(即,多个帧Xb)还是与增强层级220相关联(即,多个帧Xe)的字母来标识。图2还示出了比特流200中的一些帧的相应回归量。例如,视频编码器130可预测每一个帧的可用于计算合适的量化参数(QP)的MAD。QP可结合帧的数据大小来用于基于带宽约束控制比特流200的传输率。QP可包括范围从0到51的值,其中较低的值导致所得的经编码帧的较大的数据大小及同时该帧的较高的质量,而较高的QP值导致较小的数据大小和较低的质量。为了预测要被编码的帧的MAD,视频编码器130可计算比特流200的两个其他帧的MAD,并将它们用作线性回归模型中的回归量。第一回归量MADTemp可包括最近时间帧跨较高、较低或当前时间层级的MAD。例如对于基本层级210,这可包括处于最高的帧速率层级中的在先帧。对于增强层级220,这可包括处于相同时间层级的相应基本层级210帧。这个回归量可允许以分层预测顺序来捕捉突然的改变。第二回归量MADRDC可包括具有相似的速率失真(RD)特性的最近帧的MAD。帧的RD特性可以是该帧的QP及其参考帧的QP的函数。帧i和帧j间的RD特性的相似性被定义在以下公式1中,其中QP(i)指帧i的QP,且Ref(i)指帧i的参考帧。也在下面的表1示出了公式1中可用来计算MADRDC的值的QP。X01234567XbKK+5K+4K+5KK+5K+4K+5XeK+6K+11K+10K+11K+6K+11K+10K+11表1下面的表2示出了比特流200的第二图片组(GOP)间隔的示例回归量。5b5e6b6e7b7e8b8eMADTemp4b5b5b6b6b7b7b8bMADRDC3b3e5b5e6b6e4b4e表2可根据在以下公式2中示出的第二阶(order)线性回归模型来计算要被编码的帧的经预测的MAD。MAD′=c2·MADTemp+c1·MADRDC+c0公式2图3是阐明了根据本专利技术的一实施例的一种用于提供用于视频编码的平均绝对差(MAD)预测的方法300中涉及的一般阶段的流程图。方法300可使用如以下参考图4更详细地描述的计算设备400来实现。在下文中将更详细地描述实现方法300的各阶段的方式。方法300可以在开始框305处开始并前进至其中计算设备400可以接收当前帧以进行编码的阶段310。例如,当前帧可包括与可伸缩视频编码(SVC)比特流相关联的帧。SVC比特流可包括多个层级,这多个层级包括基本层级和至少一个质量增强层级。基本层级可包括一个和/或多个时间层级。方法300可随后前进至阶段315,其中计算设备400可计算第一帧的第一平均绝对差(MAD)。例如,在当前帧包括比特流200的帧5b的情况下,编码器130可计算比特流200的帧4b的MAD的回归量值。根据本专利技术的各实施例,第一帧可包括当前帧的时间上在前帧(例如,和与当前帧相同的层级相关联的紧接在前帧)。方法300可随后前进至阶段320,其中计算设备400可标识包括当前帧的相似速率失真特性的第二帧。例如,在当前帧包括比特流200的帧5b的情况下,编码器130可计算比特流200的帧3b的MAD的回归量值。编码器130可计算当前帧及比特流200的多个其他帧的速率失真,并确定多个其他帧中的哪一个包括与当前帧最相似的速率本文档来自技高网...
用于视频编码速率控制的平均决定差预测

【技术保护点】
一种计算机实现的用于提供平均绝对差预测的方法,所述方法包括:接收与一比特流相关联的多个视频帧;根据与紧接在前时间帧相关联的第一平均绝对差和与具有和当前帧相似的速率失真特性的相似帧相关联的第二平均绝对差,来预测所述当前帧的平均绝对差;以及根据所预测的平均绝对差来对所述当前帧进行编码。

【技术特征摘要】
2011.03.10 US 13/044,6301.一种计算机实现的用于提供平均绝对差预测的方法,所述方法包括:接收与一比特流相关联的多个视频帧;根据与紧接在前时间帧相关联的第一平均绝对差和与具有和当前帧相似的速率失真特性的相似帧相关联的第二平均绝对差,来预测所述当前帧的平均绝对差;以及根据所预测的平均绝对差来对所述当前帧进行编码。2.如权利要求1所述的计算机实现的方法,还包括:根据带宽约束和所述当前帧的所预测的平均绝对差来选择所述当前帧的量化参数。3.如权利要求2所述的计算机实现的方法,其中,所述当前帧的量化参数是使用所述当前帧的所预测的平均绝对差通过二次速率量化器模型来确定的。4.如权利要求1所述的计算机实现的方法,还包括:根据线性回归模型来预测所述当前帧的平均绝对差,其中,与所述紧接在前时间帧相关联的第一平均绝对差和与所述相似帧相关联的第二平均绝对差包括与所述线性回归模型相关联的回归器。5.如权利要求1所述的计算机实现的方法,其中,所述相似帧是通过以下方式来识别的:计算所述多个视频帧中的每一个的速率失真特性;以及将所述多个视频帧中的每一个的速率失真特性与所述当前帧的当前速率失真特性进行比较。6.如权利要求1所述的计算机实现的方法,其中,所述比特流包括基本层和至少一个增强层。7.如权利要求6所述的计算机实现的方法,其中,所述紧接在前时间帧与和所述当前帧的层不同的层相关联。8.如权利要求6所述的计算机实现的方法,其中,所述紧接在前时间帧是最高帧速率层中的在前帧。9.一种计算机可读存储设备,其存储一组指令,所述一组指令在被执行时执行用于提供量化参数预测的方法,所述方法包括:接收与一比特流相关联的多个视频帧;根据与紧接在前时间帧相关联的量化参数以及与和当前帧具有相似的速率失真特性的相似帧相关联的量化参数,来预测所述当前帧的量化参数;以及根据所述量化参数来对所述当前帧进行编码。10.如权利要求9所述的计算机可读存储设备,其中,所述当前帧的量化...

【专利技术属性】
技术研发人员:MH·陆T·钱
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1