一种计算复杂度感知的视频解码宏块级并行调度方法技术

技术编号：13161682 阅读：64 留言：0更新日期：2016-05-10 08:57

本发明专利技术公开了一种计算复杂度感知的视频解码宏块级并行调度方法，包含两项关键技术：一是根据熵解码和重排序之后的宏块信息，如非零系数个数、宏块帧间预测编码类型、运动矢量等，建立宏块解码复杂度预测线性模型，对每个模块进行复杂度分析，充分利用已知的宏块信息，提高并行效率；二是在满足宏块解码依赖的前提下，将宏块解码复杂度与计算并行相结合，对已获取的宏块复杂度进行排序，根据排序结果对宏块进行分组并发执行，分组大小根据GPU的计算能力动态确定，分组数目根据当前可并行的宏块数目动态确定，保证充分利用GPU的同时也控制内核函数发射次数，实现高效并行。另外，采用缓冲区的方式实现CPU和GPU的并行协同运行，充分利用资源，减少空闲等待。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于视频解码
，更具体地，涉及，该方法是将压缩视频在异构多核平台上并行解码，利用对宏块解码各阶段计算复杂度的估计结果调度视频帧内宏块解码的并行执行顺序，减少并行处理同步开销，达到加速视频解码，节省系统能耗的效果。
技术介绍
目前，在数字电视、移动视频、视频监控等应用中，全高清1080P数字视频已经非常普及，视频分辨率正朝超高清，如4K、8K方向发展。视频分辨率的提高可以提供更好的用户体验，但是也使得编解码过程中的计算复杂度急剧增加，对其实时处理带来巨大挑战。新兴的CPU+GPU异构多核处理平台具有丰富的并行处理资源，因此如何利用多核处理器进行视频编解码的并行加速，提高视频编解码的吞吐率、减少延时是目前学术界和工业界的研究热点。近年来国内外对以Η.264为代表的混合框架视频编解码器的并行优化研究有很多工作，其中重要的一个策略是宏块级的并行技术，即让不存在依赖关系的多个宏块可在不同处理核上同时并行进行解码。在此方面，文献对宏块级并行解码做了比较系统化、理论化的研究，提出了一个关于宏块级并行调度策略的基本模型，分析了解码宏块级并行的可能性，并且考虑了多处理器(Chip Multiprocessors，CMPs)进行宏块解码的线程同步开销，来分析宏块并行的最大上限。所谓线程同步开销，就是由于解码各个宏块的时间不同，当一个线程解码某一个宏块时，需要等待其依赖的宏块解码完成，其等待时间为依赖宏块的解码最大时间，从而导致线程之间存在同步开销。该文提出了三种宏块调度策略:静态调度、动态调度和带尾提交(Tail Submit)调度。静态调度即按照预...

【技术保护点】
一种基于计算复杂度感知的视频解码宏块级并行调度方法，其特征在于，对压缩视频流的各帧图像均按照如下方法处理，所述方法包括如下步骤：(1)对帧图像进行熵解码和重排序，并将结果存储到指定的缓冲区中：(11)将压缩视频流按照视频编码标准规定的码流语法和语义对压缩码流进行解析，得到每个宏块的头信息和量化系数，所述每个宏块的头信息包括预测模式、编码块格式、量化参数、参考帧索引、运动矢量；(12)对步骤(11)中得到的每个宏块量化系数进行重排序，将量化系数串按照对应块的二维矩阵形式进行存储，得到每个块对应像素的量化系数；(13)将步骤(11)和(12)中得到的每个宏块头信息和重排序之后的量化系数存储到指定的缓冲区中，用于接下来的解码阶段使用；(2)根据步骤(13)中得到的宏块头信息和量化系数对该帧内每个宏块解码各阶段计算复杂度进行估计，得到每个宏块解码各阶段计算复杂度值：(21)根据预测模式、编码块格式、量化参数、参考帧索引、运动矢量建立宏块解码复杂度估计的线性模型；(22)将步骤(13)中得到的宏块头信息和量化系数代入到步骤(21)建立的模型中，得到每个宏块解码各阶段计算复杂度值；(3)根据步骤(...

【技术特征摘要】

【专利技术属性】
技术研发人员：郭红星，潘俊夫，朱文周，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人