The present invention provides an intra coding optimization method based on depth learning, which involves the field of video coding technology, and performs texture analysis on the input video data before intra prediction, and directly gives the corresponding prediction mode to the video data that can determine the prediction mode after the texture analysis, and the number of video numbers that are uncertain in the pattern. According to it, the prediction mode is given to the neural network, and then the corresponding coding is obtained. Finally, the intra frame detection data are obtained through these patterns. The invention applies the neural network method to select the intra prediction model adaptively, with the high accuracy of the neural network. This method can reduce the coding complexity and reduce the encoding time and achieve real-time coding on the premise of satisfying the coding performance.
【技术实现步骤摘要】
一种基于深度学习的帧内编码优化方法
本专利技术涉及视频编码
,尤其涉及一种基于深度学习的帧内编码优化方法。
技术介绍
视频编码技术致力于将视频压缩后得到便于传输的码流,尤其是在目前的网络带宽下传输高清视频。近年来,随着拍摄视频的硬件和技术的不断进步,出现了2K、4K乃至8K的视频。为了应对超高清视频的传输要求,2013年,视频编码联合组(JointCollaborativeTeamonVideoCoding(JCT-VC))提出了新一代视频编码标准HEVC(HighEfficiencyVideoCoding),HEVC比上一代AVC性能提升了50%左右,在高清视频编码时表现尤为突出。HEVC改进的技术包括基于四叉树的编码单元数据结构,多角度预测模式,可变尺寸块变换单元,基于变换系数扫描的预测方向选择等技术。在所有的技术中,率失真优化技术显得尤为重要,率失真优化技术计算各种不同技术组合(编码模式、相关系数和CU(CodingUnit)分块模式等)情况下的RD(Rate-Distortion)costs后,选取RDcosts最小的组合。在帧内预测中,率失真优化技术可以用来选择帧内预测模式。在HEVC中,有33种角度预测模式和DC以及Planar两种非方向模式,在计算总共35种预测模式的RDcosts后选择最优的模式。虽然这种做法可以得到最优的预测模式,但同时也大大增加了编码的复杂度。在确保编码质量的情况下减小编码的复杂度成为现在研究的难点问题。
技术实现思路
本专利技术的目的在于:为解决现有技术中编码质量和编码复杂度无法兼顾的问题,本专利技术提供一种基于深度 ...
【技术保护点】
1.一种基于深度学习的帧内编码优化方法,其特征在于,在帧内预测之前对输入的视频数据进行纹理分析,对于纹理分析后可以确定预测模式的视频数据直接赋予相应的预测模式,对于模式不确定的视频数据则其放进神经网络中进行预测后再赋予其相应的预测模式,然后得到模式对应的编码,最后通过这些模式编码获得帧内检测后的数据。
【技术特征摘要】
1.一种基于深度学习的帧内编码优化方法,其特征在于,在帧内预测之前对输入的视频数据进行纹理分析,对于纹理分析后可以确定预测模式的视频数据直接赋予相应的预测模式,对于模式不确定的视频数据则其放进神经网络中进行预测后再赋予其相应的预测模式,然后得到模式对应的编码,最后通过这些模式编码获得帧内检测后的数据。2.根据权利要求1所述的一种基于深度学习的帧内编码优化方法,其特征在于,所述纹理分析的步骤为:S1:将输入的视频数据划分成多个预测单元;S2:将每个预测单元中的亮度分量进行归一化处理;S3:计算每个预测单元中每个像素的梯度方向,统计不同梯度方向的像素个数;S4:计算每个预测单元中不同梯度方向的像素占比,对于占比大于等于一定的阈值的预测单元,赋予其相应的预测模式,对于其余的预测单元,则其放进神经网络中进行预测后再赋予其相应的预测模式。3.根据权利要求1所述的一种基于深度学习的帧内编码优化方法,其特征在于,所述帧内预测的步骤为:S5:对纹理分析后的视频数据分为亮度分量和色度分量,并对亮度分量经过数据处理转换为列向量;S6:得到的列向量放入训练好的卷积神经网络模型进行模式预测,根据预测模式得到亮度模式编码;同时,直接对色度分量进行预测模式预测;S7:分别根据亮度预测模式和色度预测模式得到的预测模式得到亮度模式编码和色度模...
【专利技术属性】
技术研发人员:徐枫,陈建武,肖谋,
申请(专利权)人:北京易智能科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。