一种基于深度学习的码流预测方法和装置制造方法及图纸

技术编号：32825331 阅读：19 留言：0更新日期：2022-03-26 20:26

本申请提供了一种基于深度学习的码流预测方法和装置，涉及音视频数据处理技术领域。该方法首先通过深度学习算法，将压缩过的码流与未压缩的码流作为训练集，从压缩过的码流反向预测出未压缩的音视频；对比深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，对深度学习算法加入优化因子；比对优化后的深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，判断优化过程是否准确可靠；根据判断结果确定是否加入优化因子得到当前深度学习算法，利用当前深度学习算法对压缩码流反向预测完整码流。可以看到，本实施例能够从已压缩过的码流反向推出未压缩过的码流，这样就避免了传输未压缩过的码流造成资源的浪费。成资源的浪费。成资源的浪费。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的码流预测方法和装置

[0001]本申请涉及音视频数据处理
，尤其涉及一种基于深度学习的码流预测方法和装置。

技术介绍

[0002]由于音视频帧的数据量原因，要完整传输很困难，都是对其进行压缩处理，编码之后再进行传输，这样当然会丢失掉很多细节。虽然压缩后的码流不影响意义上的理解，但是会丢失掉很多细节，即音视频分成了很多个质量档次，分别压缩的多或是少。相关技术中对音视频的压缩主要是只保留I帧以及其他帧的运动向量，从I帧预测出P帧与B帧。这样的编码方式可以将码流压缩至很小，但是很难从已经压缩过的码流还原出未压缩过的完整码流，故当需要完整码流时只能重新传输完整码流。因此，亟需解决这一技术问题。

技术实现思路

[0003]鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的基于深度学习的码流预测方法和装置，通过对深度学习算法的优化，能够从已压缩过的码流反向推出未压缩过的码流，这样就避免了传输未压缩过的码流造成资源的浪费。所述技术方案如下：
[0004]第一方面，提供了一种基于深度学习的码流预测方法，包括以下步骤：
[0005]通过深度学习算法，将压缩过的码流与未压缩的码流作为训练集，从压缩过的码流反向预测出未压缩的音视频；
[0006]对比深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，对深度学习算法加入优化因子；
[0007]比对优化后的深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，判断优化过程是否...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的码流预测方法，其特征在于，包括以下步骤：通过深度学习算法，将压缩过的码流与未压缩的码流作为训练集，从压缩过的码流反向预测出未压缩的音视频；对比深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，对深度学习算法加入优化因子；比对优化后的深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，判断优化过程是否准确可靠；根据判断结果确定是否加入优化因子得到当前深度学习算法，利用当前深度学习算法对压缩码流反向预测完整码流。2.根据权利要求1所述的基于深度学习的码流预测方法，其特征在于，所述比对优化后的深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，判断优化过程是否准确可靠，包括：根据优化前后的比对结果构建出优化直方图；通过优化直方图判断优化过程是否准确可靠。3.根据权利要求2所述的基于深度学习的码流预测方法，其特征在于，利用如下公式根据将压缩过的码流与未压缩的码流作为训练集，从压缩过的码流反向预测出未压缩的音视频，然后对比深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流得到对深度学习算法进行优化的优化因子：其中E表示深度学习算法的优化因子；D
a
(i)表示训练集中的第a个未压缩的音视频码流二进制数据中的第i位上的二进制数值；PD
a
(i)表示训练完成后深度学习对训练集中的第a个已压缩的音视频码流反向预测出未压缩的音视频码流的二进制数据中的第i位上的二进制数值；m表示训练集中的未压缩的音视频码流总数；n表示训练集中的第a个未压缩的音视频码流二进制数据中的二进制位数。4.根据权利要求3所述的基于深度学习的码流预测方法，其特征在于，利用如下公式比对优化后的深度学习算法反向预测出未压缩的音视频与实际未压缩的音视频码流，判断优化过程是否准确可靠：其中F表示对优化后的深度学习算法的优化判定值；||表示求取绝对值；若F＜1，表示优化因子达到对深度学习算法的优化作用，则加入优化因子进行优化；若F≥1，表示优化因子未达到对深度学习算法的优化作用，则不加入优化因子进行优化。5.根据权利要求4所述的基于深度学习的码流预测方法，其特征在于，利用如下公式根据优化前后的比对结果构建出优化直方图：
其中H0表示直方图中优化前深度学习算法预测失误情况下的对应的方形图案的高度；H
e
表示直方图中优化后深度学习算法预测失误情况下的对应的方形图案的高度；H表示直方图中方形图案的最大高度。6.一种基于深度学习的码流预测装置，其特征在于，包括：...

【专利技术属性】
技术研发人员：兰雨晴，黄永琢，余丹，王丹星，唐霆岳，
申请(专利权)人：慧之安信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人