一种基于感知模型的视频编解码方法及系统技术方案

技术编号：34355770 阅读：19 留言：0更新日期：2022-07-31 06:33

本申请提供了一种基于感知模型的视频编解码方法及系统，涉及视频处理技术领域，具体为：摄像头采集直播图像，将原始视频帧流发送至采集服务器；采集服务器根据终端设备反馈的主观评测结果对编码目标参数进行更新；基于对抗网络结构化编码模型和更新的编码目标参数对原始视频帧流进行压缩编码，将压缩编码后的数据发送至控制中心；控制中心基于对抗网络结构化解码模型对压缩编码后的数据进行还原解码，将还原解码得到的视频帧流发送至终端设备；终端设备播放视频流，采集观看用户的主观评测结果，将主观评测结果上传至控制中心；控制中心基于感知模型对主观评测结果进行合理性校验。本申请能够显著降低编码复杂度，提升用户体验感。用户体验感。用户体验感。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于感知模型的视频编解码方法及系统

[0001]本申请涉及视频处理
，尤其是涉及一种基于感知模型的视频编解码方法及系统。

技术介绍

[0002]近年来，随着智能终端的发展以及在线视频等新型业务的普及，网络中传输的视频数据量呈爆炸式增长态势。超高清视频和全景视频的快速发展进一步激化了带宽的供需矛盾。伴随着5G等新兴通信技术的变革，以及4K、8K视频需求增长趋势，沉浸式通信成为了未来无线多媒体通信的重要发展方向，可提供身临其境的沉浸式用户体验，为未来5G网络提供全新的多媒体业务。近年来以全景视频为代表的新型沉浸式通信业务已经开始逐步普及；全景视频覆盖区域为360
×
180度，需超高分辨率像素的支持，将激增未来通信系统传输数据量。
[0003]与观看普通视频不同，用户观看全景视频的视场约110
×
60度，因此360
×
180度覆盖范围下的全景视频大部分区域不会被看到、存在极大的感知冗余，可通过大幅减少全景视频压缩的感知冗余，显著提升其传输效率与用户体验，目前缺乏一种解决该问题的有效的技术方案。

技术实现思路

[0004]有鉴于此，本申请提供了一种基于感知模型的视频编解码方法及系统，以解决现有技术存在的沉浸式用户体验需求与无线通信带宽受限之间的矛盾。
[0005]第一方面，本申请实施例提供了一种基于感知模型的视频编解码方法，应用于摄像头、采集服务器、控制中心和终端设备，包括：所述摄像头采集直播图像，将原始视频帧流发送至采集服务器；...

【技术保护点】

【技术特征摘要】
1.一种基于感知模型的视频编解码方法，其特征在于，应用于摄像头、采集服务器、控制中心和终端设备，包括：所述摄像头采集直播图像，将原始视频帧流发送至采集服务器；所述采集服务器确定编码目标参数，根据终端设备反馈的主观评测结果对编码目标参数进行更新；基于预先训练完成的对抗网络结构化编码模型和更新的编码目标参数对原始视频帧流进行压缩编码，将压缩编码后的数据发送至控制中心；所述控制中心基于预先训练完成的对抗网络结构化解码模型对压缩编码后的数据进行还原解码，将还原解码得到的视频帧流发送至终端设备；所述终端设备播放视频流，采集观看用户的主观评测结果，将主观评测结果上传至控制中心；所述控制中心基于预先训练完成的感知模型对主观评测结果进行合理性校验，将校验通过的主观评测结果发送至所述采集服务器。2.根据权利要求1所述的基于感知模型的视频编解码方法，其特征在于，所述采集服务器确定编码目标参数，包括：所述采集服务器获取视频帧固有参数、网络参数和终端设备参数，所述视频帧固有参数包括：分辨率、帧率、比特率和画面元素特征；所述网络参数包括：视频传输速率、网络延迟和卡顿时间；终端设备参数包括：屏幕尺寸、CPU以及GPU的内存、频率和型号；根据网络参数和终端设备参数对视频帧固有参数进行更新，确定编码目标参数；所述编码目标参数包括：分辨率、帧率、比特率和画面元素特征。3.根据权利要求2所述的基于感知模型的视频编解码方法，其特征在于，所述主观评测结果为主观评测分数；根据终端设备反馈的主观评测结果对编码目标参数进行更新，包括：判断主观评测分数是否小于设定的阈值，若为是，则依次对分辨率、帧率、比特率和画面元素特征进行调整；否则，不更新编码目标参数。4.根据权利要求2所述的基于感知模型的视频编解码方法，其特征在于，所述对抗网络结构化编码模型为TCN模型；基于预先训练完成的对抗网络结构化编码模型和更新的编码目标参数对摄像头采集的视频帧进行压缩编码；包括：根据预设时间间隔或帧数间隔，从摄像头采集的原始视频帧流中选取关键帧；将更新的编码目标参数作为每个关键帧的特征信息；对于一个关键帧之后的每个非关键帧，提取与关键帧相比发生变化区域的特征轮廓；形成非关键帧的“素描图”；将每个关键帧和其对应的多个“素描图”与传输到控制中心。5.根据权利要求4所述的基于感知模型的视频编解码方法，其特征在于，所述控制中心基于预先建立的对抗网络结构化解码模型对压缩编码后的数据进行还原解码，包括：所述控制中心接收采集服务器发送的压缩编码后的数据包；以关键帧为模板，基于AI算法利用“素描图”还原出每个非关键帧，并结合特征轮廓还原上色，生...

【专利技术属性】
技术研发人员：宋奇蔚，秦良山，
申请(专利权)人：致讯科技天津有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人