一种面向内容的动画视频无参考质量评价方法技术

技术编号:36064426 阅读:24 留言:0更新日期:2022-12-24 10:30
本发明专利技术公开了一种面向内容的动画视频无参考质量评价方法。首先,建立一个CG动画视频质量数据库,对视频样本进行特征向量的提取和标注,将数据库中的样本分为训练集和测试集两部分;其次,利用训练集对基于卷积神经网络的视频内容分类器进行训练,训练中,输入的是视频的帧图像,输出是视频的内容类别;然后,利用训练集中的每一类视频分别训练一个相应的基于BP神经网络的质量评分模型,训练中,输入的是视频的特征向量,输出是视频的质量分数;最后,应用训练好的卷积神经网络和BP神经网络实现一种面向内容的CG动画视频无参考质量评价方法,并在测试集上进行性能测试。并在测试集上进行性能测试。

【技术实现步骤摘要】
一种面向内容的动画视频无参考质量评价方法


[0001]本专利技术涉及视频编码中的视频质量评价
,尤其涉及一种面向内容的动画视频无参考质量评价方法。

技术介绍

[0002]近年来,计算机图形(Computer graphics,CG)技术日渐成熟并被广泛应用于数字电影、网络游戏、增强现实等多个领域。虽然CG技术发展迅速,但经过渲染、压缩、传输等多个处理环节,视频质量的损失仍然无法避免,各个环节中累积产生的质量损失势必严重影响用户最终的视觉体验。
[0003]无参考视频质量评价是在参考视频不可使用时的视频质量评价方法。一般来说,实际场景中通常难以获取无失真的完美参考视频,就CG视频而言,通过渲染、色调映射等图形处理方法,创建视频的无失真版本需要由几何建模得到的表面网格、体积网格等抽象3D数据,该过程相当复杂且耗时。因此,无参考质量评价对于CG视频而言具有非常重要的实用价值。
[0004]不同种类的视频大多具有鲜明的特征,因此,针对特定类型视频的视频质量评价结果往往更加准确。已经有研究人员提出了一些针对CG视频的全参考视频质量评价方法和针对3D CG数据的视觉质量指标,然而,到目前为止,依然没有针对CG动画视频的无参考质量评价方法。
[0005]目前,构建无参考视频质量评估模型的典型思路是提取视频特征并在特征和视频质量之间建立联系。由特征向量到最终质量分数的映射过程可以通过支持向量机和BP神经网络等回归模型的训练完成。此外,由于内容是视频的基本属性,在人类感知中起着重要作用,理想的视频质量评价方法应该充分考虑视频内容和人眼视觉系统的感知特征对评价结果的影响。

技术实现思路

[0006]本专利技术的目的在于填补当前动画视频质量评价
的空白,提供一种计算简单且性能优异的面向内容的动画视频无参考质量评价方法。
[0007]为实现上述目的,本专利技术的技术方案是:一种面向内容的动画视频无参考质量评价方法,该方法包括以下步骤:
[0008]利用质量无损的参考视频生成失真视频样本,建立动画视频数据库;
[0009]对视频数据库中的视频进行分类标注,形成第一训练数据集;将视频作为输入,视频对应的分类作为输出,训练得到具有视频分类功能的第一神经网络模型;
[0010]对视频数据库中的每一类视频进行质量评价分数标注,并计算出每一类视频的时空特征,形成第二训练数据集;将每一类视频的时空特征作为神经网络模型的输入,视频对应的质量评价分数作为神经网络模型的输出,训练得到具有计算视频质量评价分数功能的第二神经网络模型;
[0011]将待分类的视频输入到第一神经网络模型中得到分类结果,将确定的分类视频输入到对应的第二神经网络模型中得到待分类的视频无参考质量评价分数。
[0012]优选的,所述失真视频样本类型包括5种基于编码压缩的失真类型和1种基于传输的失真类型:AVC/H.264压缩失真、HEVC/H.265压缩失真、MPEG

2压缩失真、MJPEG全帧内压缩失真、基于小波变换的Snow压缩失真、白噪声失真。
[0013]优选的,时空特征具体包括以下5类特征中的一种或多种:(1)基于可察觉模糊的模糊程度值,(2)局部对比度,(3)基于感兴趣区域的统计特征值,(4)时域信息熵,(5)基于运动对比度敏感函数的运动感知特征值。
[0014]优选的,根据视频内容,动画视频数据库中的视频分别为如下5种类别:(1)人物与人脸视频,(2)特效视频,(3)背景前的物体视频,(4)多人在线战术竞技游戏视频,(5)风景与建筑视频。
[0015]此外,本专利技术还提出一种面向内容的动画视频无参考质量评价系统,该系统包括如下模块:
[0016]视频构建模块,利用质量无损的参考视频生成失真视频样本,建立动画视频数据库;
[0017]第一神经网络模型训练模块,对视频数据库中的视频进行分类标注,形成第一训练数据集;将视频作为输入,视频对应的分类作为输出,训练得到具有视频分类功能的第一神经网络模型;
[0018]第二神经网络模型训练模块,对视频数据库中的每一类视频进行质量评价分数标注,并根据人眼感知特性计算出每一类视频的时空特征,形成第二训练数据集;将每一类视频的时空特征作为神经网络模型的输入,视频对应的质量评价分数作为神经网络模型的输出,训练得到具有计算视频质量评价分数功能的第二神经网络模型;
[0019]评价分数确定模块,将待分类的视频输入到第一神经网络模型中得到分类结果,将确定的分类视频输入到对应的第二神经网络模型中得到待分类的视频无参考质量评价分数。
[0020]优选的,所述失真视频样本类型包括5种基于编码压缩的失真类型和1种基于传输的失真类型:AVC/H.264压缩失真、HEVC/H.265压缩失真、MPEG

2压缩失真、MJPEG全帧内压缩失真、基于小波变换的Snow压缩失真、白噪声失真。
[0021]优选的,时空特征具体包括以下5类特征中的一种或多种:(1)基于可察觉模糊的模糊程度值,(2)局部对比度,(3)基于感兴趣区域的统计特征值,(4)时域信息熵,(5)基于运动对比度敏感函数的运动感知特征值。
[0022]优选的,动画视频数据库中的视频分别为如下5种类别:(1)人物与人脸视频,(2)特效视频,(3)背景前的物体视频,(4)多人在线战术竞技游戏视频,(5)风景与建筑视频。
[0023]本专利技术还提出一种计算机设备,该计算机设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现所述的一种面向内容的动画视频无参考质量评价方法的步骤。
[0024]本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种面向内容的动画视频无参考质量评价方法的步骤。
[0025]有益效果:与现有技术相比,本专利技术的技术方案具有以下有益效果:
[0026](1)本专利技术开创性地提出了针对CG动画视频的无参考质量评价方法,填补了此前该
的空白;
[0027](2)建立CG动画视频质量数据库,数据库中的样本包含不同场景、不同分辨率、不同帧率、不同失真类型,丰富的样本为网络模型的训练和视频质量评价方法的性能验证提供了有力支撑;
[0028](3)本专利技术分别针对不同内容类型的CG动画视频训练相应的质量评分模型,并在在充分考虑了各项CG动画视频时域空域的感知特征后,选择具有代表性的5种特征作为评分模型的输入,从而获得了更加符合人眼视觉特性的质量评价结果。
附图说明
[0029]图1为本专利技术所述方法的基本流程图;
[0030]图2为基于卷积神经网络的视频内容分类器结构图;
[0031]图3为基于BP神经网络的质量评分模型结构图;
[0032]图4为实验结果展示图。
具体实施方式
[0033]下面结合附图,对本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向内容的动画视频无参考质量评价方法,其特征在于,该方法包括以下步骤:利用质量无损的参考视频生成失真视频样本,建立动画视频数据库;对视频数据库中的视频进行分类标注,形成第一训练数据集;将视频作为输入,视频对应的分类作为输出,训练得到具有视频分类功能的第一神经网络模型;对视频数据库中的每一类视频进行质量评价分数标注,并计算出每一类视频的时空特征,形成第二训练数据集;将每一类视频的时空特征作为神经网络模型的输入,视频对应的质量评价分数作为神经网络模型的输出,训练得到具有计算视频质量评价分数功能的第二神经网络模型;将待分类的视频输入到第一神经网络模型中得到分类结果,将确定的分类视频输入到对应的第二神经网络模型中得到待分类的视频无参考质量评价分数。2.根据权利要求1所述的一种面向内容的动画视频无参考质量评价方法,其特征在于,所述失真视频样本类型包括5种基于编码压缩的失真类型和1种基于传输的失真类型:AVC/H.264压缩失真、HEVC/H.265压缩失真、MPEG

2压缩失真、MJPEG全帧内压缩失真、基于小波变换的Snow压缩失真、白噪声失真。3.根据权利要求1所述的一种面向内容的动画视频无参考质量评价方法,其特征在于,时空特征具体包括以下5类特征中的一种或多种:(1)基于可察觉模糊的模糊程度值,(2)局部对比度,(3)基于感兴趣区域的统计特征值,(4)时域信息熵,(5)基于运动对比度敏感函数的运动感知特征值。4.根据权利要求1所述的一种面向内容的动画视频无参考质量评价方法,其特征在于,根据视频内容,动画视频数据库中的视频分别为如下5种类别:(1)人物与人脸视频,(2)特效视频,(3)背景前的物体视频,(4)多人在线战术竞技游戏视频,(5)风景与建筑视频。5.一种面向内容的动画视频无参考质量评价系统,其特征在于,该系统包括如下模块:视频构建模块,利用质量无损的参考视频生成失真视频样本,建立动画视频数据库;第一神经网络模型训练模块,对视频数据库中的视频进行分类标注,形成第一训练数据集;将视频作为输入,视频对应的分类作为输出,训练得到具有视频...

【专利技术属性】
技术研发人员:杨峰江蔚咸伟志王冬子周明亮
申请(专利权)人:南京中科逆熵科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1