当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于卷积神经网络的伪高码率HEVC视频检测方法技术

技术编号:25803888 阅读:25 留言:0更新日期:2020-09-29 18:38
一种基于卷积神经网络的伪高码率HEVC视频检测方法,通过计算HEVC视频的平均检测分数,与阈值比较判定是否为伪高码率视频。平均检测分数由视频的所有I帧的检测分数取平均值得到。I帧的检测分数的计算方法包括:对视频进行解压缩,提取I帧中亮度分量的所有PU的块大小和PU的帧内预测模式;构建I帧的PU块大小信息图和PU预测模式信息图;计算I帧的解压帧的灰度图中具有最大空间复杂度的正方形区域;构造I帧的PU块大小信息子图和PU预测模式信息子图,输入基于注意力机制的双通道卷积神经网络,得到I帧的检测分数。本发明专利技术将编码信息图与基于注意力机制的神经网络相结合能够有效提升检测性能,增强对不同编码设置与视频内容的鲁棒性。

【技术实现步骤摘要】
一种基于卷积神经网络的伪高码率HEVC视频检测方法
本专利技术涉及多媒体安全
,具体地,涉及一种基于卷积神经网络的伪高码率HEVC视频检测方法。
技术介绍
随着数字视频处理技术和网络传输技术的快速发展,数字视频已经成为人们接触最新资讯的重要方式之一,并在娱乐,司法,金融,医疗和教育等众多领域中得到广泛应用。视频码率常常被视作反应数字视频画面质量的重要指标,高码率视频具有更良好的画面质量。然而,先进的视频编辑软件,例如AdobePremiere和FFmpeg,能够十分容易的将低码率视频转换为高码率视频,此类经过码率上转的视频称为伪高码率视频。相对的,只经历过一次编码过程的视频称为真实码率视频。伪高码率视频虽然具有较高的码率,但其画面质量较差。此类视频常常被不法分子用于伪装高画质视频吸引网站点击量,也会出现在由不同码率视频拼接而成的篡改视频中。对于网络用户体验以及数字视频的真实性具有严重的负面影响。因此,准确检测数字视频是否为伪高码率视频对于保护数字视频的完整性与真实性具有重要的实际应用价值。此外,在大数据时代的互联网中,海量数字视频也急需可靠高效的方法进行伪高码率视频检测,这对保障网络空间安全具有积极的作用。伪高码率视频是一种特殊的数字视频转码操作已受到国内外学者的重视。现有的伪高码率视频检测方法大致分为基于像素域特征和基于编码域特征两类方法。在目前公开发表的专利中,有下列专利与本专利技术方法解决类似的问题;公开号为CN103327320A,题为《一种用于伪高码率视频的鉴定方法》的专利是一种基于像素域特征的检测方法。该方法根据多次重编码后伪高码率视频客观质量非单调下降的特征构建特征曲线,利用其拟合系数提取检测特征并结合支持向量机分类器对伪高码率视频进行检测。然而,此方法存在以下局限性:1)此方法在特征提取过程中需要进行多次重编码和解码,当输入视频分辨率较高时运算效率会明显降低。2)此方法根据解压帧的客观质量构造特征曲线,容易受到不同转码参数的影响,例如不同的视频编码标准等,鲁棒性较差。参考文献[1](X.Liang,Z.Li,Z.Li,Z.Zhang:FakeBitrateDetectionofHEVCVideosBasedonPredictionProcess.Symmetry11(7):918(2019))公开了一种基于预测过程信息的伪高码率HEVC视频检测方法。该方法利用编码单元的划分模式和预测单元的划分模式等编码信息构建统计特征,并结合支持向量机分类器对伪高码率视频进行检测。该算法运算效率较快,但存在以下不足:1)此方法的检测特征中包含帧间编码预测单元划分模式信息,因此无法对只包含I帧的伪高码率视频进行检测。2)此方法将不同编码信息的出现频率用于构建检测特征,无法反映编码信息的空间分布规律。因此,对伪高码率HEVC视频编码域的异常痕迹表征能力有限,对多样的视频内容泛化能力较差。参考文献[2](P.He,H.Li,B.Li,H.WangandL.Liu,ExposingFakeBitrateVideosUsingHybridDeep-learningNetworkfromRecompressionError,inIEEETransactionsonCircuitsandSystemsforVideoTechnology,2019,EarlyAccess.)公开了一种基于重编码误差及复合神经网络的伪高码率HEVC视频检测方法。该方法首先采用一次重编码过程,然后在像素域计算重编码误差并进行分块。将误差块输入复合神经网络对伪高码率视频进行检测。该算法在视频转码设置单一的情况下性能良好,但存在以下不足:1)当待测视频的编码过程与提取重编码误差的重编码过程存在编码参数不同的情况时,该方法的检测性能会出现明显下降,可靠性较差,不利于在实际取证场景下应用。2)此方法采用的复合神经网络对于不同来源的输入特征采用简单的拼接操作进行融合,容易造成网络参数过多的局限,增加对训练样本过拟合的风险。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于卷积神经网络的伪高码率HEVC视频检测方法。实现本专利技术目的的技术方案如下:一种基于卷积神经网络的伪高码率HEVC视频检测方法,包括:计算HEVC视频的平均检测分数与阈值Tf进行比较:若大于Tf则为伪高码率HEVC视频,反之则为真实码率HEVC视频;所述计算HEVC视频的平均检测分数的方法为:计算得到HEVC视频的每个I帧(Intra-codedframe,帧内编码帧)的检测分数sfake,将所有I帧的检测分数的平均值作为平均检测分数即T表示I帧的总数,t表示I帧的序号;其中,计算I帧的检测分数sfake的方法为:步骤1.对HEVC视频进行解压缩,得到I帧的解压帧,并提取I帧中亮度分量的所有PU(PredictionUnit,预测单元)的块大小和PU的帧内预测模式;步骤2.构建I帧的PU块大小信息图Fs和PU预测模式信息图Fp;Fs和Fp均为M×N的矩阵,M×N为I帧的分辨率;对于I帧的解压帧中坐标为(i,j)的像素,根据其所属PU的块大小c×c,令Fs(i,j)=log2(c),i∈{1,...,M},j∈{1,...,N},c表示块的边长;对于I帧的解压帧中坐标为(i,j)的像素,根据其所属PU的帧内预测模式,若为平面模式则令Fp(i,j)=0,若为均值模式则令Fp(i,j)=1,若为角度预测模式q则令Fp(i,j)=q,q∈{2,3,...,34};其中,角度预测模式的预测方向及编号方式与HEVC标准一致;步骤3.计算I帧的解压帧的灰度图中具有最大空间复杂度的正方形区域;包括3.1计算I帧的解压帧的灰度图3.2将灰度图分割为互不重叠的b×b正方形区域Bk;其中,b和k分别表示正方形区域的边长和编号,表示向下取整;Bk左上角像素点的坐标为表示向上取整;3.3计算正方形区域Bk的空间复杂度其中,为水平二维图像熵,为垂直二维图像熵,其中,表示在正方形区域Bk中灰度图的像素与其水平右侧相邻像素的取值分别为u和v的情况出现的次数,表示在正方形区域Bk中灰度图的像素与其垂直下侧相邻像素的取值分别为u和v的情况出现的次数,u,v∈{0,1,...,255};m、n分别表示灰度图中像素的横、纵坐标,and表示逻辑运算与操作;δ(·)表示指示函数,当指示函数中的条件成立时,指示函数取值为1,反之取值为0;3.4提取灰度图中具有最大空间复杂度的正方形区域其中,步骤4.构造I帧的PU块大小信息子图和PU预测模式信息子图,输入基于注意力机制的双通道卷积神经网络,得到I帧的检测分数;包括4.1构造I帧的PU块大小信息子图和PU预测模式信息子图,即大小均为r×r的矩阵和和的元素赋值为其中,x,y∈{1,...,r},xmax和ymax分别为I帧的灰度图中具有最大空间复本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的伪高码率HEVC视频检测方法,其特征在于,包括:/n计算HEVC视频的平均检测分数

【技术特征摘要】
1.一种基于卷积神经网络的伪高码率HEVC视频检测方法,其特征在于,包括:
计算HEVC视频的平均检测分数与阈值Tf进行比较:若大于Tf则为伪高码率HEVC视频,反之则为真实码率HEVC视频;
所述计算HEVC视频的平均检测分数的方法为:计算得到HEVC视频的每个I帧(Intra-codedframe,帧内编码帧)的检测分数sfake,将所有I帧的检测分数的平均值作为平均检测分数即T表示I帧的总数,t表示I帧的序号;
其中,计算I帧的检测分数sfake的方法为:
步骤1.对HEVC视频进行解压缩,得到I帧的解压帧,并提取I帧中亮度分量的所有PU(PredictionUnit,预测单元)的块大小和PU的帧内预测模式;
步骤2.构建I帧的PU块大小信息图Fs和PU预测模式信息图Fp;Fs和Fp均为M×N的矩阵,M×N为I帧的分辨率;对于I帧的解压帧中坐标为(i,j)的像素,根据其所属PU的块大小c×c,令Fs(i,j)=log2(c),i∈{1,...,M},j∈{1,...,N},c表示块的边长;对于I帧的解压帧中坐标为(i,j)的像素,根据其所属PU的帧内预测模式,若为平面模式则令Fp(i,j)=0,若为均值模式则令Fp(i,j)=1,若为角度预测模式q则令Fp(i,j)=q,q∈{2,3,...,34};其中,角度预测模式的预测方向及编号方式与HEVC标准一致;
步骤3.计算I帧的解压帧的灰度图中具有最大空间复杂度的正方形区域;包括
3.1计算I帧的解压帧的灰度图
3.2将灰度图分割为互不重叠的b×b正方形区域Bk;其中,b和k分别表示正方形区域的边长和编号,表示向下取整;Bk左上角像素点的坐标为表示向上取整;
3.3计算正方形区域Bk的空间复杂度其中,为水平二维图像熵,为垂直二维图像熵,


















其中,表示在正方形区域Bk中灰度图的像素与其水平右侧相邻像素的取值分别为u和v的情况出现的次数,表示在正方形区域Bk中灰度图的像素与其垂直下侧相邻像素的取值分别为u和v的情况出现的次数,u,v∈{0,1,...,255};m、n分别表示灰度图中像素的横、纵坐标,and表示逻辑运算与操作;δ(·)表示指示函数,当指示函数中的条件成立时,指示函数取值为1,反之取值为0;
3.4提取灰度图中具有最大空间复杂度的正方形区域其中,



步骤4.构造I帧的PU块大小信息子图和PU预测模式信息子图,输入基于注意力机制的双通道卷积神经网络,得到I帧的检测分数;包括
4.1构造I帧的PU块大小信息子图和PU预测模式信息子图,即大小均为r×r的矩阵和和的元素赋值为






其中,x,y∈{1,...,r},xmax和ymax分别为I帧的灰度图中具有最大空间复杂度的正方形区域的左上角元素的横、纵坐标;
4.2构造基于注意力机制的双通道卷积神经网络并进行训练;所述神经网络:
包括结构相同的通道1和通道2;所述通道1由多个相同的卷积模块依...

【专利技术属性】
技术研发人员:何沛松王宏霞刘嘉勇
申请(专利权)人:四川大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1