基于多特征哈希的视频拷贝检测方法技术

技术编号:9967594 阅读:93 留言:0更新日期:2014-04-25 08:18
本发明专利技术公开了一种基于多特征哈希的视频拷贝检测方法,主要解决现有视频拷贝检测算法不能有效平衡检测效率和检测精度的问题。其实现步骤是:(1)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;(2)提取关键帧的基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;(3)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数;(4)利用L个哈希函数,将数据库视频关键帧和查询视频关键帧映射为L维的哈希码;(5)通过特征匹配判断查询视频是否为拷贝视频。本发明专利技术对多种攻击具有良好的鲁棒性,可用于互联网上数字视频的版权保护、拷贝控制及数据挖掘。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,主要解决现有视频拷贝检测算法不能有效平衡检测效率和检测精度的问题。其实现步骤是:(1)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;(2)提取关键帧的基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;(3)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数;(4)利用L个哈希函数,将数据库视频关键帧和查询视频关键帧映射为L维的哈希码;(5)通过特征匹配判断查询视频是否为拷贝视频。本专利技术对多种攻击具有良好的鲁棒性,可用于互联网上数字视频的版权保护、拷贝控制及数据挖掘。【专利说明】
本专利技术属于信息安全
,具体的说是一种视频特征提取和拷贝检测的方法,该方法能有效抵抗常规视频攻击、几何攻击及组合攻击,可用于互联网上数字视频的版权保护、视频内容分析及拷贝控制领域。
技术介绍
随着数字技术的不断进步和计算机网络的日益普及,多媒体数据正逐渐成为人们获取信息的重要来源,特别是互联网视频网站越来越多。数字化的多媒体数据获取容易、复制简单并且传播迅速,不仅给多媒体信息的存取提供了极大的便利,而且极大提高了信息表达的效率和准确性,但由此引发的盗版问题、版权纷争和数据管理也成为日益严重的社会问题。例如,拷贝视频侵犯了数字视频版权所有者的权利和经济效益,造成了严重的盗版和侵权问题;而一些具有特殊意义的视频信息,如涉及司法诉讼、政府机要等信息如果遭到恶意攻击和篡改伪造,则会给司法公正和国家安全带来极大的危害;同时人们可以随意地对网络上的视频进行复制、编辑和传播,导致搜索引擎的搜索结果重复,大大的降低了搜索的效率;而且,随着视频网站的增多以及视频检索的广泛应用,这些拷贝视频正成为“垃圾视频”,危害着视频网络。因此如何在利用多媒体信息和计算机网络的同时,又可以有效的保护知识产权、保障信息安全和保证搜索精度已成为一个亟需解决的现实问题。视频拷贝检测技术是实现数字视频版权保护及数据库管理的有效方法,已成为多媒体信息安全领域的一个研究热点。视频拷贝检测技术不需要向原始视频中嵌入任何信息,其提取的特征序列包含了视频内容的足够信息,在实际应用中可以通过测量查询视频与参考视频之间的距离来判断查询视频是否是参考视频的拷贝。一个典型的视频拷贝检测技术的步骤如下:(I)从原始参考视频和查询视频中提取视频特征序列;(2)数据库搜索;(3)对参考视频特征序列和查询视频特征序列按照某种度量方式进行比较,若两者之间的距离小于既定阈值,则认为查询视频是拷贝视频。在以上步骤中,最重要的是提取能够代表视频内容且对视频的各种攻击具有鲁棒性的视频特征,这也是研究者首要考虑的问题。近年来,许多专家学者从不同的角度研究视频拷贝检测,但依然有两个问题没有解决。首先是已存在的大部分方法用单一特征描述视频内容,然而不同的视觉特征有截然不同的描述功能,比如全局特征可以有效地描述视频的全局信息,但对全局攻击的鲁棒性较弱,局部特征可以有效地描述视频的局部信息,但对视频的局部攻击比较敏感,因此单一特征构造的视频信息无法全面的描述视频内容,缺乏广泛的鲁棒性,然而直接级联多种视觉特征会造成维数灾难,降低检测效率;其次已存在的大部分索引方法旨在提高检测效率而忽略了检测精度。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种,以挖掘不同视觉特征之间的互补性,在保证视频拷贝检测精度的同时,提高检测效率。实现本专利技术目的的技术方案是:将视频看作一系列关键帧的组合,提取关键帧的多种特征,设计有效的目标函数,学习能够保持原始空间中相似结构的哈希函数一即利用多种视觉特征中蕴含的互补信息构建多特征哈希,最后利用产生的哈希函数将数据库及查询视频的高维特征进行哈希化处理,得到有区分力的哈希码。哈希码保留了原始数据的相似性,提高视频拷贝检测在不同攻击下的检索精度和检索效率。其具体步骤包括如下:(1)多特征提取步骤:(1a)给定视频V,将视频V分割成一系列连续的相等长度的视频镜头V =(C1, C2,…,Ci,...,C1),Ci是视频V的第i个镜头,i = 1,2,...,1,1是视频镜头的个数;(1b)将每一个视频镜头的帧率统一为每秒30帧,将所有的视频帧转换为宽度为320,高度为240的灰度图像;(1c)对每一个视频镜头进行降6采样处理,即每6个视频帧提取一个关键帧;(1d)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;(1e)利用尺度不变特征变换SIFT检测算子,提取关键帧的特征点,获得关键帧的特征点集,在关键帧大小为120X40的中心区域内,选择特征强度最大的特征点作为圆心,构造半径为R的稳定的圆形特征区域,若该区域不存在特征点,则选择关键帧的中心为圆心,提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;(2)特征映射步骤:(2a)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数h1, h2,..., h1;..., hj , hx是第1个哈希函数,1 = 1, 2,..., L ;(2b)对于每个关键帧,结合提取的全局特征和局部特征,由每一个哈希函数产生一位哈希码,利用L个哈希函数,使数据库视频的关键帧和查询视频的关键帧映射为L维的哈希码;(3)特征匹配步骤:(3a)测量查询视频镜头Q与数据库中的参考视频镜头P的相似度,表示为:【权利要求】1.一种,包括: (1)多特征提取步骤: (Ia)给定视频V,将视频V分割成一系列连续的相等长度的视频镜头V= IC1, C2,…,Ci,..., C1I, Ci是视频V的第i个镜头,i = 1,2,...,I,I是视频镜头的个数; (Ib)将每一个视频镜头的帧率统一为每秒30帧,将所有的视频帧转换为宽度为320,高度为240的灰度图像; (Ic)对每一个视频镜头进行降6采样处理,即每6个视频帧提取一个关键帧; (Id)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征; (Ie)利用尺度不变特征变换SIFT检测算子,提取关键帧的特征点,获得关键帧的特征点集,在关键帧大小为120X40的中心区域内,选择特征强度最大的特征点作为圆心,构造半径为R的稳定的圆形特征区域,若该区域不存在特征点,则选择关键帧的中心为圆心,提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征; (2)特征映射步骤: (2a)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数Oi1, h2,…,Ii1,...,hj,hx是第I个哈希函数,I = I, 2,..., L ; (2b)对于每个关键帧,结合提取的全局特征和局部特征,由每一个哈希函数产生一位哈希码,利用L个哈希函数,使数据库视频的关键帧和查询视频的关键帧映射为L维的哈希码; (3)特征匹配步骤: (3a)测量查询视频镜头Q与数据库中的参考视频镜头P的相似度,表示为: 2.根据权利要求1所述的,其中步骤(Ie)所述的提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征,按如下步骤进行: (Iel)将圆形特征区域进行极坐标划分: 首先,本文档来自技高网
...

【技术保护点】
一种基于多特征哈希的视频拷贝检测方法,包括:(1)多特征提取步骤:(1a)给定视频V,将视频V分割成一系列连续的相等长度的视频镜头V={C1,C2,…,Ci,...,CI},Ci是视频V的第i个镜头,i=1,2,...,I,I是视频镜头的个数;(1b)将每一个视频镜头的帧率统一为每秒30帧,将所有的视频帧转换为宽度为320,高度为240的灰度图像;(1c)对每一个视频镜头进行降6采样处理,即每6个视频帧提取一个关键帧;(1d)提取关键帧的塔型梯度方向直方图PHOG为关键帧的全局特征;(1e)利用尺度不变特征变换SIFT检测算子,提取关键帧的特征点,获得关键帧的特征点集,在关键帧大小为120×40的中心区域内,选择特征强度最大的特征点作为圆心,构造半径为R的稳定的圆形特征区域,若该区域不存在特征点,则选择关键帧的中心为圆心,提取基于尺度不变特征变换SIFT的加权对比度直方图为关键帧的局部特征;(2)特征映射步骤:(2a)利用相似度保持的多特征哈希学习SPM2H算法建立目标函数,通过优化求解得到L个哈希函数{h1,h2,…,hl,...,hL},hl是第l个哈希函数,l=1,2,...,L;(2b)对于每个关键帧,结合提取的全局特征和局部特征,由每一个哈希函数产生一位哈希码,利用L个哈希函数,使数据库视频的关键帧和查询视频的关键帧映射为L维的哈希码;(3)特征匹配步骤:(3a)测量查询视频镜头Q与数据库中的参考视频镜头P的相似度,表示为:sim(Q,P)=ΣYi∈GQ(minYj∈GP(sim(Yi,Yj))),]]>式中,Yi是查询视频镜头Q的第i个关键帧的哈希码,Yj是数据库中参考视频镜头P的第j个关键帧的哈希码,GQ是查询视频镜头Q的关键帧集合,GP是数据库中参考视频镜头P的关键帧集合,式中sim(Yi,Yj)是视频关键帧Yi与Yj的相似度,表示为:sim(Yi,Yj)=1LΣLYi⊗Yj,]]>式中,L是哈希码的维数,是异或操作;(3b)定义匹配检测阈值ε:设数据库中的视频镜头为A个,分别为{P1,P2,...,Pb,...,PA},b=1,2,...,A,Pb为数据库中第b个视频镜头,计算查询视频镜头Q与数据库中每个视频镜头Pb的相似度,得到A个相似度值为{sim(Q,P1),sim(Q,P2),...,sim(Q,Pb),...,sim(Q,PA)},对其从小到大排列,在最大值与最小值之间均匀取值作为匹配检测阈值ε;(3c)将查询视频镜头Q与数据库中的参考视频镜头P的相似度sim(Q,P)与匹配检测阈值ε进行比较,如果sim(Q,P)≤ε,则认为查询视频镜头Q是数据库中参考视频镜头P的拷贝,如果sim(Q,P)>ε,则认为查询视频镜头Q不是数据库中参考视频镜头P的拷贝。...

【技术特征摘要】

【专利技术属性】
技术研发人员:邓成彭海燕杨延华李洁王颖高新波
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1