一种相似视频和盗版视频的检测方法及装置制造方法及图纸

技术编号:14990586 阅读:42 留言:0更新日期:2017-04-03 21:35
本发明专利技术实施例提供了一种相似视频和盗版视频的检测方法及装置,盗版视频的检测方法包括:获取待检测视频;根据预设规则,从待检测视频中提取多张特征图片作为第二图片库;确定第一图片库和第二图片库中每张图片的hash特征值,第一图片库为从正版视频中提取出的多张特征图片构成的;根据所述每张图片的hash特征值确定每两张图片之间的汉明距离;确定对应小于预设第一阈值的汉明距离的图片为一组相似图片;当相似图片的组数与对比数量总量的比值大于预设第二阈值时,确定待检测视频为盗版视频。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断待检测视频是否为盗版视频,大大提高了盗版视频的检测效率。

【技术实现步骤摘要】

本专利技术涉及视频处理
,特别是涉及一种相似视频和盗版视频的检测方法及装置
技术介绍
随着互联网的快速发展,大量的视频资源不断涌现,方便人们随随时随地进行视频观看。与此同时,盗版视频也层出不穷,大量的视频盗播给视频版权独享公司带来了巨大损失。为了保护视频版权,可以通过检测待检测视频与正版视频是否相似来判断待检测视频是否为盗版视频。现有技术中,一般是通过比对待检测视频与正版视频的名称,或者通过人工查看待检测视频与正版视频的内容等方式来判断视频是否为相似视频,进而确定待检测视频是否为盗版视频。但是,视频的名称是很容易被修改的,对于一些修改了名称的盗播视频,通过比对视频名称的方法很难检测出来,而且,人工查看视频内容的检测方法工作量较大,效率较低。
技术实现思路
本专利技术实施例的目的在于提供一种相似视频和盗版视频的检测方法及装置,大大提高了相似视频和盗版视频的检测效率。为达到上述目的,本专利技术实施例公开了一种相似视频的检测方法,包括步骤:根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;确定所述第一图片库和第二图片库中每张图片的hash特征值;根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。可选的,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。可选的,所述根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库,包括:根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。可选的,确定两个待检测视频为相似视频后,所述方法还包括:根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。可选的,确定所述两个待检测视频为相似视频后,所述方法还包括:根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。可选的,确定所述两个待检测视频为相似视频后,所述方法还包括:根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。为了达到上述目的,本专利技术实施例还公开了一种盗版视频的检测方法,包括步骤:获取待检测视频;根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;确定第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。可选的,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。可选的,所述根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库,包括:根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。可选的,确定所述待检测视频为盗版视频后,所述方法还包括:根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所本文档来自技高网...

【技术保护点】
一种相似视频的检测方法,其特征在于,所述方法包括:根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;确定所述第一图片库和第二图片库中每张图片的hash特征值;根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。

【技术特征摘要】
1.一种相似视频的检测方法,其特征在于,所述方法包括:
根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一
图片库和第二图片库;
确定所述第一图片库和第二图片库中每张图片的hash特征值;
根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第
一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个
汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉
明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图
片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第
二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量
总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第一图片库和
第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,
并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换
DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
3.根据权利要求1所述的方法,其特征在于,所述根据第一预设规则,从
两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库,包括:
根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第
一图片库和第二图片库。
4.根据权利要求1所述的方法,其特征在于,确定两个待检测视频为相似
视频后,所述方法还包括:
根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一
图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库
和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值

\t绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的
LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重
叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,
确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第
三阈值,如果是,确定所述两个待检测视频为相似视频。
5.根据权利要求1所述的方法,其特征在于,确定所述两个待检测视频为
相似视频后,所述方法还包括:
根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一
图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每
张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,
计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第
四阈值,如果是,确定所述两个待检测视频为相似视频。
6.根据权利要求1所述的方法,其特征在于,确定所述两个待检测视频为
相似视频后,所述方法还包括:
根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一
图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和
第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个
极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,
若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在
与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一
图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则
确定所述两个待检测视频为相似视频。
7.一种盗版视频的检测方法,其特征在于,所述方法包括:
获取待检测视频;
根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;
确定第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图
片库为从正版视频中提取出的多张特征图片构成的;
根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第

\t一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个
汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉
明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图
片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第
二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量
为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
8.根据权利要求7所述的方法,其特征在于,所述确定所述第一图片库和
第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,
并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换
DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
9.根据权利要求7所述的方法,其特征在于,所述根据第一预设规则,从
待检测视频中提取多张特征图片作为第二图片库,包括:
根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
10.根据权利要求7所述的方法,其特征在于,确定所述待检测视频为盗
版视频后,所述方法还包括:
根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,
第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模
式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点
的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库
中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片
确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据
所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相
似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频
为盗版视频。
11.根据权利要求7所述的方法,其特征在于,所述确定所述待检测视频
为盗版视频后,所述方法还包括:
根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,
第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性
SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的
每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的
相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视
频为盗版视频。
12.根据权利要求7所述的方法,其特征在于,所述确定所述待检测视频
为盗版视频后,所述方法还包括:
根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,
第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特
征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,
针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每
张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五
阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一
图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数
量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
13.一种相似视频的检测装置,...

【专利技术属性】
技术研发人员:李亚宁
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1