一种相似图片检测方法及装置制造方法及图纸

技术编号:11284106 阅读:93 留言:0更新日期:2015-04-10 18:22
本发明专利技术实施例公开了一种相似图片检测方法及装置,一种相似图片检测方法包括:将待比较的两幅图片按照预设的划分规则分别划分成多个关键区块;对待比较的两幅图片,按照预设的pHhash算法分别计算得到每幅图片的hash串和每幅图片的各个关键区块的hash串;将待比较的两幅图片的hash串,和待比较的两幅图片的各个关键区块的hash串分别进行比较,获得相似hash串;当获得的相似hash串的个数为两个或两个以上时,则待比较的两幅图片为相似图片,否则待比较的两幅图片不相似。与现有技术相比,本发明专利技术的技术方案提高了在不考虑图片的旋转特性时的图片相似性检测的准确度。

【技术实现步骤摘要】
【专利摘要】本专利技术实施例公开了一种相似图片检测方法及装置,一种相似图片检测方法包括:将待比较的两幅图片按照预设的划分规则分别划分成多个关键区块;对待比较的两幅图片,按照预设的pHhash算法分别计算得到每幅图片的hash串和每幅图片的各个关键区块的hash串;将待比较的两幅图片的hash串,和待比较的两幅图片的各个关键区块的hash串分别进行比较,获得相似hash串;当获得的相似hash串的个数为两个或两个以上时,则待比较的两幅图片为相似图片,否则待比较的两幅图片不相似。与现有技术相比,本专利技术的技术方案提高了在不考虑图片的旋转特性时的图片相似性检测的准确度。【专利说明】一种相似图片检测方法及装置
本专利技术涉及图片检索
,特别是涉及一种相似图片检测方法及装置。
技术介绍
在视频的审核和处理过程中,以及图片搜索过程中,往往需要对图片的重复性或相似性进行检测。因此,如何构建一个高速、准确的相似图片检测方法是一个亟待解决的问题。 目前,现有技术的相似图片检测方法是利用pHash算法分别获得两幅图片的hash串,然后通过比较两幅图片的hash串的相似性来确定这两幅图片是否为相似图片。 由于现有技术得到的是整幅图片的hash串,所以现有的相似图片检测方法具有良好的抗旋转特性,但对于某些应用场景来说,图片的旋转特性是不被考虑的。在不考虑图片的旋转特性时,由于现有技术在进行图片相似性检测时仅获得了待比较的两幅图片的hash串,所以检测的维度较低,相应的图片相似性检测的准确度不高。
技术实现思路
本专利技术实施例的目的在于提供一种相似图片检测方法及装置,以提高在不考虑图片的旋转特性时的图片相似性检测的准确度。具体技术方案如下: 一种相似图片检测方法,包括: 将待比较的两幅图片按照预设的划分规则分别划分成多个关键区块; 对待比较的两幅图片,按照预设的pHhash算法分别计算得到每幅图片的hash串和所述每幅图片的各个关键区块的hash串; 将待比较的两幅图片的hash串,和待比较的两幅图片的各个关键区块的hash串分别进行比较,获得相似hash串; 当获得的相似hash串的个数为两个或两个以上时,则待比较的两幅图片为相似图片,否则待比较的两幅图片不相似。 在本专利技术的一种【具体实施方式】中,所述对待比较的两幅图片,按照预设的pHhash算法计算得到每幅图片的hash串和所述每幅图片的各个关键区块的hash串的步骤包括: 将待比较的两幅图片中的每幅图片和所述每幅图片的各个关键区块进行平滑处理; 将所述每幅图片和所述每幅图片的各个关键区块分别缩小并转换为32*32的灰度图片; 在得到的所述灰度图片上进行IDCT变换,分别得到所述每幅图片和所述每幅图片的各个关键区块的32*32的IDCT系数值; 去掉所述IDCT系数值的边缘一周,并获取去掉边缘一周后的IDCT系数值的左上角的8*8区域; 按照预设的算法,由所述左上角的8*8区域计算得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串。 在本专利技术的一种【具体实施方式】中,所述对待比较的两幅图片,按照预设的pHhash算法计算得到每幅图片的hash串和所述每幅图片的各个关键区块的hash串的步骤包括: 将待比较的两幅图片中的每幅图片和所述每幅图片的各个关键区块进行平滑处理; 将所述每幅图片和所述每幅图片的各个关键区块分别缩小并转换为32*32的灰度图片; 在得到的所述灰度图片上进行DCT变换,分别得到所述每幅图片和所述每幅图片的各个关键区块的32*32的DCT系数值; 去掉所述DCT系数值的边缘一周,并获取去掉边缘一周后的DCT系数值的左上角的8*8区域; 按照预设的算法,由所述左上角的8*8区域计算得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串。 在本专利技术的一种【具体实施方式】中,所述按照预设的算法,由所述左上角的8*8区域计算得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串的步骤包括: 计算得到所述左上角的8*8区域的均值; 将所述左上角的8*8区域的每一个位置的值与所述均值比较,大于均值的位置取I,小于等于均值的位置取O; 将取得的所有位置的值按照预定的第一顺序排列,得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串。 在本专利技术的一种【具体实施方式】中,所述按照预设的算法,由所述左上角的8*8区域计算得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串的步骤包括: 将所述左上角的8*8区域内的数值按照位置相邻的关系顺次比较大小,大于相邻位置的值取I,小于等于相邻位置的值取O ; 将取得的所有位置的值按照预定的第二顺序排列,得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串。 在本专利技术的一种【具体实施方式】中,所述按照预设的算法,由所述左上角的8*8区域计算得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串的步骤包括: 将所述左上角的8*8区域内的数值按照位置相邻的关系划分为32个数值对; 将每个数值对中的数值按照预定的顺序比较大小,每个数值对中的第一数值大于第二数值时,该数值对的第一数值所在的位置取1,第二数值所在的位置取0,否则该数值对的第一数值所在的位置取0,第二数值所在的位置取I ; 将取得的所有位置的值按照预定的第三顺序排列,得到所述每幅图片的hash串和所述每幅图片的各个关键区块的hash串。 在本专利技术的一种【具体实施方式】中,所述将待比较的两幅图片按照预设的划分规则分别划分成多个关键区块具体为将每幅图片划分成左图、右图和中心图三部分,其中,所述左图、右图和中心图各占图片的三分之一。 在本专利技术的一种【具体实施方式】中,所述相似hash串为hash串之间的汉明距离小于预定值的hash串。 本专利技术实施例还提供一种相似图片检测装置,包括: 关键区块划分单元:用于将待比较的两幅图片按照预设的划分规则分别划分成多个关键区块; hash串计算单元:用于对待比较的两幅图片,按照预设的pHhash算法分别计算得到每幅图片的hash串和所述每幅图片的各个关键区块的hash串; 相似hash串获得单元:用于将待比较的两幅图片的hash串,和待比较的两幅图片的各个关键区块的hash串分别进行比较,获得相似hash串; 相似图片识别单元:用于当获得的相似hash串的个数为两个或两个以上时,则待比较的两幅图片为相似图片,否则待比较的两幅图片不相似。 在本专利技术的一种【具体实施方式】中,所述hash串计算单元具体包括: 平滑处理单元:用于将待比较的两幅图片中的每幅图片和所述每幅图片的各个关键区块进行平滑处理; 灰度图片获得单元:用于将所述每幅图片和所述每幅图片的各个关键区块分别缩小并转换为32*32的灰度图片; IDCT变换单元:用于在得到的所述灰度图片上进行IDCT变换,分别得到所述每幅图片和所述每幅图片的各个关键区块的32*32的IDCT系数值; 第一预设区域获取单元:用于去掉所述IDCT系数值的边缘一周,并获取去掉边缘一周后的IDC本文档来自技高网...

【技术保护点】
一种相似图片检测方法,其特征在于,包括:将待比较的两幅图片按照预设的划分规则分别划分成多个关键区块;对待比较的两幅图片,按照预设的pHhash算法分别计算得到每幅图片的hash串和所述每幅图片的各个关键区块的hash串;将待比较的两幅图片的hash串,和待比较的两幅图片的各个关键区块的hash串分别进行比较,获得相似hash串;当获得的相似hash串的个数为两个或两个以上时,则待比较的两幅图片为相似图片,否则待比较的两幅图片不相似。

【技术特征摘要】

【专利技术属性】
技术研发人员:张彦刚
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1