System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于频谱信息引导的图像检索方法技术_技高网

基于频谱信息引导的图像检索方法技术

技术编号:41731627 阅读:4 留言:0更新日期:2024-06-19 12:53
本发明专利技术公开了一种基于频谱信息引导的图像检索方法,首先获取图像,对图像进行数据增强,得到成对的强、弱变换图像;然后,通过快速傅里叶变换将强、弱变换图像由空域转换至频域,得到频域图像F<subgt;S</subgt;和F<subgt;T</subgt;;提取频域图像F<subgt;S</subgt;和F<subgt;T</subgt;的频谱信息,得到频谱特征A<subgt;S</subgt;和A<subgt;T</subgt;,并对频谱特征进行归一化处理;将频谱特征A<subgt;S</subgt;和A<subgt;T</subgt;分别与强、弱变换图像进行融合,得到由频谱信息引导的强、弱变换图像;最后,构建深度哈希网络,将由频谱信息引导的强、弱变换图分别输入到深度哈希网络中,提取各自的哈希量化编码;对深度哈希网络进行训练,将训练后的教师模型或学生模型用于图像检索。通过频谱信息对空域图像进行引导,增大图像之间的差异信息,生成更加准确的哈希量化编码,提升了检索性能。

【技术实现步骤摘要】

本专利技术属于图像检索,具体是一种基于频谱信息引导的图像检索方法


技术介绍

1、图像检索是一种通过待查询图像来查找、检索与之匹配图像的技术,主要目的是从大型图像数据库中匹配得到与待查询图像在语义上最相关的图像。图像检索具有广泛的应用价值,在图像搜索引擎、医学图像分析、安全监控等许多领域都发挥着关键作用,能够帮助人们更轻松地访问和管理图像数据,从而提高工作效率和用户体验,缩短决策进程。随着数据库规模的逐渐增大,在数据库中遍历搜索所需要的图像,需要消耗更多的人力、时间资源。而通过语义特征对数据库中的图像和待查询图像进行表征,则将待查询图像在数据库中的查找问题转化为语义特征之间的相似性判断问题,能够极大程度地提高检索效率。

2、哈希算法在速度以及存储方面具有显著优势,故被广泛用于大规模的图像检索任务。哈希算法分为传统哈希和深度哈希算法两类,传统哈希算法基于图像特征实现,通过手工设计的卷积核提取图像特征,根据特征之间相似性的大小来确定数据库中与之匹配的图像,并将其作为检索结果。受限于手工设计的卷积核以及模型深度问题,传统哈希算法生成的哈希编码只含有少量的语义信息。而借助于深度神经网络更为强大的表征学习能力,深度哈希算法能够获取到包含更多高层语义信息的哈希编码,同时为了实现更快速的检索,将深度神经网络提取的哈希编码压缩到海明空间中,将离散的哈希编码之间的相似性计算转换为二进制哈希编码的汉明距离计算。

3、为了更有效地利用图像信息,通常采用图像级的数据增强方式增大强、弱变换图像间的相对差异,使特征提取网络能够提取到准确的域不变特征。由于哈希编码的维度有限,导致在哈希编码生成过程中存在大量的语义信息损失,使得哈希编码无法包含充足的语义信息差异;同时,在编码量化过程中空域特征往往无法充分捕获语义信息差异,从而使得生成的哈希编码不够准确,影响图像检索的性能。相较于空域特征,频谱特征能够更大程度捕获图像变换产生的相对差异信息,因此本专利技术提出一种基于频谱信息引导的图像检索方法,通过频谱信息对数据增强后的图像进行引导,以减少语义信息差异的损失。


技术实现思路

1、针对现有技术的不足,本专利技术拟解决的技术问题是,提供一种基于频谱信息引导的图像检索方法。

2、本专利技术解决所述技术问题采用如下的技术方案:

3、一种基于频谱信息引导的图像检索方法,其特征在于,包括如下步骤:

4、第一步:获取图像,对图像进行数据增强,得到成对的强、弱变换图像xs和xt;

5、第二步:通过快速傅里叶变换将强、弱变换图像由空域转换至频域,得到频域图像fs和ft;通过式(3)、(4)提取频域图像fs和ft的频谱信息,得到频谱特征as和at;通过式(5)、(6)对频谱特征进行归一化处理;

6、as=[fsr2+fsi2]1/2  (3)

7、at=[ftr2+fti2]1/2  (4)

8、

9、

10、式中,r、i分别表示实部和虚部,表示归一化后的频谱特征,分别表示频谱特征at的最大值和最小值,分别表示频谱特征as的最大值和最小值;

11、通过式(7)、(8)将频谱特征与强、弱变换图像进行融合,得到由频谱信息引导的强、弱变换图像x′s和x′t;

12、

13、

14、式中,δ表示振幅系数;

15、第三步:构建深度哈希网络,深度哈希网络包括教师模型和学生模型,两个模型共享参数;将由频谱信息引导的强、弱变换图分别输入到学生模型和教师模型中,提取各自的哈希量化编码;

16、第四步:对深度哈希网络进行训练,得到训练后的教师模型和学生模型;将待查询图像输入到训练后的教师模型或学生模型中,得到检索图像。

17、进一步的,在网络训练过程中,根据式(19)计算训练损失;

18、

19、式中,lt为总损失,nb为样本总数,λ1、λ2、λ3均为权重,lhp为哈希代理损失,lsdh为学生模型与教师模型之间的自蒸馏差异量化损失,lbce-q为二进制交叉熵损失,ldis为高频细节损失;

20、高频细节损失ldis的计算公式为:

21、ldis=1-cos(hht,hhs)  (18)

22、

23、

24、式中,hht表示教师模型提取的哈希量化编码ht的高频子带信息,hhs表示学生模型提取的哈希量化编码hs的高频子带信息,表示二维小波基函数,(n,m)表示编码位,p、q分别表示尺度和平移参数,n、m分别表示哈希量化编码的长度和宽度。

25、与现有技术相比,本专利技术的优点和有益效果是:

26、1、一方面,图像的相位往往能够更多的捕获图像的纹理结构,但是相位特征在一定程度上会抑制数据增强产生的语义信息差异,从而使得无法提取出准确的域不变特征。另一方面,现有方法即使通过图像级的数据增强增大图像之间的差异,但由于哈希编码有限的维度,导致在编码生成过程中存在大量的语义信息损失,使得哈希编码无法包含充足的语义信息差异,从而使得生成的哈希编码不够准确,影响图像检索性能。因此,本专利技术方法对变换后的图像进行解耦,从中提取包含更多差异信息的频谱特征,并将频谱特征与变换后的原始图像进行融合,利用频谱信息对数据增强后的空域图像进行引导,从而增大强、弱变换图像之间的相对差异信息,以辅助特征提取网络更好地提取域不变特征,使得生成的哈希编码更加准确,提升图像检索性能。

27、2、通过离散小波变换对哈希量化编码进行分解,得到高频子带信息,通过高频水平和高频垂直的细节信息来更好的捕获信息差异,从而使得获取到的哈希量化编码具有更强的可判别性,进一步提升检索性能。

本文档来自技高网...

【技术保护点】

1.一种基于频谱信息引导的图像检索方法,其特征在于,该方法包括如下步骤:

2.根据权利要求1所述的基于频谱信息引导的图像检索方法,其特征在于,在网络训练过程中,根据式(19)计算训练损失;

3.根据权利要求2所述的基于频谱信息引导的图像检索方法,其特征在于,所述二维小波基函数的表达式为:

4.根据权利要求1~3任一所述的基于频谱信息引导的图像检索方法,其特征在于,当深度哈希网络的特征提取网络为ResNet网络时,振幅系数δ∈{0.01,0.005,0.001,0.001};当深度哈希网络的特征提取网络为AlexNet网络时,振幅系数δ取值为0.04。

【技术特征摘要】

1.一种基于频谱信息引导的图像检索方法,其特征在于,该方法包括如下步骤:

2.根据权利要求1所述的基于频谱信息引导的图像检索方法,其特征在于,在网络训练过程中,根据式(19)计算训练损失;

3.根据权利要求2所述的基于频谱信息引导的图像检索方法,其特征在于,所述二维小波基...

【专利技术属性】
技术研发人员:张军王朝权张智铭刘甲鹏郭子峻康雨过徐正阳
申请(专利权)人:河北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1