System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于空频域融合的书画文字作品识别方法技术_技高网

一种基于空频域融合的书画文字作品识别方法技术

技术编号:39992832 阅读:13 留言:0更新日期:2024-01-09 02:27
面向书画文字作品识别任务,本发明专利技术提出了一种基于时频域融合的智能识别算法,以准确识别书画作品的作家。在该算法中,空域下特征提取网络采用只有6层的极简网络VanillaNet‑6作为Backbone,网络结构中未使用残差块、通道注意力、自注意力机制以及多分支结构,而是只含卷积计算的极简直筒结构;频域下通过离散余弦变换(Discrete Cosine Transform,DCT),将变换后的特征的维度与原始特征维度拼接后,再通过集成学习(Ensemble Learning)将空域与频域的识别结果进行融合,以此来提高算法对于中国书画文字作品的识别准确率。

【技术实现步骤摘要】

:本专利技术涉及书画文字图像的识别算法。现有技术:书画作品鉴定被公认为是文物鉴定学最复杂一门学科,不仅需要专业技术、学识修养同时需要感觉和智慧,更需要大量相关经验的积累。书画作品鉴定的主要依据是书画作品本身,即书画文字的时代风格、书画家的个人风格以及作品的质地等。传统书画作品鉴定面临诸多问题,主要依赖于鉴定者自身的专业技术修养与长期相关经验的积累,然而每个鉴定专家都会受到自身知识领域与见识的制约。这种鉴定方式主要是针对一些名人名作,鉴定者或根据同一作者的风格并结合历史时期、材质用料对作品做出推断,或将待检测作品与已经确定为真迹的作品进行对比,并最终做出结论。这种方式的缺点是过于依赖经验,对鉴定者的素质要求很高,即要求鉴定者见过的作品必须要多,有实物可以对比,才能得出可信的结论。对于传统鉴定方式例如采用物理化学以及采用各种高频光谱方法辅助进行鉴定,但是此类方法会带来许多问题。首先,物理和化学方法很显然会对珍贵文物造成不可避免的损伤,即使是高频光谱照射的方法也可能会造成书画作品颜料失色等问题。其次,该种方式的配套设备都比较专业昂贵,缺乏普及性,与传统鉴定方式一样,鉴别的渠道途径很窄。而计算机视觉技术是使用计算机及相关成像设备对生物视觉的一种模拟,模仿人类获取、处理、分析、理解图像的过程。通过模仿专家的鉴定方式,可利用计算机视觉技术对书画作品进行鉴别。由于近现代书画作品种类繁多、数量巨大,作伪手段精妙且千差万别,这些因素都为基于计算机视觉的书画鉴别技术研究增添了诸多障碍和困难。因此,利用计算机视觉技术进行书画作品的非接触式鉴定逐渐变得越来越重要,如何利用现有视觉技术构建书画作品的鉴定系统,是目前亟待解决的问题。基于计算机视觉的鉴别方法,以数字作品为研究对象,利用图像处理、计算机视觉、图像识别等技术,为人们提供定性或定量的指标,以确定作品的真实性。文献1“hong y,kim j.art painting identification using convolutional neural network[j].international journal of applied engineering research,2017,12(4):532-539.”提出一种将cnn应用于艺术绘画鉴定的方法;文献2“zhai s,liao l,lin y,etal.inscription detection and style identification in chinese painting[c]//2020chinese automation congress(cac).ieee,2020:7434-7438.”通过深度神经网络提取绘画中的铭文并结合绘画特征进行改进,为鉴定提供了技术支持;文献3“tang x,zhangp,du j,et al.calligraphy and painting identification method based onhyperspectral imaging and convolution neural network[j].spectroscopy letters,2021,54(9):645-664.”采用高光谱成像和atlas智能学习相结合的思想,提出了一种用于书画识别的图谱特征提取方法;文献4“buchana p,cazan i,diaz-granados m,etal.simultaneous forgery identification and localization in paintings usingadvanced correlation filters[c]//2016ieee international conference on imageprocessing(icip).ieee,2016:146-150.”通过在原始绘画的粗分割图像的每个部分上训练最优权衡合成判别函数(otsdf)滤波器,区分绘画的低质量数字化表示及其伪造,并突出差异发生的位置以及复制品特别忠实于原件的位置;文献5“wang z,lu d,zhang d,etal.fake modern chinese painting identification based on spectral–spatialfeature fusion on hyperspectral image[j].multidimensional systems and signalprocessing,2016,27:1031-1044.”提出了一种基于高光谱图像的特征融合方法对使用现代高分辨率扫描和打印技术制作的进行识别。这些方法提升了书画作品的分析性能,但重在图像分析方法,在书画作品鉴定和精确分析方面研究不足,仅通过高光谱图像和传统特征对书画数字图像的整体内容进行鉴定,精确率不高。专利技术目的:本项目通过计算机视觉技术来完成书画文字作品识别任务,提出了一种基于时频域融合的视觉识别算法,以准确识别书画作品的作家。在空域下,特征提取网络往往获得的是图像的纹理特征,然而中国书画文字作品的识别,不仅仅是纹理上的特征,更多的是由其独有的偏旁部首、笔画、结构所组成的形状特征,因此本专利技术通过提取书画文字在频域下的特征,来获取书画文字的整体形状特征。最后,将空域下的纹理特征与频域下的形状特征相融合,以此来提高算法对于中国书画文字作品的识别准确率。


技术介绍


技术实现思路

0、
技术实现思路

1、本专利技术基于计算机视觉领域中的深度学习模型,在空域和频域提取中国书画文字图像的更深层次特征,设计的网络结构如附图1所示。空域下特征提取网络采用了只有6层的极简网络vanillanet-6作为backbone,网络结构中未使用残差快、通道注意力、自注意力机制以及多分支结构,而是只含卷积计算的极简直筒结构;频域下通过离散余弦变换(discrete cosine transform,dct),将变换后的特征的维度与原始特征维度拼接后;再通过集成学习(ensemble learning),将空域与频域提取的特征进行融合,以提高整体模型的稳定性。

2、步骤1:构建空域网络

3、1)合并卷积层

4、网络训练时通过使用带有激活函数的两个卷积层来增加模型的非线性表现能力,并在训练结束时将其合并为一个简单的卷积层,以降低推理时间。其中,激活函数可以表示为:

5、a′(x)=(1-λ)a(x)+λx  (1)

6、其中,a(x)代表卷积层的激活函数,使用超参数λ=epoch/epochs(epoch表示当前训练轮次,epochs表示总轮次),在训练开始的时候a′(x)=a(x),训练结束时a′(x)=x,以此将其合并为一个恒等变换的卷积层来提高推理速度。

7、2)并行堆叠激活函数

8、采用并行堆叠激活函数可提供更多的非线性表示和特征组合能力,以增强神经网络的性能和适应性。这种方法可增加网络的灵活性,并且适用于一些需要更多非线性操作的任务。并行堆叠激活函数可表示为:

9、

...

【技术保护点】

1.本专利技术提出了一种基于空频域融合的书画文字作品识别方法,要求的权利主要体现在三个部分:空域特征提取网络的设计、频域特征提取网络的设计和空频域集成学习。

【技术特征摘要】

1.本发明提出了一种基于空频域融合的书画文字作品识别方法,要求的权利主要体现...

【专利技术属性】
技术研发人员:夏召强黄鹤翔王煜寒蒋晓悦冯晓毅
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1