一种基于空频域融合的书画文字作品识别方法技术

技术编号：39992832 阅读：24 留言：0更新日期：2024-01-09 02:27

面向书画文字作品识别任务，本发明专利技术提出了一种基于时频域融合的智能识别算法，以准确识别书画作品的作家。在该算法中，空域下特征提取网络采用只有6层的极简网络VanillaNet‑6作为Backbone，网络结构中未使用残差块、通道注意力、自注意力机制以及多分支结构，而是只含卷积计算的极简直筒结构；频域下通过离散余弦变换(Discrete Cosine Transform，DCT)，将变换后的特征的维度与原始特征维度拼接后，再通过集成学习(Ensemble Learning)将空域与频域的识别结果进行融合，以此来提高算法对于中国书画文字作品的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】

：本专利技术涉及书画文字图像的识别算法。现有技术：书画作品鉴定被公认为是文物鉴定学最复杂一门学科，不仅需要专业技术、学识修养同时需要感觉和智慧，更需要大量相关经验的积累。书画作品鉴定的主要依据是书画作品本身，即书画文字的时代风格、书画家的个人风格以及作品的质地等。传统书画作品鉴定面临诸多问题，主要依赖于鉴定者自身的专业技术修养与长期相关经验的积累，然而每个鉴定专家都会受到自身知识领域与见识的制约。这种鉴定方式主要是针对一些名人名作，鉴定者或根据同一作者的风格并结合历史时期、材质用料对作品做出推断，或将待检测作品与已经确定为真迹的作品进行对比，并最终做出结论。这种方式的缺点是过于依赖经验，对鉴定者的素质要求很高，即要求鉴定者见过的作品必须要多，有实物可以对比，才能得出可信的结论。对于传统鉴定方式例如采用物理化学以及采用各种高频光谱方法辅助进行鉴定，但是此类方法会带来许多问题。首先，物理和化学方法很显然会对珍贵文物造成不可避免的损伤，即使是高频光谱照射的方法也可能会造成书画作品颜料失色等问题。其次，该种方式的配套设备都比较专业昂贵，缺乏普及性，与传统鉴定方式一样，鉴别的渠道途径很窄。而计算机视觉技术是使用计算机及相关成像设备对生物视觉的一种模拟，模仿人类获取、处理、分析、理解图像的过程。通过模仿专家的鉴定方式，可利用计算机视觉技术对书画作品进行鉴别。由于近现代书画作品种类繁多、数量巨大，作伪手段精妙且千差万别，这些因素都为基于计算机视觉的书画鉴别技术研究增添了诸多障碍和困难。因此，利用计算机视觉技术进行书画作品的非接触式鉴定逐渐变得越来越重要，如何利用现有

技术介绍

技术实现思路

0、
技术实现思路
：

1、本专利技术基于计算机视觉领域中的深度学习模型，在空域和频域提取中国书画文字图像的更深层次特征，设计的网络结构如附图1所示。空域下特征提取网络采用了只有6层的极简网络vanillanet-6作为backbone，网络结构中未使用残差快、通道注意力、自注意力机制以及多分支结构，而是只含卷积计算的极简直筒结构；频域下通过离散余弦变换(discrete cosine transform，dct)，将变换后的特征的维度与原始特征维度拼接后；再通过集成学习(ensemble learning)，将空域与频域提取的特征进行融合，以提高整体模型的稳定性。

2、步骤1：构建空域网络

3、1)合并卷积层

4、网络训练时通过使用带有激活函数的两个卷积层来增加模型的非线性表现能力，并在训练结束时将其合并为一个简单的卷积层，以降低推理时间。其中，激活函数可以表示为：

5、a′(x)＝(1-λ)a(x)+λx (1)

6、其中，a(x)代表卷积层的激活函数，使用超参数λ＝epoch/epochs(epoch表示当前训练轮次，epochs表示总轮次)，在训练开始的时候a′(x)＝a(x)，训练结束时a′(x)＝x，以此将其合并为一个恒等变换的卷积层来提高推理速度。

7、2)并行堆叠激活函数

8、采用并行堆叠激活函数可提供更多的非线性表示和特征组合能力，以增强神经网络的性能和适应性。这种方法可增加网络的灵活性，并且适用于一些需要更多非线性操作的任务。并行堆叠激活函数可表示为：

9、

...

【技术保护点】

1.本专利技术提出了一种基于空频域融合的书画文字作品识别方法，要求的权利主要体现在三个部分：空域特征提取网络的设计、频域特征提取网络的设计和空频域集成学习。

【技术特征摘要】

1.本发明提出了一种基于空频域融合的书画文字作品识别方法，要求的权利主要体现...

【专利技术属性】
技术研发人员：夏召强，黄鹤翔，王煜寒，蒋晓悦，冯晓毅，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人