用于对抗阴影区干涉行为的文档图像二值化系统及方法技术方案

技术编号:34765993 阅读:12 留言:0更新日期:2022-08-31 19:16
本发明专利技术公开了一种用于对抗阴影区干涉行为的文档图像二值化系统及方法,系统包括视觉搜索单元、特征分解单元和脉冲振荡单元,三个区域的输入均为灰度图像且都独立进行工作,然而整体功能的实现需要通过信息的互联。视觉搜索单元通过预搜索和精细搜索输出灰度图像分解级数N并将其传递到特征分解单元用于确定双极细胞层数M。特征分解单元由M=N

【技术实现步骤摘要】
用于对抗阴影区干涉行为的文档图像二值化系统及方法


[0001]本专利技术属于神经建模、数字图像处理
,涉及一种文档图像二值化系统及方法,特别涉及一种用于对抗阴影区域干涉行为的文档图像二值化系统及方法。

技术介绍

[0002]历史古籍是珍贵的文化遗产,具有重要的科学和文化价值。古籍文档数字化是解决文献保护和文化传承的重要途径。古籍文档图像分析与识别是一项极具挑战性的任务。传统的文档图像的分割方法大致可分为全局阈值法、局部阈值法和混合法,后来研究人员又提出了基于边缘、能量、统计学习、深度学习等文档分割算法。然而,目前不存在一种通用的分割算法,且合适的分割算法越来越依赖于先验知识的应用。
[0003]自Hodgkin

Huxley模型被提出以来,越来越多的神经振荡模型被提出,极大地推动了计算神经科学的发展。广泛的神经生理学实验证据表明,视觉场景中对单个物体的感知问题涉及大量神经元以高度分散的方式反应过程,这些神经元分布在一个极大的空间区域内。如何将这些高度分散的活动集成在一起以构成单个对象的表示是计算神经科学领域的探讨热点之一。神经激发相关振荡现象在计算神经科学领域下也是非常值得研究的,其在包括高认知在内的神经信息处理中发挥着重要作用。后来神经元振荡器被推广至场景分割领域并取得了巨大的成功,近几年利用第三代人工神经网络建立的视觉运动感知的动力学模型就是对生物视觉系统功能与结构的直接模拟。图像处理领域以Eckhorn所提出的神经振荡模型最为见长,然而原始模型在分割阴影区域时具有极大的局限性,使阴影部分所包含信息大部分丢失。

技术实现思路

[0004]依据神经网络与古籍文档图像像素特征之间的作用机制,本专利技术提出了一种用于分割古籍文档图像的脉冲振荡系统及方法,尤其能够对抗神经集群因光照不均匀所产生的自动波干涉行为,提高分割精度。
[0005]本专利技术的系统所采用的技术方案是:一种用于对抗阴影区干涉行为的文档图像二值化系统,包括视觉搜索单元、特征分解单元和脉冲振荡单元;三个单元的输入均为灰度图像且都独立进行工作,然而整体功能的实现需要通过信息的互联。视觉搜索单元通过预搜索层和精细搜索层输出灰度图像分解级数N并将其传递到特征分解单元用于确定双极细胞层数M;特征分解单元由M=N

1层双极细胞层与分解层构成,用于获得图像分解子集并将最高级别分解子集传递至水平细胞以控制抑制性突触作用范围;脉冲振荡单元包括脉冲发放层、判定层和同步遏止层,能够直接实现图像的二值化编码,需要通过判定来决定是否激活同步遏制层来针对性地优化神经计算机制,脉冲振荡单元的输出为最终的二值图像。
[0006]本专利技术的方法所采用的技术方案是:一种用于对抗阴影区干涉行为的文档图像二值化方法,包括以下步骤:
[0007]步骤1:将灰度图像输入到视觉搜索单元执行搜索任务,获得输入图像可能的分解
层数,用于确定轮廓提取时双极细胞的层数,双极细胞层数=分解层数

1;
[0008]步骤2:将灰度图像输入到特征分解单元获得灰度图像分解子集,并将最高级别子集传递至水平细胞用以确定过同步区域;
[0009]步骤3:将灰度图像输入到脉冲振荡单元进行二值化编码,最终输出分割图像;
[0010]对于N
×
M大小的图像,采用N
×
M大小横向耦合的整合

放火神经元集群网络对图像进行等效,神经元与图像的像素一一对应;
[0011]所述脉冲振荡单元包括脉冲发放层、判定层、同步遏止层;
[0012]所述脉冲发放层,用于实现像素到峰值的精确编码,每个神经振子均采用简化式的Eckhorn模型进行描述,具体实现过程是:
[0013][0014][0015][0016]其中,网络神经元用(i,j)表示,其临近神经元用(k,l)表示;E
ij
为动态阈值状态;S
ij
为输入矩阵;F
ij
为神经元状态;Y
ij
为神经元输出电位;W
ijkl
为连接矩阵;n为迭代次数;V
L
与V
E
分别为连接输入和动态阈值的振幅;α
e
、α
f
分别为动态阈值和馈电输入的衰减系数;β为突触间的连接强度;
[0017]所述判定层,用于判断是否存在同步区域的过度覆盖以及是否激活同步遏止层;
[0018]所述同步遏止层,包括水平细胞层和抑制性突触层;
[0019]所述水平细胞层,用于确定过同步区域;具体实现过程是:I
y
=I
s

I
N
;其中,I
y
为存在过度同步的神经元区域,I
s
为脉冲发放层输出为高电平的神经元区域,I
N
为图像最高级别分解子集;
[0020]所述抑制性突触层,用于将I
y
进行去同步处理;突触功能通过全局抑制剂实现,具体实现过程是:其中,下标(i,j)、(k,l)均表示神经元位置;n为迭代次数;F

ij
为突触后膜的神经元状态;F
ij
为突触前膜神经元状态;Y
kl
为(i,j)附近却属于其他分解集的神经元输出电位;K
ijkl
为连接矩阵;f为抑制系数;若F

ij
[n+1]≤E
ij
[n],同步抑制成功,神经元振荡完成,输出二值图像;若F

ij
[n+1]>E
ij
[n],增大抑制系数f,直到F

ij
[n+1]≤E
ij
[n]。
[0021]本文提与现有技术相比,其显著优点在于:
[0022]①
引入统计模型,充分考虑了像素统计特征在分类中的作用。
[0023]②
设计多层双极细胞,可以对粗细场景中的细节进行分离,有利于提高分解精度,进而控制分割效果。
[0024]③
采用简化式Echhorn模型,极大减少了计算量,有利于提高二值脉冲图像的输出效率。
[0025]④
设计抑制性突触,有利于削弱传统网络中神经集群自动波扩散所带来的干涉行为,避免神经元之间因通信“过火”所导致的分割干扰。
附图说明
[0026]图1为本专利技术实施例的系统原理图。
具体实施方式
[0027]为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0028]请见图1,本专利技术提供的一种用于对抗阴影区干涉行为的文档图像二值化系统,包括视觉搜索单元、特征分解单元和脉冲振荡单元;三个单元的输入均为灰度图像且都独立进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对抗阴影区干涉行为的文档图像二值化系统,其特征在于,包括视觉搜索单元、特征分解单元和脉冲振荡单元;三个单元的输入均为灰度图像且都独立进行工作,视觉搜索单元通过预搜索层和精细搜索层输出灰度图像分解级数N并将其传递到特征分解单元用于确定双极细胞层数M;特征分解单元由M=N

1层双极细胞层与分解层构成,用于获得图像分解子集并将最高级别分解子集传递至水平细胞以控制抑制性突触作用范围;脉冲振荡单元包括脉冲发放层、判定层和同步遏止层,能够直接实现图像的二值化编码,通过判定来决定是否激活同步遏制层来针对性地优化神经计算机制,脉冲振荡单元的输出为最终的二值图像。2.一种用于对抗阴影区干涉行为的文档图像二值化方法,其特征在于,包括以下步骤:步骤1:将灰度图像输入到视觉搜索单元执行搜索任务,获得输入图像可能的分解层数,用于确定轮廓提取时双极细胞的层数,双极细胞层数=分解层数

1;步骤2:将灰度图像输入到特征分解单元获得灰度图像分解子集,并将最高级别子集传递至水平细胞用以确定过同步区域;步骤3:将灰度图像输入到脉冲振荡单元进行二值化编码,最终输出分割图像;对于N
×
M大小的图像,采用N
×
M大小横向耦合的整合

放火神经元集群对图像进行等效,神经元与图像的像素一一对应;所述脉冲振荡单元包括脉冲发放层、判定层、同步遏止层;所述脉冲发放层,用于实现像素到峰值的精确编码,每个神经振子均采用简化式的Eckhorn模型进行描述,具体实现过程是:Eckhorn模型进行描述,具体实现过程是:Eckhorn模型进行描述,具体实现过程是:其中,网络神经元用(i,j)表示,其临近神经元用(k,l)表示;E
ij
为动态阈值状态;S
ij
为输入矩阵;F
ij
为神经元状态;Y
...

【专利技术属性】
技术研发人员:熊炜魏丽颖
申请(专利权)人:湖北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1