文字检测系统、检测方法及训练方法技术方案

技术编号:33924631 阅读:18 留言:0更新日期:2022-06-25 21:32
本发明专利技术公开一种文字检测系统、检测方法及训练方法,文字检测系统包括第一网络、第二网络以及分类单元、回归单元,其中:第一网络用以提取第一源图片S1、第一源图片S1以及目标图片T的特征;第二网络单元用以接收第一网络输出的特征提取分析,用以提高文字检测的敏感度;分类单元用以对文字检测结果进行分类;回归单元用以对文字检测结果进行回归分析。本发明专利技术能够学习不同情况的环境下样本的特征的不变同时提升单类样本的独特性,使得模型既能够学习到较强的领域泛化能力,又能提升样本的区分度,保持较高的检测敏感度。保持较高的检测敏感度。保持较高的检测敏感度。

【技术实现步骤摘要】
文字检测系统、检测方法及训练方法


[0001]本专利技术涉及人工智能
,尤其涉及文字检测系统、检测方法及训练方法。

技术介绍

[0002]文字检测任务是找出图像或视频中人们感兴趣的物体,并同时检测出它们的位置和大小。文字检测技术发展至今已经有几十年的时间,从技术的发展脉络看,可以划分为传统文字检测算法时期(2014年之前)以及之后的基于机器学习的文字检测算法。
[0003]传统文字检测算法主要基于手工提取特征,手工的缺陷主要在于计算量大,识别效果比较差,而且人工成本也非常高。随着机器学习的各种新算法成熟,文字检测技术得到了质的飞跃,基于CNN以及YOLO的各种文字检测算法不断创新出来,大大提高了文字检测的识别能力和准确率。
[0004]基于机器学习的文字检测计算需要大量的标注数据,往往在真实工业场景,图片分别非常复杂,人工标注很难覆盖各个情况,如图片不同的光照,扭曲,模糊等情况都很难用标注到位。导致文字检测鲁棒性比较差,在不同的领域泛化能力弱,最终准确率不高。

技术实现思路

[0005]本专利技术为解决现有技术中存在的技术问题,提供一种文字检测系统,包括第一网络、第二网络以及分类单元、回归单元,其中:
[0006]第一网络用以提取第一源图片S1、第二源图片S2以及目标图片T的特征;
[0007]第二网络单元用以接收第一网络输出的特征提取分析,用以提高文字检测的敏感度;
[0008]分类单元用以对文字检测结果进行分类;
[0009]回归单元用以对文字检测结果进行回归分析。
[0010]进一步地,第二网络包括NS1网络、NS2网络以及学习网络,其中:
[0011]NS1网络用以对第一源图片S1以及目标图片T的特征进行分析,得到高阶特征;
[0012]NS2网络用以对第二源图片S2以及目标图片T的特征进行分析,得到低阶特征;
[0013]学习网络用以对NS1网络和NS2网络学习,并更新NS1网络和NS2网络。
[0014]进一步地,分类单元由全连接层模块以及sofmax层组成。
[0015]进一步地,回归单元为二个全连接层模块组成。
[0016]进一步地,所述第一网络为efficientnetV2。
[0017]本专利技术还提供一种文字检测方法,应用于文字检测系统中,包括步骤:
[0018]获取图片信息;
[0019]对图片信息进行处理,并给出检测结果,
[0020]所述文字检测系统为所述的文字检测系统。
[0021]本专利技术还提供一种文字检测系统的训练方法,应用于文字检测系统中,包括步骤:
[0022]输入第一源图片S1、第二源图片S2以及目标图片T;
[0023]从第一网络中抽取特征,并用GRL方法对图片对齐,以least

squares进行训练;
[0024]第一源图片S1域和目标图片T通过第一网络再输入给第二网络的NS1网络,用以实现高阶源

目标域的对齐以及源域的检测训练;
[0025]保持上述训练阶段学习到的目标,对第二网络的学习网络进行训练,并更新NS1网络、NS2网络。
[0026]本专利技术还提供一种计算机可读存储介质,所述存储介质中存储有指令或者程序,所述指令或者程序由处理器加载并执行如所述的文字检测方法。
[0027]本专利技术还提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如所述的文字检测方法。
[0028]本专利技术公开的方法和系统中所述模块,在实际应用中,即可以在一台目标服务器上部署多个模块,也可以每一模块独立部署在不同的目标服务器上,特别的,根据需要,为了提供更强大的计算处理能力,也可以根据需要将模块部署到集群目标服务器上。
[0029]由此可见,提出一种统一的领域自适应文字检测系统,能够学习不同情况的环境下样本的特征的不变同时提升单类样本的独特性,使得模型既能够学习到较强的领域泛化能力,又能提升样本的区分度,保持较高的检测敏感度。
[0030]为了对本专利技术有更清楚全面的了解,下面结合附图,对本专利技术的具体实施方式进行详细描述。
附图说明
[0031]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1为本申请实施例的文字检测系统结构示意图。
具体实施方式
[0033]本申请针对现有技术的技术缺陷,提出一种新型的文字检测系统,包括第一网络、第二网络以及分类单元、回归单元,其中:
[0034]第一网络用以提取第一源图片S1、第二源图片S2以及目标图片T的特征;
[0035]第二网络单元用以接收第一网络输出的特征提取分析,用以提高文字检测的敏感度;
[0036]分类单元用以对文字检测结果进行分类;
[0037]回归单元用以对文字检测结果进行回归分析。
[0038]请参阅图1,下面结合各种优选的实施方式进一步说明本申请的技术方案。
[0039]作为一种优选的实施方式,第二网络包括NS1网络、NS2网络以及学习网络,其中:
[0040]NS1网络用以对第一源图片S1以及目标图片T的特征进行分析,得到高阶特征;
[0041]NS2网络用以对第二源图片S2以及目标图片T的特征进行分析,得到低阶特征;
[0042]学习网络用以对NS1网络和NS2网络学习,并更新NS1网络和NS2网络。
[0043]本实施例中,NS1网络的结构和NS2网络的结构相同,便于进行训练,只是二者使用的源图片有差异。本申请中,第一源图片S1和第二源图片S2可以设置为图片中的目标内容,但背景进行了差异化的的颜色修改,比如第一院图片S1为白天照片,相对应的,第二源图片S2为黑夜照片,用以进行训练。比如在本实施例中,对于第二源图片S2可以基于第一源图片S1进行背景颜色加深,作为第二源图片S2来进行训练。
[0044]作为一种优选的实施方式,NS1网络的结构为:CNN卷积层输出至区域提取模块,通过区域提取模块得到的特征与CNN卷积层的输出特征进行对齐,得到对齐特征。对齐的特征再连接若干个全连接层之后,输出给分类单元以及回归单元。
[0045]作为一种优选的实施方式,学习网路的结构也可以采用类似上述NS1网络的结构。
[0046]分类单元由全连接层模块以及sofmax层组成。
[0047]回归单元为二个全连接层模块组成。
[0048]所述第一网络为efficientnetV2,本申请选择EfficientNetV2网络和以往的网络结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字检测系统,其特征是,包括第一网络、第二网络以及分类单元、回归单元,其中:第一网络用以提取第一源图片S1、第二源图片S2以及目标图片T的特征;第二网络单元用以接收第一网络输出的特征提取分析,用以提高文字检测的敏感度;分类单元用以对文字检测结果进行分类;回归单元用以对文字检测结果进行回归分析。2.如权利要求1所述的文字检测系统,其特征是,第二网络包括NS1网络、NS2网络以及学习网络,其中:NS1网络用以对第一源图片S1以及目标图片T的特征进行分析,得到高阶特征;NS2网络用以对第二源图片S2以及目标图片T的特征进行分析,得到低阶特征;学习网络用以对NS1网络和NS2网络学习,并更新NS1网络和NS2网络。3.如权利要求1所述的文字检测系统,其特征是,分类单元由全连接层模块以及sofmax层组成。4.如权利要求1所述的文字检测系统,其特征是,回归单元为二个全连接层模块组成。5.如权利要求1所述的文字检测系统,其特征是,所述第一网络为efficientnetV2。6.一种文字检测方法,应用于文字检测系统中,包括步骤:获取图片信息;对图片信息进行处理,并...

【专利技术属性】
技术研发人员:曾祥云朱姬渊
申请(专利权)人:上海易康源医疗健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1