System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本区域的确定方法、装置、电子设备和存储介质制造方法及图纸_技高网

文本区域的确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:43211961 阅读:1 留言:0更新日期:2024-11-05 17:07
本发明专利技术公开了一种文本区域的确定方法、装置、电子设备和存储介质,涉及文本区域确定的技术领域。本发明专利技术的技术方案通过对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,获得了卷积神经网络模型识别文本区域的预测偏差;对图像样本上的文本进行语义识别,获得了图像样本上图像特征属于文本的后验概率;根据预测偏差和后验概率继续对卷积神经网络进行文本区域的识别训练;在卷积神经网络的继续训练结果达到预设目标时,将待预测文本区域的目标图像输入卷积神经网络模型;根据卷积神经网络模型的输出结果,确定目标图像的文本区域。该方案提高了文本区域确定的准确性。

【技术实现步骤摘要】

本专利技术涉及文本区域确定的,尤其涉及一种文本区域的确定方法、装置、电子设备和存储介质


技术介绍

1、在数字化和信息化时代,从图像中提取文本信息的需求日益增长。无论是在文档分析、内容检索、场景理解还是辅助视觉障碍人士,准确识别图像中的文本区域位置都是至关重要的。尽管现有的ocr(optical character recognition,光学字符识别)技术能够在一定程度上识别图像中的文字,但它们在文本定位方面往往不够精确,特别是在复杂背景或不同字体大小的情况下。因此,开发一种能够准确识别图像中文本区域位置的方法是非常必要的。


技术实现思路

1、本专利技术的一种文本区域的确定方法、装置、电子设备和存储介质,能够在图像中准确识别出文本区域所在位置,提高了文本区域确定的准确性。

2、本专利技术实施例提供了以下方案:

3、第一方面,本专利技术实施例提供了一种文本区域的确定方法,方法包括:

4、对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,以获得卷积神经网络模型识别文本区域的预测偏差;

5、对图像样本上的文本进行语义识别,以获得图像样本上图像特征属于文本的后验概率;

6、根据预测偏差和后验概率,继续对卷积神经网络进行文本区域的识别训练;

7、在卷积神经网络的继续训练结果达到预设目标时,将待预测文本区域的目标图像输入卷积神经网络模型;

8、根据卷积神经网络模型的输出结果,确定目标图像的文本区域。</p>

9、在一种可选的实施例中,对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,以获得卷积神经网络模型识别文本区域的预测偏差,包括:

10、将标注文本区域的图像样本输入卷积神经网络模型进行文本区域的识别训练,以获得文本区域的预测边界;

11、根据预测边界与文本区域的实际边界之间的偏差,获得边界面积偏差和边界位置偏差;

12、将边界面积偏差和边界位置偏差确定为预测偏差。

13、在一种可选的实施例中,将标注文本区域的图像样本输入卷积神经网络模型进行文本区域的识别训练,以获得文本区域的预测边界之后,方法还包括:

14、根据卷积神经网络模型基于不同组卷积核识别图像样本上文本区域的预测边界和实际边界,获得在每组卷积核下识别文本区域的预测误差;

15、将最小预测误差对应组卷积核的预测边界,确定为卷积神经网络模型识别文本区域的预测边界。

16、在一种可选的实施例中,根据卷积神经网络模型基于不同组卷积核识别图像样本上文本区域的预测边界和实际边界,获得在每组卷积核下识别文本区域的预测误差,包括:

17、根据公式:

18、

19、获得每组卷积核的预测误差kce,其中,分别为第一偏导数、第二偏导数、第三偏导数和第四偏导数,n为预测边界的锚框数量,xi为预测边界的横坐标,x为实际边界的横坐标,yi为预测边界的纵坐标,y为预测边界的纵坐标,wi为预测边界的高度,w为实际边界的高度,hi为预测边界的宽度,h为实际边界的宽度。

20、在一种可选的实施例中,对图像样本上的文本进行语义识别,以获得图像样本上图像特征属于文本的后验概率,包括:

21、对预设的条件随机场模型配置规范化因子,以使语义识别时被标记序列的概率总和为1;

22、根据图割能量函数对条件随机场模型进行语义识别训练,直至语义识别结果满足预设条件;

23、将图像样本输入语义识别结果满足预设条件的条件随机场模型,以获得图像样本上图像特征属于文本的后验概率。

24、在一种可选的实施例中,将待预测文本区域的目标图像输入卷积神经网络模型之前,方法还包括:

25、对目标图像进行降噪处理,以获得降噪处理后的目标图像;

26、根据多层次直方图对降噪处理后目标图像上的图像特征进行对比度增强处理,以获得完成预处理的目标图像。

27、在一种可选的实施例中,将待预测文本区域的目标图像输入卷积神经网络模型之前,方法还包括:

28、根据预设的检测响应模型,确定卷积神经网络模型在不同尺寸的检测模板的检测响应值;

29、根据待识别图像上的不同图像特征的检测需求,获得检测响应值和对应图像特征的映射关系;

30、根据所述映射关系对完成训练的卷积神经网络模型进行参数配置。

31、第二方面,本专利技术实施例还提供了一种文本区域的确定装置,装置包括:

32、训练获得模块,用于对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,以获得卷积神经网络模型识别文本区域的预测偏差;

33、识别获得模块,用于对图像样本上的文本进行语义识别,以获得图像样本上图像特征属于文本的后验概率;

34、识别训练模块,用于根据预测偏差和后验概率,继续对卷积神经网络进行文本区域的识别训练;

35、输入模块,用于在卷积神经网络的继续训练结果达到预设目标时,将待预测文本区域的目标图像输入卷积神经网络模型;

36、第一确定模块,用于根据卷积神经网络模型的输出结果,确定目标图像的文本区域。

37、第三方面,本专利技术实施例还提供了一种电子设备,包括处理器和存储器,存储器耦接到处理器,存储器存储指令,当指令由处理器执行时使电子设备执行第一方面中任一项方法的步骤。

38、第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一项方法的步骤。

39、本专利技术的一种文本区域的确定方法、装置、电子设备和存储介质与现有技术相比,具有以下优点:

40、本专利技术的技术方案通过对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,获得了卷积神经网络模型识别文本区域的预测偏差;对图像样本上的文本进行语义识别,获得了图像样本上图像特征属于文本的后验概率;为使卷积神经网络模型得到更准确的训练,根据预测偏差和后验概率继续对卷积神经网络进行文本区域的识别训练;在卷积神经网络的继续训练结果达到预设目标时,说明卷积神经网络模型能够准确识别出文本区域,将待预测文本区域的目标图像输入卷积神经网络模型;根据卷积神经网络模型的输出结果,确定目标图像的文本区域。该方案通过预测偏差和后验概率使卷积神经网络模型在继续训练时,能针对文本区域的文本特征不断收敛,能够更精准在图像中准确识别出文本区域的所在位置,进而提高了文本区域确定的准确性。

本文档来自技高网...

【技术保护点】

1.一种文本区域的确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文本区域的确定方法,其特征在于,所述对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,以获得所述卷积神经网络模型识别所述文本区域的预测偏差,包括:

3.根据权利要求2所述的文本区域的确定方法,其特征在于,所述将标注文本区域的图像样本输入卷积神经网络模型进行文本区域的识别训练,以获得所述文本区域的预测边界之后,所述方法还包括:

4.根据权利要求3所述的文本区域的确定方法,其特征在于,所述根据卷积神经网络模型基于不同组卷积核识别所述图像样本上文本区域的预测边界和所述实际边界,获得在每组卷积核下识别文本区域的预测误差,包括:

5.根据权利要求1所述的文本区域的确定方法,其特征在于,所述对所述图像样本上的文本进行语义识别,以获得所述图像样本上图像特征属于文本的后验概率,包括:

6.根据权利要求1所述的文本区域的确定方法,其特征在于,所述将待预测文本区域的目标图像输入所述卷积神经网络模型之前,所述方法还包括:

7.根据权利要求1所述的文本区域的确定方法,其特征在于,所述将待预测文本区域的目标图像输入所述卷积神经网络模型之前,所述方法还包括:

8.一种文本区域的确定装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时使所述电子设备执行权利要求1-7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种文本区域的确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文本区域的确定方法,其特征在于,所述对预设的卷积神经网络模型进行图像样本上文本区域的识别训练,以获得所述卷积神经网络模型识别所述文本区域的预测偏差,包括:

3.根据权利要求2所述的文本区域的确定方法,其特征在于,所述将标注文本区域的图像样本输入卷积神经网络模型进行文本区域的识别训练,以获得所述文本区域的预测边界之后,所述方法还包括:

4.根据权利要求3所述的文本区域的确定方法,其特征在于,所述根据卷积神经网络模型基于不同组卷积核识别所述图像样本上文本区域的预测边界和所述实际边界,获得在每组卷积核下识别文本区域的预测误差,包括:

5.根据权利要求1所述的文本区域的确定方法,其特征在于,所述对所述图像样本上的文本进行语义识...

【专利技术属性】
技术研发人员:李纲毛进魏泉
申请(专利权)人:武汉数据智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1