模型识别结果定位方法和装置、电子设备、计算机介质制造方法及图纸

技术编号:36648371 阅读:17 留言:0更新日期:2023-02-18 13:09
本公开提供了一种模型识别结果定位方法和装置,涉及图像识别、深度学习等技术领域。该方法的一具体实施方式包括:采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列;基于编码序列中各个编码的内容,检测是否需要更新编码的位置;响应于检测结果为需要更新编码的位置,基于编码在编码序列中的位置和序列识别模型,计算并存储编码的更新位置,更新位置为各个文本在文本行素材中的位置。该实施方式实现了对模型识别结果的定位。现了对模型识别结果的定位。现了对模型识别结果的定位。

【技术实现步骤摘要】
模型识别结果定位方法和装置、电子设备、计算机介质


[0001]本公开涉及计算机
,具体涉及图像识别、深度学习等
,尤其涉及模型识别结果定位方法和装置、电子设备、计算机可读介质以及计算机程序产品。

技术介绍

[0002]在CTC解码算法中,应用较多的解码算法是贪心搜索解码方法,贪心搜索解码方法可以对文字序列识别网络输出的文本序列的每一步选择概率最大的输出值,得到最终解码输出的文字序列。然而,由于文字序列识别网络无法对素材中各个文字实际的位置进行标注,无法得知贪心搜索解码方法是从素材的哪部分识别出的文本序列的各个文字。

技术实现思路

[0003]本公开的实施例提出了模型识别结果定位方法和装置、电子设备、计算机可读介质以及计算机程序产品。
[0004]第一方面,本公开的实施例提供了一种模型识别结果定位方法,该方法包括:采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列;基于编码序列中各个编码的内容,检测是否需要更新编码的位置;响应于检测结果为需要更新编码的位置,基于编码在编码序列中的位置和序列识别模型,计算并存储编码的更新位置,更新位置为各个文本在文本行素材中的位置。
[0005]在一些实施例中,基于编码序列中各个编码的内容,检测是否需要更新编码的位置,包括以下步骤:S1:检测编码序列中的当前编码的内容与当前编码相邻的上一个编码的内容是否相同;S2:响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容不相同,确定需要更新当前编码的位置。
[0006]在一些实施例中,上述基于编码序列中各个编码的内容,检测是否需要更新编码的位置还包括:响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容相同,将与当前编码相邻的下一个编码作为当前编码,继续执行步骤S1。
[0007]在一些实施例中,上述基于编码序列中各个编码的内容,检测是否需要更新编码的位置,还包括:检测编码序列中的当前编码的内容是否为预设的终止符号;响应于检测到当前编码的内容不是预设的终止符号时,将与当前编码相邻的下一个编码作为当前编码,继续执行步骤S1。
[0008]在一些实施例中,上述基于编码序列中各个编码的内容,检测是否需要更新编码的位置,还包括:检测编码序列中的当前编码的内容是否为预设的隔离标签;响应于检测结果为当前编码的内容是预设的隔离标签,将当前编码相邻的下一编码作为当前编码,继续执行步骤S1。
[0009]在一些实施例中,上述方法还包括:采用贪心搜索算法对编码序列进行预测,得到编码序列对应的文本序列;将文本序列中各个文本与各个更新位置一一对应设置。
[0010]在一些实施例中,上述基于编码在编码序列中的位置和序列识别模型,计算编码
的更新位置,包括:将编码在编码序列中的位置输入位置更新公式,得到当前编码的更新位置;位置更新公式为:L=(i+0.5)*t/s;其中,L表示更新位置,t表示序列识别模型对图像宽度的压缩比例值,i表示当前编码在编码序列中的位置,s表示超参数。
[0011]在一些实施例中,上述序列识别模型包括:图像特征提取网络和文本序列提取网络;文本行素材包括:至少一个具有相同高度的文本行图像;上述采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列包括:将至少一个具有相同高度的文本行图像输入图像特征提取网络,得到各个文本行图像的图像特征向量序列;将各个图像特征向量序列输入文本序列提取网络,得到与文本行图像的文本行对应的编码序列。
[0012]第二方面,本公开的实施例提供了一种模型识别结果定位装置,该装置包括:识别单元,被配置成采用序列识别模型对文本行素材进行识别,得到序列识别模型输出的与文本行素材的文本行对应的编码序列;检测单元,被配置成基于编码序列中各个编码的内容,检测是否需要更新编码的位置;计算单元,被配置成响应于检测结果为需要更新编码的位置,基于编码在编码序列中的位置和序列识别模型,计算并存储编码的更新位置,更新位置为各个文本在文本行素材中的位置。
[0013]在一些实施例中,上述检测单元包括:相邻检测模块,被配置成检测编码序列中的当前编码的内容与当前编码相邻的上一个编码的内容是否相同;确定模块,被配置成响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容不相同,确定需要更新当前编码的位置。
[0014]在一些实施例中,上述检测单元还包括:相同检测模块,被配置成响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容相同,将与当前编码相邻的下一个编码作为当前编码,相邻检测模块继续工作。
[0015]在一些实施例中,上述检测单元还包括:终止检测模块,被配置成检测编码序列中的当前编码的内容是否为预设的终止符号;终止游标模块,被配置成响应于检测到当前编码的内容不是预设的终止符号时,将与当前编码相邻的下一个编码作为当前编码,相邻检测模块继续工作。
[0016]在一些实施例中,上述检测单元还包括:隔离检测模块,被配置成检测编码序列中的当前编码的内容是否为预设的隔离标签;隔离游标模块,被配置成响应于检测结果为当前编码的内容是预设的隔离标签,将当前编码相邻的下一编码作为当前编码,相邻检测模块继续工作。
[0017]在一些实施例中,上述装置还包括:得到单元,被配置成采用贪心搜索算法对编码序列进行预测,得到编码序列对应的文本序列;设置单元,被配置成将文本序列中各个文本与各个更新位置的一一对应设置。
[0018]在一些实施例中,上述计算单元,进一步被配置成将编码在编码序列中的位置输入位置更新公式,得到编码的更新位置;位置更新公式为:L=(i+0.5)*t/s;其中,L表示更新位置,t表示序列识别模型对图像宽度的压缩比例值,i表示当前编码在编码序列中的位置,s表示超参数。
[0019]在一些实施例中,上述序列识别模型包括:图像特征提取网络和文本序列提取网络;文本行素材包括:至少一个具有相同高度的文本行图像;上述识别单元包括:特征输入
单元,被配置成将至少一个具有相同高度的文本行图像输入图像特征提取网络,得到各个文本行图像的图像特征向量序列;编码输入单元,被配置成将各个图像特征向量序列输入文本序列提取网络,得到与文本行图像的文本行对应的编码序列。
[0020]第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0021]第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
[0022]第五方面,本公开的实施例提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面任一实现方式描述的方法。
[0023]本公开的实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型识别结果定位方法,所述方法包括:采用序列识别模型对文本行素材进行识别,得到所述序列识别模型输出的与所述文本行素材的文本行对应的编码序列;基于所述编码序列中各个编码的内容,检测是否需要更新所述编码的位置;响应于检测结果为需要更新所述编码的位置,基于所述编码在所述编码序列中的位置和所述序列识别模型,计算并存储所述编码的更新位置,所述更新位置为各个文本在所述文本行素材中的位置。2.根据权利要求1所述的方法,其中,所述基于所述编码序列中各个编码的内容,检测是否需要更新所述编码的位置,包括以下步骤:S1:检测所述编码序列中的当前编码的内容与当前编码相邻的上一个编码的内容是否相同;S2:响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容不相同,确定需要更新当前编码的位置。3.根据权利要求2所述的方法,其中,所述基于所述编码序列中各个编码的内容,检测是否需要更新所述编码的位置还包括:响应于检测结果为当前编码的内容与当前编码相邻的上一个编码的内容相同,将与当前编码相邻的下一个编码作为当前编码,继续执行步骤S1。4.根据权利要求2所述的方法,其中,所述基于所述编码序列中各个编码的内容,检测是否需要更新所述编码的位置,还包括:检测所述编码序列中的当前编码的内容是否为预设的终止符号;响应于检测到当前编码的内容不是预设的终止符号时,将与当前编码相邻的下一个编码作为当前编码,继续执行步骤S1。5.根据权利要求2所述的方法,其中,所述基于所述编码序列中各个编码的内容,检测是否需要更新所述编码的位置还包括:检测所述编码序列中的当前编码的内容是否为预设的隔离标签;响应于检测结果为当前编码的内容是预设的隔离标签,将当前编码相邻的下一编码作为当前编码,继续执行步骤S1。6.根据权利要求1

5之一所述的方法,所述方法还包括:采用贪心搜索算法对所述编码序列进行预测,得到所述编码序列对应的文本序列;将所述文本序列中各个文本与各个更新位置一一对应设置。7.根据权利要求1所述的方法,其中,所述基于所述...

【专利技术属性】
技术研发人员:唐铭蔚周柏村王臣良赵紫晗田洪宝付靖玲裴积全
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1