文本信息识别方法、提取方法、装置及系统制造方法及图纸

技术编号：27879854 阅读：22 留言：0更新日期：2021-03-31 01:12

本发明专利技术公开了一种文本信息识别方法、提取方法、装置及系统，属于文本信息处理领域。其中识别方法包括：对图片进行文本检测，获得候选框以及对应的原始置信度；根据第一候选框与第二候选框的交集区域以及闭包区域的尺寸计算第二候选框的损失参数；计算第一候选框与第二候选框的原始交并比，根据第二候选框的损失参数修正原始交并比获得修正交并比；根据修正交并比和第二候选框的原始置信度计算第二候选框的修正置信度；判断第二候选框的修正置信度是否满足置信度条件，若满足，则将第一候选框及第二候选框作为待识别文本框；识别待识别文本框中的文本信息。本发明专利技术公开的方法适用于文本行间距较小图片中的文本信息的提取，有效地防止文本行漏检。

全部详细技术资料下载

【技术实现步骤摘要】
文本信息识别方法、提取方法、装置及系统
本专利技术涉及文本信息处理
，特别涉及一种文本信息识别方法、提取方法、装置及系统。
技术介绍
商品营销图片主要是指电商运营平台页面上呈现出来的用于宣传推广商品的图片。为了吸引消费者提高售卖率，商家们想尽可能地在商品营销图片中呈现更多的商品信息及营销活动信息，因此商品营销图片中的文本行之间的间距往往不固定，这给本领域技术人员在识别商品营销图片中文本信息的过程增加了难度，且由于商品营销活动信息变动频繁，人工识别的方式跟不上文本信息的变化，因此亟需专利技术一种可以适用于复杂图片的自动文本信息识别技术。
技术实现思路
为了解决现有技术的问题，本专利技术实施例提供了文本信息识别方法、提取方法、装置及系统。所述技术方案如下：第一方面，提供了一种文本信息识别方法，所述方法包括：对图片进行文本检测，获得标识所述图片中文本行位置的候选框，以及各所述候选框对应的原始置信度；在存在交集区域的所述候选框中选取所述原始置信度最大的所述候选框作为第一候选框，其他任一所述候选框作为第二候选框，根据所述第一候选框与所述第二候选框的交集区域的尺寸以及闭包区域的尺寸，计算所述第二候选框的损失参数；计算所述第一候选框与所述第二候选框的原始交并比，根据所述第二候选框的损失参数修正所述原始交并比，获得修正交并比；根据所述修正交并比和第二候选框的原始置信度计算所述第二候选框的修正置信度；判断所述第二候选框的修正置信度是否满足置信度条件，若满足，则将...

【技术保护点】
1.一种文本信息识别方法，其特征在于，包括：/n对图片进行文本检测，获得标识所述图片中文本行位置的候选框，以及各所述候选框对应的原始置信度；/n在存在交集区域的所述候选框中选取所述原始置信度最大的所述候选框作为第一候选框，其他任一所述候选框作为第二候选框，根据所述第一候选框与所述第二候选框的所述交集区域的尺寸以及闭包区域的尺寸，计算所述第二候选框的损失参数；/n计算所述第一候选框与所述第二候选框的原始交并比，根据所述第二候选框的损失参数修正所述原始交并比，获得修正交并比；/n根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度；/n判断所述第二候选框的修正置信度是否满足置信度条件，若满足，则将所述第一候选框及所述第二候选框作为待识别文本框；/n识别所述待识别文本框中的文本信息。/n

【技术特征摘要】
1.一种文本信息识别方法，其特征在于，包括：
对图片进行文本检测，获得标识所述图片中文本行位置的候选框，以及各所述候选框对应的原始置信度；
在存在交集区域的所述候选框中选取所述原始置信度最大的所述候选框作为第一候选框，其他任一所述候选框作为第二候选框，根据所述第一候选框与所述第二候选框的所述交集区域的尺寸以及闭包区域的尺寸，计算所述第二候选框的损失参数；
计算所述第一候选框与所述第二候选框的原始交并比，根据所述第二候选框的损失参数修正所述原始交并比，获得修正交并比；
根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度；
判断所述第二候选框的修正置信度是否满足置信度条件，若满足，则将所述第一候选框及所述第二候选框作为待识别文本框；
识别所述待识别文本框中的文本信息。

2.如权利要求1所述的方法，其特征在于，所述根据所述第一候选框与所述第二候选框的所述交集区域的尺寸以及闭包区域的尺寸，计算所述第二候选框的损失参数，包括：
获取所述交集区域的宽度和高度，以及所述闭包区域的宽度和高度；
根据所述交集区域与所述闭包区域的高度比，以及所述交集区域与所述闭包区域的宽度比，计算所述第二候选框的损失参数。

3.如权利要求1所述的方法，其特征在于，所述根据所述修正交并比和所述第二候选框的原始置信度计算所述第二候选框的修正置信度，包括：
根据所述修正交并比计算所述第二候选框的衰减权值；
利用所述第二候选框的衰减权值修正所述第二候选框的原始置信度，获得所述第二候选框的修正置信度。

4.如权利要求1~3任一项所述的方法，其特征在于，所述识别所述待识别文本框中的文本信息，包括：
采用神经网络模型识别所述待识别文本框中的文本信息，所述神经网络模型包括：卷积层和池化层；
其中，所述卷积层包括交替连接的标准卷积核和扩张卷积核，所述扩张卷积核的感受野的宽度相对所述标准卷积核的感受野的宽度大；
所述池化层的分块窗口为矩形，且采用标准最大池化和平均池化加权混合池化，池化权重系数根据分块图片的全局最大值和平均值计算确定。

5.一种文本信息提取方法，其特征在于，包括：
利用权利要求1~4中任一项所述方法识别商品图片中的文本信息；
将所述文本信息与预建立的延保同义词词典进行匹配，所述延保同义词词典中包含延保关键词及其同义词；
匹配成功后，将所述文本信息中包含的所述延保关键词进行同义词替换；
提取经过同义词替换的所述文本信息。

【专利技术属性】
技术研发人员：潘蕾，
申请(专利权)人：苏宁金融科技南京有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人