一种目标文本提取方法及系统技术方案

技术编号：29675852 阅读：22 留言：0更新日期：2021-08-13 21:58

本发明专利技术提供一种目标文本提取方法及系统，目标文本提取方法包括：获取原始图像集；将原始图像集输入识别网络进行训练，获取识别模型，训练过程包括：区域划分、图像区域语义标签提取和文本区域语义标签提取；获取待识别图像；将待识别图像输入识别模型进行识别，获取图像区域语义标签和文本区域语义标签；根据图像区域语义标签和文本区域语义标签，进行目标文本提取；本发明专利技术中的目标文本提取方法及系统，通过获取图像区域语义标签和文本区域语义标签，并根据图像区域语义标签和文本区域语义标签，进行目标文本提取，能够较好地提取出待识别图像中的文本区域和图像区域中的目标文本，有效提高了对待识别图像的识别精确度，成本较低，实施较方便。

全部详细技术资料下载

【技术实现步骤摘要】
一种目标文本提取方法及系统
本专利技术涉及机器识别领域，尤其涉及一种目标文本提取方法及系统。
技术介绍
随着图像处理技术的发展，图像识别技术受到了越来越多的关注，图像识别的过程中，当待识别图像中既存在图像区域，又存在文本区域时，目前通常对其中一个区域进行识别，容易导致识别不充分，精确度较低，且不能较好地提取出文本区域和图像区域中的目标信息，存在较大不便。
技术实现思路
本专利技术提供一种目标文本提取方法及系统，以解决现有技术中当待识别图像中既存在图像区域又存在文本区域时，仅对其中一个区域进行识别，容易导致识别不充分，精确度较低，且不能较好地提取出文本区域和图像区域中的目标信息的问题。本专利技术提供的目标文本提取方法，包括：获取原始图像集；将所述原始图像集输入识别网络进行训练，获取识别模型，训练过程包括：区域划分、图像区域语义标签提取和文本区域语义标签提取；获取待识别图像；将所述待识别图像输入所述识别模型进行识别，获取图像区域语义标签和文本区域语义标签；根据所述图像区域语义标签和所述文本区域语义标签，进行目标文本提取。可选的，所述识别网络包括：卷积神经网络、图像语义识别网络和文本语义识别网络；将所述原始图像集中的原始图像输入所述卷积神经网络进行特征提取，获取一个或多个特征框；对所述特征框进行标注与分类，确定所述原始图像中的图像区域和文本区域，所述图像区域与所述文本区域相对应；将所述图像区域输入图像语义识别网络进行图像语义...

【技术保护点】
1.一种目标文本提取方法，其特征在于，包括：/n获取原始图像集；/n将所述原始图像集输入识别网络进行训练，获取识别模型，训练过程包括：区域划分、图像区域语义标签提取和文本区域语义标签提取；/n获取待识别图像；/n将所述待识别图像输入所述识别模型进行识别，获取图像区域语义标签和文本区域语义标签；/n根据所述图像区域语义标签和所述文本区域语义标签，进行目标文本提取。/n

【技术特征摘要】
1.一种目标文本提取方法，其特征在于，包括：
获取原始图像集；
将所述原始图像集输入识别网络进行训练，获取识别模型，训练过程包括：区域划分、图像区域语义标签提取和文本区域语义标签提取；
获取待识别图像；
将所述待识别图像输入所述识别模型进行识别，获取图像区域语义标签和文本区域语义标签；
根据所述图像区域语义标签和所述文本区域语义标签，进行目标文本提取。

2.根据权利要求1所述的目标文本提取方法，其特征在于，所述识别网络包括：卷积神经网络、图像语义识别网络和文本语义识别网络；
将所述原始图像集中的原始图像输入所述卷积神经网络进行特征提取，获取一个或多个特征框；
对所述特征框进行标注与分类，确定所述原始图像中的图像区域和文本区域，所述图像区域与所述文本区域相对应；
将所述图像区域输入图像语义识别网络进行图像语义识别，获取图像区域语义标签；
将所述文本区域输入文本语义识别网络进行文本语义识别，获取文本区域语义标签；
根据所述图像区域语义标签和所述文本区域语义标签，对所述识别网络进行训练，获取所述识别模型。

3.根据权利要求1所述的目标文本提取方法，其特征在于，图像区域语义标签提取的步骤包括：
对图像区域进行细化处理，获取细化图像；
利用预先设置的图像增强模板，对细化图像进行图像增强，获取增强图像；
对所述增强图像进行特征提取，获取图像区域特征，所述图像区域特征包括：颜色特征、形状特征和纹理特征；
对所述图像区域特征进行二值化处理，获取二值化特征；
根据所述二值化特征，对所述图像区域进行图像语义识别，获取图像区域语义标签。

4.根据权利要求3所述的目标文本提取方法，其特征在于，根据所述图像区域特征，对所述图像区域进行图像语义识别的步骤包括：
将所述图像区域特征与图像样本库中的图像样本进行匹配，获取匹配结果；
根据所述匹配结果，确定与所述图像区域特征相对应的图像样本，并获取对应图像样本的图像语义短语；
将所述图像语义短语作为所述图像区域语义标签，完成所述图像区域语义标签的获取。

5.根据权利要求3所述的目标文本提取方法，其特征在于，所述形状特征的获取步骤包括：
对所述增强图像进行灰度化处理，获取灰度图像和所述灰度图像中每个像素点的色度值；
判断所述色度值是否超出预设的色度值阈值范围，获取判断结果；
根据所述判断结果，确定所述图像区域中的目标区域；
对所述目标区域进行降噪处理，获取降噪图像；
将所述降噪图像输入图像语义识别网络的轮廓提取子网络进行轮廓提取，获取所述图像区域中的形状特征。

6.根据权利要求1所述的目标文本提取方法，其特征在于，文本区域语义标签提取...

【专利技术属性】
技术研发人员：姚娟娟，樊代明，钟南山，
申请(专利权)人：明品云北京数据科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人