一种识别图像的方法和装置制造方法及图纸

技术编号：23344710 阅读：28 留言：0更新日期：2020-02-15 04:19

本发明专利技术公开了一种识别图像的方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：对训练数据集中的各个图像样本分别标记公式标签和文字标签；分别采用标记有公式标签的图像样本、标记有文字标签的图像样本训练卷积神经网络，得到第一卷积神经网络和第二卷积神经网络；基于所述第一卷积神经网络和所述第二卷积神经网络，分别定位出待识别图像中的公式区域和文字区域。该实施方式能够解决需要用户框选公式区域的技术问题。

A method and device of image recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种识别图像的方法和装置
本专利技术涉及机器学习
，尤其涉及一种识别图像的方法和装置。
技术介绍
现有技术中，对图像进行文本识别时，需要用户先在图像中框选出公式所在位置，如图1所示，然后识别公式区域和文字区域的文本信息。在实现本专利技术过程中，专利技术人发现现有技术中至少存在如下问题：每次识别图像中的文本时都需要用户先框选出公式区域，这样会增加用户操作，从而导致识别效率较低。
技术实现思路
有鉴于此，本专利技术实施例提供一种识别图像的方法和装置，以解决需要用户框选公式区域的技术问题。为实现上述目的，根据本专利技术实施例的一个方面，提供了一种识别图像的方法，包括：对训练数据集中的各个图像样本分别标记公式标签和文字标签；分别采用标记有公式标签的图像样本、标记有文字标签的图像样本训练卷积神经网络，得到第一卷积神经网络和第二卷积神经网络；基于所述第一卷积神经网络和所述第二卷积神经网络，分别定位出待识别图像中的公式区域和文字区域。可选地，所述公式标签包括公式文本在所述图像样本中的位置信息，所述文字标签包括文字文本在所述图像样本中的位置信息。可选地，分别采用标记有公式标签的图像样本、标记有文字标签的图像样本训练卷积神经网络，得到第一卷积神经网络和第二卷积神经网络，包括：以图像样本作为输入、公式标签作为输出，训练卷积神经网络，得到第一卷积神经网络；以图像样本作为输入、文字标签作为输出，训练卷积神经网络，得到第二卷积神经...

【技术保护点】
1.一种识别图像的方法，其特征在于，包括：/n对训练数据集中的各个图像样本分别标记公式标签和文字标签；/n分别采用标记有公式标签的图像样本、标记有文字标签的图像样本训练卷积神经网络，得到第一卷积神经网络和第二卷积神经网络；/n基于所述第一卷积神经网络和所述第二卷积神经网络，分别定位出待识别图像中的公式区域和文字区域。/n

【技术特征摘要】
1.一种识别图像的方法，其特征在于，包括：
对训练数据集中的各个图像样本分别标记公式标签和文字标签；
分别采用标记有公式标签的图像样本、标记有文字标签的图像样本训练卷积神经网络，得到第一卷积神经网络和第二卷积神经网络；
基于所述第一卷积神经网络和所述第二卷积神经网络，分别定位出待识别图像中的公式区域和文字区域。

2.根据权利要求1所述的方法，其特征在于，所述公式标签包括公式文本在所述图像样本中的位置信息，所述文字标签包括文字文本在所述图像样本中的位置信息。

3.根据权利要求2所述的方法，其特征在于，分别采用标记有公式标签的图像样本、标记有文字标签的图像样本训练卷积神经网络，得到第一卷积神经网络和第二卷积神经网络，包括：
以图像样本作为输入、公式标签作为输出，训练卷积神经网络，得到第一卷积神经网络；
以图像样本作为输入、文字标签作为输出，训练卷积神经网络，得到第二卷积神经网络。

4.根据权利要求2所述的方法，其特征在于，基于所述第一卷积神经网络和所述第二卷积神经网络，分别定位出待识别图像中的公式区域和文字区域，包括：
将待识别图像分别输入到所述第一卷积神经网络和所述第二卷积神经网络中，输出公式区域的位置信息和文字区域的位置信息，从而在所述待识别图像中分别定位出公式区域和文字区域。

5.根据权利要求1所述的方法，其特征在于，分别定位出待识别图像中的公式区域和文字区域之后，还包括：
基于光学字符识别，分别从所述待识别图像的公式区域和文字区域中识别出文本信息。

6.一种识别图像的装置，其特征在于，包括：
标记模块，用于对训练数据集中的各个图像样本分别标记公式标签和文字标签；<...

【专利技术属性】
技术研发人员：易显维，
申请(专利权)人：中国建设银行股份有限公司，建信金融科技有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人