结合RPA和AI的文字识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：26792265 阅读：20 留言：0更新日期：2020-12-22 17:07

本申请提出一种结合RPA和AI的文字识别方法、装置、电子设备和存储介质，涉及人工智能技术领域，其中，具体公开的技术方案为：AI平台接收RPA机器人发送的图像，AI平台从图像中获取表格区域图像；AI平台从表格区域图像中提取各个单元格；AI平台根据各个单元格的位置信息构建表格；AI平台从图像中提取各个单元格内的文字信息，并根据文字信息和表格生成文字识别结果发送给RPA机器人。由此，解决了现有技术中文字识别准确性差、效率低的技术问题，通过首先构建图像中的表格，再从图像中提取表格内的文字信息，能够快速准确完成图像中的文字识别。

全部详细技术资料下载

【技术实现步骤摘要】
结合RPA和AI的文字识别方法、装置、电子设备和存储介质
本申请涉及人工智能
，尤其涉及一种结合RPA和AI的文字识别方法、装置、电子设备和存储介质。
技术介绍
机器人流程自动化(RoboticProcessAutomation)简称RPA，是通过特定的“机器人软件”，模拟人在计算机上的操作，按规则自动执行流程任务。人工智能(ArtificialIntelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器15人、语音识别、图像识别、自然语言处理和专家系统等。通常，银行的业务比较多，存在各种票据且格式多样，表格作为图像内容中的结构化信息，经常出现在各类银行票据图像中，相关技术中，应用文本检测技术进行文本位置的提取，然后基于文本位置应用启发式方式对表格信息进行推断，存在准确性差、效率低的技术问题。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请提出一种结合RPA和AI的文字识别方法，解决了现有技术中文字识别方法准确性差、效率低的技术问题，通过首先构建图像中的表格，再从图像中提取表格内的文字信息，能够快速准确完成图像中的文字识别。本申请提出一种AI平台。本申请提出一种结合RPA和AI的文字识别系统。本申请提出一种...

【技术保护点】
1.一种结合RPA和AI的文字识别方法，其特征在于，所述方法包括：/nAI平台接收RPA机器人发送的图像，从所述图像中获取表格区域图像；/n所述AI平台从所述表格区域图像中提取各个单元格；/n所述AI平台根据所述各个单元格的位置信息构建表格；/n所述AI平台从所述图像中提取所述各个单元格内的文字信息，根据所述文字信息和所述表格生成文字识别结果发送给所述RPA机器人。/n

【技术特征摘要】
1.一种结合RPA和AI的文字识别方法，其特征在于，所述方法包括：
AI平台接收RPA机器人发送的图像，从所述图像中获取表格区域图像；
所述AI平台从所述表格区域图像中提取各个单元格；
所述AI平台根据所述各个单元格的位置信息构建表格；
所述AI平台从所述图像中提取所述各个单元格内的文字信息，根据所述文字信息和所述表格生成文字识别结果发送给所述RPA机器人。

2.如权利要求1所述的结合RPA和AI的文字识别方法，其特征在于，所述AI平台从所述图像中获取表格区域图像，包括：
所述AI平台通过物体检测算法对所述图像进行处理得到多个第一数组；
所述AI平台根据所述多个第一数组中的类别标识确定表格类别；
所述AI平台获取所述表格类别对应的目标数组，并根据所述目标数组中各个数值确定表格区域图像。

3.如权利要求1所述的结合RPA和AI的文字识别方法，其特征在于，所述AI平台从所述表格区域图像中提取各个单元格，包括：
所述AI平台通过实例分割检测算法对所述表格区域图像进行处理得到多个第二数组；
所述AI平台根据所述多个第二数组中各个数值生成各个单元格。

4.如权利要求1所述的结合RPA和AI的文字识别方法，其特征在于，所述AI平台根据所述各个单元格的位置信息构建表格，包括：
所述AI平台根据所述各个单元格的位置信息确定所述各个单元格中的最小单元格宽度和最小单元格高度；
所述AI平台根据所述最小单元格宽度确定第一步长，并根据所述最小单元格高度确定第二步长；
所述AI平台按照步长第一步长以第一方向对所述各个单元格对应的总表格区域进行切分，并按照第二步长以第一方向对所述总表格区域进行切分，生成表格网络区域；
所述AI平台对所述各个单元格进行编号，将所述各个单元格按照坐标位置映射到所述表格网络区域；
所述AI平台按照所述第一方向对所述表格网络区域进行列合并，并按照所述第二方向对所述表格网络区域进行行合并生成所述表格。

5.如权利要求4所述的结合RPA和AI的文字识别方法，其特征在于，所述AI平台按照所述第一方向对所述表格网络区域进行列合并，并按照所述第二方向对所述表格网络区域进行行合并生成所述表格，包括：
所述AI平台按照从左到右方向从所述表格网络区域中提取出相邻的两列，若两列对应的单元格值相等，则删除任一列；
所述AI平台按照从上到下方向从所述表格网络区域中提取出相邻的两行，若两行对应的单元格值相等，则删除任一行。

【专利技术属性】
技术研发人员：汪冠春，胡一川，褚瑞，李玮，卢波，黄安，王建周，
申请(专利权)人：北京来也网络科技有限公司，北京奔影网络科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人