结合RPA和AI的文字识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:26792265 阅读:14 留言:0更新日期:2020-12-22 17:07
本申请提出一种结合RPA和AI的文字识别方法、装置、电子设备和存储介质,涉及人工智能技术领域,其中,具体公开的技术方案为:AI平台接收RPA机器人发送的图像,AI平台从图像中获取表格区域图像;AI平台从表格区域图像中提取各个单元格;AI平台根据各个单元格的位置信息构建表格;AI平台从图像中提取各个单元格内的文字信息,并根据文字信息和表格生成文字识别结果发送给RPA机器人。由此,解决了现有技术中文字识别准确性差、效率低的技术问题,通过首先构建图像中的表格,再从图像中提取表格内的文字信息,能够快速准确完成图像中的文字识别。

【技术实现步骤摘要】
结合RPA和AI的文字识别方法、装置、电子设备和存储介质
本申请涉及人工智能
,尤其涉及一种结合RPA和AI的文字识别方法、装置、电子设备和存储介质。
技术介绍
机器人流程自动化(RoboticProcessAutomation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器15人、语音识别、图像识别、自然语言处理和专家系统等。通常,银行的业务比较多,存在各种票据且格式多样,表格作为图像内容中的结构化信息,经常出现在各类银行票据图像中,相关技术中,应用文本检测技术进行文本位置的提取,然后基于文本位置应用启发式方式对表格信息进行推断,存在准确性差、效率低的技术问题。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种结合RPA和AI的文字识别方法,解决了现有技术中文字识别方法准确性差、效率低的技术问题,通过首先构建图像中的表格,再从图像中提取表格内的文字信息,能够快速准确完成图像中的文字识别。本申请提出一种AI平台。本申请提出一种结合RPA和AI的文字识别系统。本申请提出一种电子设备。本申请提出一种计算机可读存储介质。本申请一方面实施例提出了一种结合RPA和AI的文字识别方法,所述方法应用于AI平台,包括:AI平台接收RPA机器人发送的图像,从图像中获取表格区域图像;AI平台从表格区域图像中提取各个单元格;AI平台根据各个单元格的位置信息构建表格;AI平台从图像中提取各个单元格内的文字信息,根据文字信息和表格生成文字识别结果发送给RPA机器人。本申请另一方面实施例提出了一种AI平台,包括:第一获取模块,用于获取图像;第二获取模块,用于从图像中获取表格区域图像;提取模块,用于从表格区域图像中提取各个单元格;构建模块,用于根据各个单元格的位置信息构建表格;生成模块,用于从图像中提取各个单元格内的文字信息,根据文字信息和表格生成文字识别结果。本申请又一方面实施例提出了一种结合RPA和AI的文字识别系统,其特征在于,包括:前述一方面实施例所述的AI平台、业务系统和RPA机器人;业务系统通过摄像头拍摄得到图像、或者,业务系统通过扫描仪扫描得到图像发送给RPA机器人;RPA机器人将图像发送给AI平台进行处理生成文字识别结果返回给RPA机器人;RPA机器人将文字识别结果发送给业务系统的数据库存储。本申请又一方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如前述一方面实施例所述的结合RPA和AI的文字识别方法。本申请又一方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现前述方法实施例所述的结合RPA和AI的文字识别方法。本申请实施例所提供的技术方案可以包含如下的有益效果:AI平台接收RPA机器人发送的图像,从图像中获取表格区域图像,AI平台从表格区域图像中提取各个单元格,AI平台根据各个单元格的位置信息构建表格,AI平台从图像中提取各个单元格内的文字信息,并根据文字信息和表格生成文字识别结果发送给RPA机器人。由此,解决了现有技术中文字识别准确性差、效率低的技术问题,通过首先构建图像中的表格,再从图像中提取表格内的文字信息,能够快速准确完成图像中的文字识别。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例所提供的一种结合RPA和AI的文字识别系统的结构示意图;图2为本申请实施例所提供的一种结合RPA和AI的文字识别方法的流程示意图;图3为本申请实施例所提供的另一种结合RPA和AI的文字识别方法的流程示意图;图4为本申请实施例所提供的一种结合RPA和AI的文字识别系统的示例图;图5a为本申请实施例所提供的RPA接收的图像的示例图;图5b为本申请实施例所提供的表格区域图像的示例图;图5c为本申请实施例所提供的各个单元格的示例图;图5d为本申请实施例所提供的表格调整的示例图;图5e为本申请实施例所提供的表格调整的示例图;图5f为本申请实施例所提供的表格调整的示例图;图6为本申请实施例提供的一种结合RPA和AI的文字识别装置的结构示意图;图7是根据本申请一个实施例的电子设备的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的结合RPA和AI的文字识别方法、装置、电子设备和存储介质。具体地,本申请提出一种结合RPA和AI的文字识别方法,通过RPA接收图像发送给AI平台,AI平台通过首先构建图像中的表格,再从图像中提取表格内的文字信息,能够快速准确完成图像中的文字识别再反馈给RPA机器人,通过RPA技术与OCR技术的结合,能够帮助用户更高效的提取图像中的表格结构化信息,极大的提高工作效率和提升数据准确率。在实际应用中,RPA机器人接收到的图像来自于众多不同的业务,多为开放式图像,也就是说图像中存在有表格或无表格的情况,表格在图像中的位置、尺度、形状、颜色、背景、格式也不尽相同,本申请提出的结合RPA和AI的文字识别方法可以处理上述描述的开放式图像,接收RPA机器人发送的图像,从图像中获取表格区域图像,接着从表格区域图像中提取各个单元格,根据各个单元格的位置信息构建表格,从图像中提取各个单元格内的文字信息,根据文字信息和表格生成文字识别结果发送给RPA机器人,另外,从图像中获取不到表格区域图像,直接进行文本识别,能够快速准确完成图像中的文字识别。为了本领域人员更加清楚本申请实施例描述的结合RPA和AI的文字识别方法,首先结合图1描述一种结合RPA和AI的文字识别系统。图1为本申请实施例所提供的一种结合RPA和AI的文字识别系统的结构示意图。如图1所示,该系统包括:业务系统100、RPA机器人200和AI平台300。其中,业务系统100通过摄像头拍摄得到图像、或者,业务系统100通过扫描仪扫描得到图像发送给RPA机器人200。RPA机器人200将图像发送给AI平台300进本文档来自技高网...

【技术保护点】
1.一种结合RPA和AI的文字识别方法,其特征在于,所述方法包括:/nAI平台接收RPA机器人发送的图像,从所述图像中获取表格区域图像;/n所述AI平台从所述表格区域图像中提取各个单元格;/n所述AI平台根据所述各个单元格的位置信息构建表格;/n所述AI平台从所述图像中提取所述各个单元格内的文字信息,根据所述文字信息和所述表格生成文字识别结果发送给所述RPA机器人。/n

【技术特征摘要】
1.一种结合RPA和AI的文字识别方法,其特征在于,所述方法包括:
AI平台接收RPA机器人发送的图像,从所述图像中获取表格区域图像;
所述AI平台从所述表格区域图像中提取各个单元格;
所述AI平台根据所述各个单元格的位置信息构建表格;
所述AI平台从所述图像中提取所述各个单元格内的文字信息,根据所述文字信息和所述表格生成文字识别结果发送给所述RPA机器人。


2.如权利要求1所述的结合RPA和AI的文字识别方法,其特征在于,所述AI平台从所述图像中获取表格区域图像,包括:
所述AI平台通过物体检测算法对所述图像进行处理得到多个第一数组;
所述AI平台根据所述多个第一数组中的类别标识确定表格类别;
所述AI平台获取所述表格类别对应的目标数组,并根据所述目标数组中各个数值确定表格区域图像。


3.如权利要求1所述的结合RPA和AI的文字识别方法,其特征在于,所述AI平台从所述表格区域图像中提取各个单元格,包括:
所述AI平台通过实例分割检测算法对所述表格区域图像进行处理得到多个第二数组;
所述AI平台根据所述多个第二数组中各个数值生成各个单元格。


4.如权利要求1所述的结合RPA和AI的文字识别方法,其特征在于,所述AI平台根据所述各个单元格的位置信息构建表格,包括:
所述AI平台根据所述各个单元格的位置信息确定所述各个单元格中的最小单元格宽度和最小单元格高度;
所述AI平台根据所述最小单元格宽度确定第一步长,并根据所述最小单元格高度确定第二步长;
所述AI平台按照步长第一步长以第一方向对所述各个单元格对应的总表格区域进行切分,并按照第二步长以第一方向对所述总表格区域进行切分,生成表格网络区域;
所述AI平台对所述各个单元格进行编号,将所述各个单元格按照坐标位置映射到所述表格网络区域;
所述AI平台按照所述第一方向对所述表格网络区域进行列合并,并按照所述第二方向对所述表格网络区域进行行合并生成所述表格。


5.如权利要求4所述的结合RPA和AI的文字识别方法,其特征在于,所述AI平台按照所述第一方向对所述表格网络区域进行列合并,并按照所述第二方向对所述表格网络区域进行行合并生成所述表格,包括:
所述AI平台按照从左到右方向从所述表格网络区域中提取出相邻的两列,若两列对应的单元格值相等,则删除任一列;
所述AI平台按照从上到下方向从所述表格网络区域中提取出相邻的两行,若两行对应的单元格值相等,则删除任一行。

【专利技术属性】
技术研发人员:汪冠春胡一川褚瑞李玮卢波黄安王建周
申请(专利权)人:北京来也网络科技有限公司北京奔影网络科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1