一种电力业扩资料RPA采集方法及系统技术方案

技术编号:37119578 阅读:17 留言:0更新日期:2023-04-01 05:14
本发明专利技术涉及RPA系统技术领域,公开了一种电力业扩资料RPA采集方法及系统,其方法通过响应RPA在线录入机器人在电力营销平台中录入的电力客户业扩办理单,对电力客户业扩办理单进行图像处理,得到目标图像,提取目标图像的表格结构属性,还基于OCR识别算法对单元格中的图像进行OCR文本识别,得到单元格文本信息,将单元格以及相应的单元格文本信息构成单元格信息,获取每个单元格文本信息的主题词,得到每个主题词下的单元格文本信息集合,将每个主题词下的单元格文本信息集合按照单元格的位置信息进行单元格拼接,得到相应的业务表单,将业务表单回传至所述电力营销平台,提高了电力业扩用电申请纸质资料的录入效率。了电力业扩用电申请纸质资料的录入效率。了电力业扩用电申请纸质资料的录入效率。

【技术实现步骤摘要】
一种电力业扩资料RPA采集方法及系统


[0001]本专利技术涉及RPA系统
,尤其涉及一种电力业扩资料RPA采集方法及系统。

技术介绍

[0002]RPA(Robotic Process Automation,机器人流程自动化)是在人工智能和自动化技术的基础上,依据预先录制的脚本与现有用户系统进行交互并完成预期任务的技术。RPA把目前系统建设还没覆盖到的需要手工处理的领域,通过模拟人工操作并自动回放实现自动化全覆盖。
[0003]RPA通过模拟并增强人类与计算机的交互过程,接管了原有工作流程中的人工操作部分,实现全流程的自动化;RPA类似外挂系统,无需改造现有系统,部署在客户桌面环境而不是后台服务器,通过控制引擎实现大量重复性、具备规则性的工作流程任务自动处理,因此具有对企业现有系统影响小,基本不编码,实施周期短(一般只有一两周),而且对非技术的业务人员具有友好的特性;RPA不仅可以模拟人类,而且可以利用各项AI技术,实现一些传统必须人工处置的自动化操作目标。
[0004]电力业扩资料主要为用电申请客户办理的纸质资料,由客户手工填写,填写内容包括:业务类别、报装总容量、新增/减容量、变压器台数、供电电压、回路类型、用电性质、客户名称、用电地址、通邮地址、邮政编码、法人代表、证照号码、电子邮箱、经办人、联系人、电费查询方式、缴费方式、委托授权、受理记录、用电方声明与签字等。客户在填写时会根据办理的业务类别填写不同的表单。
[0005]电力业扩业务目前已经有公众号95598、营销系统、移动作业终端等软硬件平台录入并提交业扩流程资料,有填写、拍照、扫描等大量需要用户手动操作的环节,不能实现快速录入、智能自动录入。档案资料仍使用纸质资料办理和存档,存在管理效率低、耗费人力、占据空间资源等问题。目前虽有部分业扩类业务已使用电子化档案保存,但仍未有规划化的系统管理和规范,其余业务更是要保留纸质资料。纸质化资料有着传递不便、容易遗失、老旧之后难以查阅等缺点。
[0006]电力营销业务应用经过了多年的建设,目前大部分网省公司在用电申请、客户服务方面的营销信息化都基本达到实用化程度,在客户服务层、业务处理层、管理监控层三个层次上实现了相应的基本功能。根据电网公司总部提出的“集团化运作、集约化发展、精细化管理”的工作思路,从管理的需求上来说,数据越集中,管理的粒度越细,越能够达到精细化的管理的要求;但由于目前各网省公司的管理水平现状、IT现状、人员现状制约因素的限制,不可能使各网省公司的管理都能够一步到位。而现有的电力营销业务中电力业扩用电申请纸质资料录入电子化系统时不能实现快速录入。

技术实现思路

[0007]本专利技术提供了一种电力业扩资料RPA采集方法及系统,解决了现有的电力营销业务中电力业扩用电申请纸质资料录入电子化系统时不能实现快速录入的技术问题。
[0008]有鉴于此,本专利技术第一方面提供了一种电力业扩资料RPA采集方法,包括以下步骤:
[0009]响应RPA在线录入机器人在电力营销平台中录入的电力客户业扩办理单,对所述电力客户业扩办理单进行图像处理,得到目标图像;
[0010]提取所述目标图像的表格结构属性,所述表格结构属性包括单元格以及其相应的位置信息;
[0011]基于OCR识别算法对所述单元格中的图像进行OCR文本识别,得到单元格文本信息,将所述单元格以及相应的单元格文本信息构成单元格信息;
[0012]获取每个单元格文本信息的主题词,得到每个主题词下的单元格文本信息集合;
[0013]将每个主题词下的单元格文本信息集合按照单元格的位置信息进行单元格拼接,得到相应的业务表单;
[0014]将所述业务表单回传至所述电力营销平台。
[0015]优选地,响应RPA在线录入机器人在电力营销平台中录入的电力客户业扩办理单,对所述电力客户业扩办理单进行图像处理,得到目标图像的步骤之前还包括:
[0016]获取RPA在线录入机器人的当前的联机状态,若所述联机状态为在线状态,则执行下一步,若所述联机状态为离线状态,则获取本地存储的历史电力客户业扩办理单;
[0017]获取RPA在线录入机器人的流程任务以及任务紧急程度,按照所述任务紧急程度由高至低对所述流程任务进行排序,对同一任务紧急程度的流程任务进行并行处理,获取所述流程任务中各个时间节点对应的电力客户业扩办理单。
[0018]优选地,获取每个单元格文本信息的主题词,得到每个主题词下的单元格文本信息集合的步骤具体包括:
[0019]获取的预定主题词的主题特征向量,基于决策树算法提取每个单元格文本信息的文本特征向量;
[0020]计算每个单元格文本信息的文本特征向量与所述预定主题词的主题特征向量之间的相似度,根据所述相似度确定每个单元格文本信息的预定主题词,从而得到每个预定主题词下的所有单元格文本信息,构成相应的单元格文本信息集合。
[0021]优选地,将每个主题词下的单元格文本信息集合按照单元格的位置信息进行单元格拼接,得到相应的业务表单的步骤具体包括:
[0022]根据每个主题词下的单元格文本信息集合筛选出相应的单元格文本信息以及其对应的单元格的位置信息,所述位置信息包括单元格的行数和单元格列数;
[0023]按照单元格文本信息对应的单元格的位置信息将所述单元格文本信息进行邻接,得到相应的业务表单。
[0024]优选地,本方法还包括:对所述业务表单以以非结构化数据进行存储。
[0025]第二方面,本专利技术提供的一种电力业扩资料RPA采集系统,包括:
[0026]图像获取模块,用于响应RPA在线录入机器人在电力营销平台中录入的电力客户业扩办理单,对所述电力客户业扩办理单进行图像处理,得到目标图像;
[0027]表格提取模块,用于提取所述目标图像的表格结构属性,所述表格结构属性包括单元格以及其相应的位置信息;
[0028]OCR文本识别模块,用于基于OCR识别算法对所述单元格中的图像进行OCR文本识
别,得到单元格文本信息,将所述单元格以及相应的单元格文本信息构成单元格信息;
[0029]主题词模块,用于获取每个单元格文本信息的主题词,得到每个主题词下的单元格文本信息集合;
[0030]表格拼接模块,用于将每个主题词下的单元格文本信息集合按照单元格的位置信息进行单元格拼接,得到相应的业务表单;
[0031]上传模块,用于将所述业务表单回传至所述电力营销平台。
[0032]优选地,本系统还包括:
[0033]状态获取模块,用于获取RPA在线录入机器人的当前的联机状态,若所述联机状态为在线状态,则执行单据获取模块的工序,若所述联机状态为离线状态,则获取本地存储的历史电力客户业扩办理单;
[0034]单据获取模块,用于获取RPA在线录入机器人的流程任务以及任务紧急程度,按照所述任务紧急程度由高至低对所述流程任务进行排序,对同一任务紧急程度的流程任务进行并行处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力业扩资料RPA采集方法,其特征在于,包括以下步骤:响应RPA在线录入机器人在电力营销平台中录入的电力客户业扩办理单,对所述电力客户业扩办理单进行图像处理,得到目标图像;提取所述目标图像的表格结构属性,所述表格结构属性包括单元格以及其相应的位置信息;基于OCR识别算法对所述单元格中的图像进行OCR文本识别,得到单元格文本信息,将所述单元格以及相应的单元格文本信息构成单元格信息;获取每个单元格文本信息的主题词,得到每个主题词下的单元格文本信息集合;将每个主题词下的单元格文本信息集合按照单元格的位置信息进行单元格拼接,得到相应的业务表单;将所述业务表单回传至所述电力营销平台。2.根据权利要求1所述的电力业扩资料RPA采集方法,其特征在于,响应RPA在线录入机器人在电力营销平台中录入的电力客户业扩办理单,对所述电力客户业扩办理单进行图像处理,得到目标图像的步骤之前还包括:获取RPA在线录入机器人的当前的联机状态,若所述联机状态为在线状态,则执行下一步,若所述联机状态为离线状态,则获取本地存储的历史电力客户业扩办理单;获取RPA在线录入机器人的流程任务以及任务紧急程度,按照所述任务紧急程度由高至低对所述流程任务进行排序,对同一任务紧急程度的流程任务进行并行处理,获取所述流程任务中各个时间节点对应的电力客户业扩办理单。3.根据权利要求1所述的电力业扩资料RPA采集方法,其特征在于,获取每个单元格文本信息的主题词,得到每个主题词下的单元格文本信息集合的步骤具体包括:获取的预定主题词的主题特征向量,基于决策树算法提取每个单元格文本信息的文本特征向量;计算每个单元格文本信息的文本特征向量与所述预定主题词的主题特征向量之间的相似度,根据所述相似度确定每个单元格文本信息的预定主题词,从而得到每个预定主题词下的所有单元格文本信息,构成相应的单元格文本信息集合。4.根据权利要求1所述的电力业扩资料RPA采集方法,其特征在于,将每个主题词下的单元格文本信息集合按照单元格的位置信息进行单元格拼接,得到相应的业务表单的步骤具体包括:根据每个主题词下的单元格文本信息集合筛选出相应的单元格文本信息以及其对应的单元格的位置信息,所述位置信息包括单元格的行数和单元格列数;按照单元格文本信息对应的单元格的位置信息将所述单元格文本信息进行邻接,得到相应的业务表单。5.根据权利要求1所述的电力业扩资料RPA采集方法,其特征在于,还包括:对所述业务表单以以非结构化数据进行存储。6...

【专利技术属性】
技术研发人员:步俊华林振晓杜文聪徐潮辉刘健文潘锦宁陈永灿李伟昌
申请(专利权)人:广东电网有限责任公司佛山供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1