本发明专利技术涉及人工智能领域,公开了一种业务数据处理方法、装置、设备及存储介质,用于提高业务数据处理的准确率。所述业务数据处理方法包括:监听预设的截屏事件并获取待录入文本框对应的待处理截屏图像;对所述待处理截屏图像进行图像预处理和区域选取,得到目标区域图像;将所述目标区域图像输入预置的文字识别模型进行区域文字检测和文本识别,得到候选文本数据,其中,文本识别模型包括:文本检测网络和文本识别网络;将所述候选文本数据输入预置的文本匹配模型进行匹配预测,得到目标文本数据;根据所述目标文本数据对所述待录入文本框进行内容填充,得到填充后的文本框。此外,本发明专利技术还涉及区块链技术,候选文本数据可存储于区块链节点中。块链节点中。块链节点中。
【技术实现步骤摘要】
业务数据处理方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种业务数据处理方法、装置、设备及存储介质。
技术介绍
[0002]目前,在有些银行业务中,需要依据贸易单据,包括发票、保单等,在电脑系统中录入相应的票据上的信息。在上述信息人工录入的过程录入效率完全取决于操作人员的打字速度,也时有出现遗漏、录错的情况。尤其在所需录入字符较长的情景中,不但需要较长时间录入及核对,也增大了出错的可能性。
[0003]当前,有的是通过扫描枪等硬件的方式实现自动录入,但是这种方式不够灵活,无法做到选取哪块区域就识别哪块区域,即现有方案的准确率低。
技术实现思路
[0004]本专利技术提供了一种业务数据处理方法、装置、设备及存储介质,用于提高业务数据处理的准确率。
[0005]本专利技术第一方面提供了一种业务数据处理方法,所述业务数据处理方法包括:监听预设的截屏事件并获取待录入文本框对应的待处理截屏图像;对所述待处理截屏图像进行图像预处理和区域选取,得到目标区域图像;将所述目标区域图像输入预置的文字识别模型进行区域文字检测和文本识别,得到候选文本数据,其中,所述文本识别模型包括:文本检测网络和文本识别网络;将所述候选文本数据输入预置的文本匹配模型进行匹配预测,得到目标文本数据;根据所述目标文本数据对所述待录入文本框进行内容填充,得到填充后的文本框。
[0006]可选的,在本专利技术第一方面的第一种实现方式中,所述监听预设的截屏事件并获取待录入文本框对应的待处理截屏图像,包括:监听预设的截屏事件,并调用预置的窗口函数获取鼠标移动范围;根据所述鼠标移动范围确定所述截屏事件的起点和终点;根据所述起点和所述终点识别鼠标框选范围;根据所述鼠标框选范围生成待录入文本框对应的待处理截屏图像。
[0007]可选的,在本专利技术第一方面的第二种实现方式中,所述对所述待处理截屏图像进行图像预处理和区域选取,得到目标区域图像,包括:对所述待处理截屏图像进行降噪处理,得到高清截屏图像;对所述高清截屏图像进行对比度增强,得到目标截屏图像;对所述待录入文本框进行文本框识别,得到候选框;根据所述候选框对所述目标区域图像进行候选区域选取,得到目标区域图像。
[0008]可选的,在本专利技术第一方面的第三种实现方式中,所述将所述目标区域图像输入预置的文字识别模型进行区域文字检测和文本识别,得到候选文本数据,其中,所述文本识别模型包括:文本检测网络和文本识别网络,包括:将所述目标区域图像输入预置的文字识别模型,其中,所述文本识别模型包括:文本检测网络和文本识别网络;通过所述文本检测
网络对所述目标区域图像进行文字检测,得到文字区域标注,其中,所述文本检测网络包括:多层卷积网络、二值化网络和输出网络;通过所述文本识别网络对所述文字区域标注进行文本识别,得到候选文本数据,其中,所述文本识别网络包括:卷积递归神经网络、双向长短时记忆网络和输出层。
[0009]可选的,在本专利技术第一方面的第四种实现方式中,所述通过所述文本检测网络对所述目标区域图像进行文字检测,得到文字区域标注,其中,所述文本检测网络包括:多层卷积网络、二值化网络和输出网络,包括:将所述目标区域图像输入所述多层卷积网络进行卷积运算,得到区域特征图像;将所述区域特征图像输入二值化网络进行二值化处理,得到二值化图像;将所述二值化图像输入所述输出网络进行区域文字标注,得到文字区域标注。
[0010]可选的,在本专利技术第一方面的第五种实现方式中,所述通过所述文本识别网络对所述文字区域标注进行文本识别,得到候选文本数据,其中,所述文本识别网络包括:卷积递归神经网络、双向长短时记忆网络和输出层,包括:将所述文字区域标注输入所述卷积递归神经网络进行特征提取,得到卷积特征图;将所述卷积特征图输入所述双向长短时记忆网络进行序列预测,得到文本序列;将所述文本序列输入所述输出层进行文本词级提取,得到候选文本数据。
[0011]可选的,在本专利技术第一方面的第六种实现方式中,所述根据所述目标文本数据对所述待录入文本框进行内容填充,得到填充后的文本框,包括:提取所述待录入文本框中的多个待录入栏位;对所述目标文本数据和所述多个待录入栏位进行匹配,得到匹配结果;根据所述匹配结果对所述待录入栏位进行文本填充,得到填充后的文本框。
[0012]本专利技术第二方面提供了一种业务数据处理装置,所述业务数据处理装置包括:获取模块,用于监听预设的截屏事件并获取待录入文本框对应的待处理截屏图像;预处理模块,用于对所述待处理截屏图像进行图像预处理和区域选取,得到目标区域图像;识别模块,用于将所述目标区域图像输入预置的文字识别模型进行区域文字检测和文本识别,得到候选文本数据,其中,所述文本识别模型包括:文本检测网络和文本识别网络;预测模块,用于将所述候选文本数据输入预置的文本匹配模型进行匹配预测,得到目标文本数据;填充模块,用于根据所述目标文本数据对所述待录入文本框进行内容填充,得到填充后的文本框。
[0013]可选的,在本专利技术第二方面的第一种实现方式中,所述获取模块具体用于:监听预设的截屏事件,并调用预置的窗口函数获取鼠标移动范围;根据所述鼠标移动范围确定所述截屏事件的起点和终点;根据所述起点和所述终点识别鼠标框选范围;根据所述鼠标框选范围生成待录入文本框对应的待处理截屏图像。
[0014]可选的,在本专利技术第二方面的第二种实现方式中,所述预处理模块具体用于:对所述待处理截屏图像进行降噪处理,得到高清截屏图像;对所述高清截屏图像进行对比度增强,得到目标截屏图像;对所述待录入文本框进行文本框识别,得到候选框;根据所述候选框对所述目标区域图像进行候选区域选取,得到目标区域图像。
[0015]可选的,在本专利技术第二方面的第三种实现方式中,所述识别模块还包括:输入单元,用于将所述目标区域图像输入预置的文字识别模型,其中,所述文本识别模型包括:文本检测网络和文本识别网络;检测单元,用于通过所述文本检测网络对所述目标区域图像进行文字检测,得到文字区域标注,其中,所述文本检测网络包括:多层卷积网络、二值化网
络和输出网络;输出单元,用于通过所述文本识别网络对所述文字区域标注进行文本识别,得到候选文本数据,其中,所述文本识别网络包括:卷积递归神经网络、双向长短时记忆网络和输出层。
[0016]可选的,在本专利技术第二方面的第四种实现方式中,所述检测单元具体用于:将所述目标区域图像输入所述多层卷积网络进行卷积运算,得到区域特征图像;将所述区域特征图像输入二值化网络进行二值化处理,得到二值化图像;将所述二值化图像输入所述输出网络进行区域文字标注,得到文字区域标注。
[0017]可选的,在本专利技术第二方面的第五种实现方式中,所述输出单元具体用于:将所述文字区域标注输入所述卷积递归神经网络进行特征提取,得到卷积特征图;将所述卷积特征图输入所述双向长短时记忆网络进行序列预测,得到文本序列;将所述文本序列输入所述输出层进行文本词级提取,得到候选文本数据。
[0018]可选的,在本发本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种业务数据处理方法,其特征在于,所述业务数据处理方法包括:监听预设的截屏事件并获取待录入文本框对应的待处理截屏图像;对所述待处理截屏图像进行图像预处理和区域选取,得到目标区域图像;将所述目标区域图像输入预置的文字识别模型进行区域文字检测和文本识别,得到候选文本数据,其中,所述文本识别模型包括:文本检测网络和文本识别网络;将所述候选文本数据输入预置的文本匹配模型进行匹配预测,得到目标文本数据;根据所述目标文本数据对所述待录入文本框进行内容填充,得到填充后的文本框。2.根据权利要求1所述的业务数据处理方法,其特征在于,所述监听预设的截屏事件并获取待录入文本框对应的待处理截屏图像,包括:监听预设的截屏事件,并调用预置的窗口函数获取鼠标移动范围;根据所述鼠标移动范围确定所述截屏事件的起点和终点;根据所述起点和所述终点识别鼠标框选范围;根据所述鼠标框选范围生成待录入文本框对应的待处理截屏图像。3.根据权利要求1所述的业务数据处理方法,其特征在于,所述对所述待处理截屏图像进行图像预处理和区域选取,得到目标区域图像,包括:对所述待处理截屏图像进行降噪处理,得到高清截屏图像;对所述高清截屏图像进行对比度增强,得到目标截屏图像;对所述待录入文本框进行文本框识别,得到候选框;根据所述候选框对所述目标区域图像进行候选区域选取,得到目标区域图像。4.根据权利要求1所述的业务数据处理方法,其特征在于,所述将所述目标区域图像输入预置的文字识别模型进行区域文字检测和文本识别,得到候选文本数据,其中,所述文本识别模型包括:文本检测网络和文本识别网络,包括:将所述目标区域图像输入预置的文字识别模型,其中,所述文本识别模型包括:文本检测网络和文本识别网络;通过所述文本检测网络对所述目标区域图像进行文字检测,得到文字区域标注,其中,所述文本检测网络包括:多层卷积网络、二值化网络和输出网络;通过所述文本识别网络对所述文字区域标注进行文本识别,得到候选文本数据,其中,所述文本识别网络包括:卷积递归神经网络、双向长短时记忆网络和输出层。5.根据权利要求4所述的业务数据处理方法,其特征在于,所述通过所述文本检测网络对所述目标区域图像进行文字检测,得到文字区域标注,其中,所述文本检测网络包括:多层卷积网络、二值化网络和输出网络,包括:将所述目标区域图像输入所...
【专利技术属性】
技术研发人员:周建伟,刘玉宇,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。