数据处理的方法技术

技术编号:39742786 阅读:7 留言:0更新日期:2023-12-17 23:42
本公开提供了数据处理的方法

【技术实现步骤摘要】
数据处理的方法、系统以及计算机可读存储介质


[0001]本公开涉及数据处理
,特别是涉及数据处理的方法

系统以及计算机可读存储介质


技术介绍

[0002]目前,采用光学字符识别技术
(OCR

OpticalCharacterRecognition)
对油气站的巡检系统界面进行处理,以得到巡检人数,而采用
OCR
技术得到的数据不准确,有待改善


技术实现思路

[0003]为解决
OCR
处理数据不准确的问题,本公开提供了一种数据处理的系统,所述系统包括:
[0004]OCR
系统,用于获取多个系统的数据并进行
OCR
处理,得到
OCR
识别结果;
[0005]视频监控系统,用于对所述多个系统实时监控得到的监控视频进行分析,得到监控视频表征的语义信息;
[0006]自然语言处理系统,用于对所述
OCR
识别结果进行自然语言处理,得到数据表征的语义信息;
[0007]信息处理系统,用于对所述监控视频表征的语义信息和所述数据表征的语义信息进行判断;当所述监控视频表征的语义信息与所述数据表征的语义信息相匹配时,用于将所述数据表征的语义信息输出至信息库

[0008]在一些实施方式中,所述信息处理系统还用于:
[0009]当所述监控视频表征的语义信息与所述数据表征的语义信息不匹配时,将所述监控视频表征的语义信息输出至所述信息库

[0010]在一些实施方式中,当所述监控视频表征的语义信息与所述数据表征的语义信息相匹配时,用于将所述数据表征的语义信息输出至信息库,包括:
[0011]当判断出所述监控视频表征的语义信息与所述数据表征的语义信息相匹配后,将所述数据表征的语义信息进行自定义,将自定义后的所述数据表征的语义信息相互进行关联,将关联后的所述数据表征的语义信息输出至信息库进行存储

[0012]在一些实施方式中,所述获取多个系统的数据并进行
OCR
处理,得到
OCR
识别结果,包括:
[0013]将所述多个系统的数据进行清洗和预处理;
[0014]将清洗和预处理后的数据进行文字定位和识别,得到所述
OCR
识别结果

[0015]在一些实施方式中,将自定义后的所述数据表征的语义信息相互进行关联,包括:
[0016]将所述自定义后的所述数据表征的语义信息进行识别切割;
[0017]根据所述识别切割的结果,对相关的所述数据表征的语义信息之间进行相互关联;
[0018]所述系统还包括:
[0019]显示系统,用于将关联后的所述数据表征的语义信息之间的距离进行调整后,以竖向关联和
/
或横向关联呈现

[0020]在一些实施方式中,所述相关的所述数据表征的语义信息包括第一数据表征的语义信息和第二数据表征的语义信息;
[0021]当所述第一数据表征的语义信息和所述第二数据表征的语义信息的呈现为上下形式,所述关联为竖向关联;
[0022]当所述第一数据表征的语义信息和所述第二数据表征的语义信息的呈现为左右形式,所述关联为横向关联

[0023]在一些实施方式中,所述系统还包括:
[0024]整合系统,用于:在将关联后的所述数据表征的语义信息输出至信息库进行存储之前,对关联后的所述数据表征的语义信息进行识别,确定其对应关系;根据对应关系,将关联后的所述数据表征的语义信息进行数据转换以及整合

[0025]在一些实施方式中,所述系统还包括:
[0026]模型训练系统,用于在将关联后的所述数据表征的语义信息输出至信息库进行存储之后,对存储至信息库的关联后的所述数据表征的语义信息进行模型训练

[0027]本公开提供了一种数据处理的方法,所述方法包括:
[0028]S1
:获取多个系统的数据并进行
OCR
处理,得到
OCR
识别结果;
[0029]S2
:对所述多个系统实时监控得到的监控视频进行分析,得到监控视频表征的语义信息;
[0030]S3
:用于对所述
OCR
识别结果进行自然语言处理,得到数据表征的语义信息并用于显示;
[0031]S4
:对所述监控视频表征的语义信息和所述数据表征的语义信息进行判断;
[0032]S5
:当所述监控视频表征的语义信息与所述数据表征的语义信息相匹配时,用于将所述数据表征的语义信息输出至信息库

[0033]本公开提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述所述数据处理的方法

[0034]本公开提供了数据处理的方法

系统以及计算机可读存储介质,涉及数据处理
,所述系统包括:
OCR
系统,用于获取多个系统的数据并进行
OCR
处理,得到
OCR
识别结果;视频监控系统,用于对所述多个系统实时监控得到的监控视频进行分析,得到监控视频表征的语义信息;自然语言处理系统,用于对所述
OCR
识别结果进行自然语言处理,得到数据表征的语义信息;信息处理系统,用于对所述监控视频表征的语义信息和所述数据表征的语义信息进行判断;当所述监控视频表征的语义信息与所述数据表征的语义信息相匹配时,用于将所述数据表征的语义信息输出至信息库

本公开通过信息处理系统将多个系统的数据采用
OCR
处理和自然语言处理后得到的语义信息,与多个系统实时监控的监控视频分析得到的语义信息进行对比,当监控视频表征的语义信息与数据表征的语义信息一致时,将数据表征的语义信息输出,由此提高了
OCR
识别的准确性,进而有效解决了仅采用
OCR
对数据进行处理后得到的识别结果不准确的问题

[0035]上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的

特征和优点能够
更明显易懂,以下特举本公开的具体实施方式

附图说明
[0036]为了更清楚地说明本公开实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

需要说明的是,附图中的比例仅作为示意并不代表实际比例...

【技术保护点】

【技术特征摘要】
1.
一种数据处理的系统,其中,所述系统包括:
OCR
系统,用于获取多个系统的数据并进行
OCR
处理,得到
OCR
识别结果;视频监控系统,用于对所述多个系统实时监控得到的监控视频进行分析,得到监控视频表征的语义信息;自然语言处理系统,用于对所述
OCR
识别结果进行自然语言处理,得到数据表征的语义信息;信息处理系统,用于对所述监控视频表征的语义信息和所述数据表征的语义信息进行判断;当所述监控视频表征的语义信息与所述数据表征的语义信息相匹配时,用于将所述数据表征的语义信息输出至信息库
。2.
根据权利要求1所述的系统,其中,所述信息处理系统还用于:当所述监控视频表征的语义信息与所述数据表征的语义信息不匹配时,将所述监控视频表征的语义信息输出至所述信息库
。3.
根据权利要求1所述的系统,其中,当所述监控视频表征的语义信息与所述数据表征的语义信息相匹配时,用于将所述数据表征的语义信息输出至信息库,包括:当判断出所述监控视频表征的语义信息与所述数据表征的语义信息相匹配后,将所述数据表征的语义信息进行自定义,将自定义后的所述数据表征的语义信息相互进行关联,将关联后的所述数据表征的语义信息输出至信息库进行存储
。4.
根据权利要求1所述的系统,其中,所述获取多个系统的数据并进行
OCR
处理,得到
OCR
识别结果,包括:将所述多个系统的数据进行清洗和预处理;将清洗和预处理后的数据进行文字定位和识别,得到所述
OCR
识别结果
。5.
根据权利要求3所述的系统,其中,将自定义后的所述数据表征的语义信息相互进行关联,包括:将所述自定义后的所述数据表征的语义信息进行识别切割;根据所述识别切割的结果,对相关的所述数据表征的...

【专利技术属性】
技术研发人员:陈友明陈思竹唐刚陈聪
申请(专利权)人:四川弘和数智集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1