数据校验方法、装置、电子设备及存储介质制造方法及图纸

技术编号:28792790 阅读:22 留言:0更新日期:2021-06-09 11:30
本发明专利技术涉及人工智能技术领域,提供一种数据校验方法、装置、电子设备及存储介质,所述方法包括:加载校验请求中的多个目标待校验数据至EXCEL模板中;读取EXCEL模板的规则栏对应的每个单元格的关键字段;将每个单元格的关键字段输入至预先训练好的BERT模型中,并获取BERT模型输出的每个单元格的规则属性;对所有单元格的规则属性进行合并得到EXCEL模板的校验规则表;根据校验规则表对EXCEL模板中的每个单元格中的目标待校验数据进行校验。本发明专利技术通过BERT模型输出的每个单元格的规则属性,不需要编码维护每个单元格的规则属性,确保了每个单元格的规则属性的准确性,进而提高了数据校验的效率和准确率。的效率和准确率。的效率和准确率。

【技术实现步骤摘要】
数据校验方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,具体涉及一种数据校验方法、装置、电子设备及存储介质。

技术介绍

[0002]EXCEL文件能够方便的制作出各种表格,被广泛使用,现有技术将EXCEL文件导入数据库的时候,需要花费大量的时间以及编写代码对EXCEL文件中的单元格的规则属性进行校验。
[0003]然而,由于EXCEL文件的单元格规则属性复杂度高,编写代码过程中容易出现错误,无法确保单元格的规则属性的准确性,导致数据校验的效率和准确率低。
[0004]因此,有必要提供一种快速准确的数据校验方法。

技术实现思路

[0005]鉴于以上内容,有必要提出一种数据校验方法、装置、电子设备及存储介质,通过BERT模型输出的每个单元格的规则属性,不需要编码维护每个单元格的规则属性,确保了每个单元格的规则属性的准确性,进而提高了数据校验的效率和准确率。
[0006]本专利技术的第一方面提供一种数据校验方法,所述方法包括:
[0007]加载校验请求中的多个目标待校验数据至EXCEL模板中;
[0008]读取所述EXCEL模板的规则栏对应的每个单元格的关键字段;
[0009]将所述每个单元格的关键字段输入至预先训练好的BERT模型中,并获取所述BERT模型输出的每个单元格的规则属性;
[0010]对所有单元格的规则属性进行合并得到所述EXCEL模板的校验规则表;
[0011]根据所述校验规则表对所述EXCEL模板中的每个单元格中的目标待校验数据进行校验。
[0012]可选地,所述将所述每个单元格的关键字段输入至预先训练好的BERT模型中,并获取所述BERT模型输出的每个单元格的规则属性包括:
[0013]对每个单元格的关键字段进行分词处理得到词块嵌入;
[0014]根据所述每个单元格的关键字段的上下文关系获取每个词块的段号嵌入及每个词块的位置嵌入;
[0015]将所述词块嵌入、所述段号嵌入及所述位置嵌入叠加形成词嵌入向量;
[0016]将所述词嵌入向量输入至预先训练好的BERT模型中进行语义识别得到目标词向量;
[0017]将所述目标词向量输入预设的命名实体属性识别模型中进行命名实体属性识别,得到每个单元格的规则属性。
[0018]可选地,所述对所有单元格的规则属性进行合并得到所述EXCEL模板的校验规则表包括:
[0019]对所述所有单元格的规则属性按照每个所述单元格的位置坐标进行合并得到所述EXCEL模板的校验规则表。
[0020]可选地,所述根据所述校验规则表对所述EXCEL模板中的每个单元格中的目标待校验数据进行校验包括:
[0021]获取所述EXCEL模板中的每个单元格中的目标待校验数据对应的目标位置坐标;
[0022]根据所述目标位置坐标从所述校验规则表中获取每个单元格对应的规则属性;
[0023]按照每个单元格的规则属性对对应单元格中的目标待校验数据进行校验。
[0024]可选地,所述方法还包括:
[0025]当每个单元格中的目标待校验数据满足对应的单元格的规则属性要求时,确定校验结果为所述每个单元格中的目标待校验数据校验成功;或者
[0026]当每个单元格中的目标待校验数据不满足对应的单元格的规则属性要求时,确定校验结果为所述每个单元格中的目标待校验数据校验失败。
[0027]可选地,所述加载校验请求中的多个目标待校验数据至EXCEL模板中包括:
[0028]接收请求人发送的校验请求;
[0029]解析所述校验请求获取EXCEL模板名称、多个初始待校验数据及每个所述初始待校验数据对应的第一位置坐标;
[0030]从预设数据库中确定出与所述EXCEL模板名称对应的EXCEL模板;
[0031]对每个所述初始待校验数据按照预设的转换规则进行转换得到每个目标待校验数据;
[0032]从所述EXCEl模板中确定出与所述第一位置坐标匹配的第二位置坐标;
[0033]将所述每个目标待校验数据写入所述EXCEL模板对应的第二位置坐标中。
[0034]可选地,所述方法还包括:
[0035]根据所述EXCEL模板名称确定对应的业务工作表;
[0036]从校验结果中选取校验成功的目标待校验数据,并获取所述校验成功的目标待校验数据对应的第一目标单元格;
[0037]从所述业务工作表中确定出与所述第一目标单元格匹配的第二目标单元格;
[0038]根据所述第二目标单元格对应的读逻辑,从所述EXCEL模板中读取所述第一目标单元格对应的校验成功的目标待校验数据;
[0039]根据所述第二目标单元格的预设的数据格式将读取到的所述校验成功的目标待校验数据转换为目标业务数据,并将所述目标业务数据写入所述业务工作表对应的第二目标单元格中。
[0040]本专利技术的第二方面提供一种数据校验装置,所述装置包括:
[0041]加载模块,用于加载校验请求中的多个目标待校验数据至EXCEL模板中;
[0042]读取模块,用于读取所述EXCEL模板的规则栏对应的每个单元格的关键字段;
[0043]输入模块,用于将所述每个单元格的关键字段输入至预先训练好的BERT模型中,并获取所述BERT模型输出的每个单元格的规则属性;
[0044]合并模块,用于对所有单元格的规则属性进行合并得到所述EXCEL模板的校验规则表;
[0045]校验模块,用于根据所述校验规则表对所述EXCEL模板中的每个单元格中的目标
待校验数据进行校验。
[0046]本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的数据校验方法。
[0047]本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的数据校验方法。
[0048]综上所述,本专利技术所述的数据校验方法、装置、电子设备及存储介质,一方面,通过将所述每个单元格的关键字段输入至预先训练好的BERT模型中,并获取所述BERT模型输出的每个单元格的规则属性,不需要花费人力去维护每个单元格的规则属性,直接使用完善的模型算法进行每个单元格的规则属性的维护,进一步提高了每个单元格的规则属性的维护效率,提高了数据校验的效率和准确率;另一方面,通过对所有单元格的规则属性进行合并得到所述EXCEL模板的校验规则表,便于后期进行维护时,根据每个单元格的位置坐标快速的定位出对应的单元格的规则属性,提高了规则属性的维护效率;最后,根据所述校验规则表对所述EXCEL模板中的每个单元格中的目标待校验数据进行校验,不同的单元格对应不同的校验规则,对每个单元格中的目标待校验数据通过对应的规则属性进行校验,提高了数据校验的准确率。
附图说明
[0049本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据校验方法,其特征在于,所述方法包括:加载校验请求中的多个目标待校验数据至EXCEL模板中;读取所述EXCEL模板的规则栏对应的每个单元格的关键字段;将所述每个单元格的关键字段输入至预先训练好的BERT模型中,并获取所述BERT模型输出的每个单元格的规则属性;对所有单元格的规则属性进行合并得到所述EXCEL模板的校验规则表;根据所述校验规则表对所述EXCEL模板中的每个单元格中的目标待校验数据进行校验。2.如权利要求1所述的数据校验方法,其特征在于,所述将所述每个单元格的关键字段输入至预先训练好的BERT模型中,并获取所述BERT模型输出的每个单元格的规则属性包括:对每个单元格的关键字段进行分词处理得到词块嵌入;根据所述每个单元格的关键字段的上下文关系获取每个词块的段号嵌入及每个词块的位置嵌入;将所述词块嵌入、所述段号嵌入及所述位置嵌入叠加形成词嵌入向量;将所述词嵌入向量输入至预先训练好的BERT模型中进行语义识别得到目标词向量;将所述目标词向量输入预设的命名实体属性识别模型中进行命名实体属性识别,得到每个单元格的规则属性。3.如权利要求1所述的数据校验方法,其特征在于,所述对所有单元格的规则属性进行合并得到所述EXCEL模板的校验规则表包括:对所述所有单元格的规则属性按照每个所述单元格的位置坐标进行合并得到所述EXCEL模板的校验规则表。4.如权利要求1所述的数据校验方法,其特征在于,所述根据所述校验规则表对所述EXCEL模板中的每个单元格中的目标待校验数据进行校验包括:获取所述EXCEL模板中的每个单元格中的目标待校验数据对应的目标位置坐标;根据所述目标位置坐标从所述校验规则表中获取每个单元格对应的规则属性;按照每个单元格的规则属性对对应单元格中的目标待校验数据进行校验。5.如权利要求4所述的数据校验方法,其特征在于,所述方法还包括:当每个单元格中的目标待校验数据满足对应单元格的规则属性要求时,确定校验结果为所述每个单元格中的目标待校验数据校验成功;或者当每个单元格中的目标待校验数据不满足对应单元格的规则属性要求时,确定校验结果为所述每个单元格中的目标待校验数据校验失败。6.如权利要求1所述的数据校验方法,其特...

【专利技术属性】
技术研发人员:林卫鍊李敏
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1