数据核查知识图谱模型生成方法、数据核查方法和装置制造方法及图纸

技术编号:38209584 阅读:7 留言:0更新日期:2023-07-21 17:00
本发明专利技术提供一种数据核查知识图谱模型生成方法、数据核查方法和装置,属于数据处理技术领域。所述数据核查方法,通过获取知识图谱模型;获取待核查目标的XDR数据;根据所述知识图谱模型中的字段名,至少从所述待核查目标的XDR数据中提取与所述字段名对应的第二信息;根据所述第二信息以及所述知识图谱模型节点,生成实际知识图谱;根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的核查结果;其中,所述知识图谱模型为根据本发明专利技术实施例提供的数据核查知识图谱模型生成方法生成的知识图谱模型;通过知识图谱来进行XDR核查,能够提高核查结果的逻辑性和可解释性,并且能够降低人工维护成本。人工维护成本。人工维护成本。

【技术实现步骤摘要】
数据核查知识图谱模型生成方法、数据核查方法和装置


[0001]本专利技术涉及数据处理
,尤其涉及一种数据核查知识图谱模型生成方法、数据核查方法和装置。

技术介绍

[0002]为了保证用户的通信体验,分析用户不能上网、上网体验差等问题,进行统一DPI(Deep Packet Inspection,深度包检测)是十分常见的方式。统一DPI系统的信令面会记录网络和用户之间的控制和反馈信息(原始码流),由于这些原始码流信息量大且种类多,统一DPI系统会将每段信息转化为1个XDR(X Data Recording,流量日志)信息,对这些XDR信息进行核查。
[0003]现有技术中,XDR核查主要是对原始码流进行核查,这种方式只能针对本接口和流程进行核查,并且,部分字段无法通过码流进行核查,或者在原始码流缺失的情况下无法进行核查。目前针对上述问题通常采用人工规则配置或者是机器学习的方式解决,但前者存在人力成本较高的问题,后者存在可解释性差结论缺乏说服力的问题。

技术实现思路

[0004]本专利技术提出了一种数据核查知识图谱模型生成方法、数据核查方法和装置,以解决现有技术存在的技术问题,提高XDR数据核查效率,增强核查结果的逻辑性。
[0005]为了解决上述技术问题,本专利技术是这样实现的:
[0006]第一方面,本专利技术实施例提供了一种数据核查知识图谱模型生成方法,包括:
[0007]根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息,其中,所述知识图谱构建表包括根据训练场景预设的多个字段名;
[0008]根据所述第一信息,形成多个知识图谱节点;
[0009]根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系;
[0010]根据所述所有知识图谱节点之间的关系,生成知识图谱模型。
[0011]可选的,在所述根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息之前,还包括:
[0012]对所述原始码流进行解析,获取解析后的原始码流,所述解析后的原始码流为xml格式;
[0013]对所述XDR数据进行解析,获取解析后的XDR数据,所述解析后的XDR数据为csv格式。
[0014]可选的,所述方法还包括:
[0015]根据预设的字段名映射表,统一所述解析后的原始码流、所述解析后的XDR数据以及所述知识图谱构建表中相同字段的字段名。
[0016]可选的,所述根据所述第一信息,形成多个知识图谱节点之后,还包括:
[0017]根据所述所有知识图谱节点和所述第一信息,对于存在约束规则的知识图谱节点,形成所述知识图谱节点的约束规则集。
[0018]可选的,所述根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系,包括:
[0019]对于存在包含关系的知识图谱节点,形成所述存在包含关系的知识图谱节点的关联关系;
[0020]对于存在触发关系的知识图谱节点,形成所述存在触发关系的知识图谱节点的关联关系;
[0021]对于存在约束关系的知识图谱节点,形成所述存在约束关系的知识图谱节点的关联关系。
[0022]第二方面,本专利技术实施例提供了一种数据核查方法,包括:
[0023]获取知识图谱模型,所述知识图谱模型为根据本专利技术实施例提供的数据核查知识图谱模型生成方法生成的知识图谱模型;
[0024]获取待核查目标的XDR数据;
[0025]根据所述知识图谱模型中的字段名,至少从所述待核查目标的XDR数据中提取与所述字段名对应的第二信息,其中,所述第二信息包括每个字段名的信息合集;
[0026]根据所述第二信息以及所述知识图谱模型节点,生成实际知识图谱;
[0027]根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的核查结果。
[0028]可选的,所述获取第二信息还包括:
[0029]若能够获取所述待核查目标的原始码流,则根据所述知识图谱模型中的字段名,从所述待核查目标的原始码流和所述待核查目标的XDR数据中提取与所述字段名对应的所述第二信息。
[0030]可选的,在根据所述知识图谱模型中的字段名,从所述待核查目标的原始码流和所述待核查目标的XDR数据中提取与所述字段名对应的所述第二信息之前,还包括:
[0031]对所述XDR数据进行解析,获取解析后的XDR数据,所述解析后的XDR数据为csv格式;
[0032]对所述原始码流进行解析,获取解析后的原始码流,所述解析后的原始码流为xml格式。
[0033]可选的,所述根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的核查结果,包括:
[0034]若对比所述实际知识图谱和所述知识图谱模型,存在以下任一种情况,则存在节点冲突:
[0035]知识图谱节点种类的数量不一致;
[0036]相对应的知识图谱节点之间的约束关系不同;
[0037]相对应的知识图谱节点不符合约束规则。
[0038]可选的,所述根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的核查结果,还包括:
[0039]若存在节点冲突的情况,对所述待核查目标的原始码流进行验证,以所述待核查
目标的原始码流中记载的字段信息为准。
[0040]第三方面,本专利技术实施例提供了一种数据核查知识图谱模型生成装置,所述模型生成装置包括:
[0041]信息提取模块,用于根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息,其中,所述知识图谱构建表包括根据训练场景预设的多个字段名;
[0042]知识图谱解析模块,用于根据所述第一信息,形成多个知识图谱节点;
[0043]知识图谱训练模块,用于根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系;
[0044]知识图谱生成模块,用于根据所述所有知识图谱节点之间的关系,生成知识图谱模型。
[0045]第四方面,本专利技术实施例提供了一种数据核查装置,包括:
[0046]模型获取模块,用于获取知识图谱模型,所述知识图谱模型为根据本专利技术实施例提供的数据核查知识图谱模型生成方法生成的知识图谱模型;
[0047]数据获取模块,用于获取待核查目标的XDR数据;
[0048]信息提取模块,至少从所述待核查目标的XDR数据中提取与所述字段名对应的第二信息,其中,所述第二信息包括每个字段名的信息合集;
[0049]知识图谱生成模块,用于根据所述第二信息以及所述知识图谱模型节点,生成实际知识图谱;
[0050]推理分析模块,用于根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据核查知识图谱模型生成方法,其特征在于,包括:根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息,其中,所述知识图谱构建表包括根据训练场景预设的多个字段名;根据所述第一信息,形成多个知识图谱节点;根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系;根据所述所有知识图谱节点之间的关系,生成知识图谱模型。2.根据权利要求1所述的数据核查知识图谱模型生成方法,其特征在于,在所述根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息之前,还包括:对所述原始码流进行解析,获取解析后的原始码流,所述解析后的原始码流为xml格式;对所述XDR数据进行解析,获取解析后的XDR数据,所述解析后的XDR数据为csv格式。3.根据权利要求2所述的数据核查知识图谱模型生成方法,其特征在于,所述方法还包括:根据预设的字段名映射表,统一所述解析后的原始码流、所述解析后的XDR数据以及所述知识图谱构建表中相同字段的字段名。4.根据权利要求1所述的数据核查知识图谱模型生成方法,其特征在于,所述根据所述第一信息,形成多个知识图谱节点之后,还包括:根据所述所有知识图谱节点和所述第一信息,对于存在约束规则的知识图谱节点,形成所述知识图谱节点的约束规则集。5.根据权利要求1所述的数据核查知识图谱模型生成方法,其特征在于,所述根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系,包括:对于存在包含关系的知识图谱节点,形成所述存在包含关系的知识图谱节点的关联关系;对于存在触发关系的知识图谱节点,形成所述存在触发关系的知识图谱节点的关联关系;对于存在约束关系的知识图谱节点,形成所述存在约束关系的知识图谱节点的关联关系。6.一种数据核查方法,其特征在于,包括:获取知识图谱模型,所述知识图谱模型为根据权利要求1

5任一项所述的数据核查知识图谱模型生成方法生成的知识图谱模型;获取待核查目标的XDR数据;根据所述知识图谱模型中的字段名,至少从所述待核查目标的XDR数据中提取与所述字段名对应的第二信息,其中,所述第二信息包括每个字段名的信息合集;根据所述第二信息以及所述知识图谱模型节点,生成实际知识图谱;根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的核查结果。7.根据权利要求6所述的数据核查方法,其特征在于,还包括:若能够获取所述待核查目标的原始码流,则根据所述知识图谱模型中的字段名,从所
述待核查目标的原始码流和所述待核查目标的XDR数据中提取与所述字段名对应的所述第二信息。8.根据权利要求7所述的数据核查方法,其特征在于,在根据所述知识图谱模型中的字段名,从所述待核查目标的原始码流和所述待核查目标的XDR数据中提取与所述字段名...

【专利技术属性】
技术研发人员:左一平余立杨晓陈彦徐敬文李哲刘舸
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1