【技术实现步骤摘要】
数据核查知识图谱模型生成方法、数据核查方法和装置
[0001]本专利技术涉及数据处理
,尤其涉及一种数据核查知识图谱模型生成方法、数据核查方法和装置。
技术介绍
[0002]为了保证用户的通信体验,分析用户不能上网、上网体验差等问题,进行统一DPI(Deep Packet Inspection,深度包检测)是十分常见的方式。统一DPI系统的信令面会记录网络和用户之间的控制和反馈信息(原始码流),由于这些原始码流信息量大且种类多,统一DPI系统会将每段信息转化为1个XDR(X Data Recording,流量日志)信息,对这些XDR信息进行核查。
[0003]现有技术中,XDR核查主要是对原始码流进行核查,这种方式只能针对本接口和流程进行核查,并且,部分字段无法通过码流进行核查,或者在原始码流缺失的情况下无法进行核查。目前针对上述问题通常采用人工规则配置或者是机器学习的方式解决,但前者存在人力成本较高的问题,后者存在可解释性差结论缺乏说服力的问题。
技术实现思路
[0004]本专利技术提出了一种数据核查知识图谱模型生成方法、数据核查方法和装置,以解决现有技术存在的技术问题,提高XDR数据核查效率,增强核查结果的逻辑性。
[0005]为了解决上述技术问题,本专利技术是这样实现的:
[0006]第一方面,本专利技术实施例提供了一种数据核查知识图谱模型生成方法,包括:
[0007]根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息,其中 ...
【技术保护点】
【技术特征摘要】
1.一种数据核查知识图谱模型生成方法,其特征在于,包括:根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息,其中,所述知识图谱构建表包括根据训练场景预设的多个字段名;根据所述第一信息,形成多个知识图谱节点;根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系;根据所述所有知识图谱节点之间的关系,生成知识图谱模型。2.根据权利要求1所述的数据核查知识图谱模型生成方法,其特征在于,在所述根据知识图谱构建表中的字段名,从原始码流和XDR数据中提取与所述字段名对应的第一信息之前,还包括:对所述原始码流进行解析,获取解析后的原始码流,所述解析后的原始码流为xml格式;对所述XDR数据进行解析,获取解析后的XDR数据,所述解析后的XDR数据为csv格式。3.根据权利要求2所述的数据核查知识图谱模型生成方法,其特征在于,所述方法还包括:根据预设的字段名映射表,统一所述解析后的原始码流、所述解析后的XDR数据以及所述知识图谱构建表中相同字段的字段名。4.根据权利要求1所述的数据核查知识图谱模型生成方法,其特征在于,所述根据所述第一信息,形成多个知识图谱节点之后,还包括:根据所述所有知识图谱节点和所述第一信息,对于存在约束规则的知识图谱节点,形成所述知识图谱节点的约束规则集。5.根据权利要求1所述的数据核查知识图谱模型生成方法,其特征在于,所述根据所有知识图谱节点和所述第一信息,学习所述所有知识图谱节点之间的关系,包括:对于存在包含关系的知识图谱节点,形成所述存在包含关系的知识图谱节点的关联关系;对于存在触发关系的知识图谱节点,形成所述存在触发关系的知识图谱节点的关联关系;对于存在约束关系的知识图谱节点,形成所述存在约束关系的知识图谱节点的关联关系。6.一种数据核查方法,其特征在于,包括:获取知识图谱模型,所述知识图谱模型为根据权利要求1
‑
5任一项所述的数据核查知识图谱模型生成方法生成的知识图谱模型;获取待核查目标的XDR数据;根据所述知识图谱模型中的字段名,至少从所述待核查目标的XDR数据中提取与所述字段名对应的第二信息,其中,所述第二信息包括每个字段名的信息合集;根据所述第二信息以及所述知识图谱模型节点,生成实际知识图谱;根据所述知识图谱模型,对所述实际知识图谱中各节点的值进行分析,根据分析结果生成所述待核查目标的核查结果。7.根据权利要求6所述的数据核查方法,其特征在于,还包括:若能够获取所述待核查目标的原始码流,则根据所述知识图谱模型中的字段名,从所
述待核查目标的原始码流和所述待核查目标的XDR数据中提取与所述字段名对应的所述第二信息。8.根据权利要求7所述的数据核查方法,其特征在于,在根据所述知识图谱模型中的字段名,从所述待核查目标的原始码流和所述待核查目标的XDR数据中提取与所述字段名...
【专利技术属性】
技术研发人员:左一平,余立,杨晓,陈彦,徐敬文,李哲,刘舸,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。