System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据异常识别模型训练方法、数据异常识别方法和装置制造方法及图纸_技高网

数据异常识别模型训练方法、数据异常识别方法和装置制造方法及图纸

技术编号:44451100 阅读:2 留言:0更新日期:2025-02-28 18:55
本公开的实施例公开了数据异常识别模型训练方法、数据异常识别方法和装置。该方法的一具体实施方式包括:确定初始异常识别配置信息和初始异常特征识别引导信息;基于选取的样本价值生成数据,执行以下训练步骤:将样本价值生成数据输入初始异常特征信息生成模型;对样本数据异常特征信息进行异常识别处理;将数据异常标签信息和样本数据异常信息进行比较;响应于确定比较结果满足训练完成条件,确定异常识别配置信息、异常特征识别引导信息、异常特征信息生成模型和数据异常识别模型。该实施方式与人工智能有关,可以提高识别异常价值生成数据的准确性,减少异常价值数据误报或漏报的次数。

【技术实现步骤摘要】

本公开的实施例涉及计算机,具体涉及数据异常识别模型训练方法、数据异常识别方法和装置


技术介绍

1、随着人工智能的普及,通过价值生成数据(例如计费数据)异常识别技术可以及时检测存在异常的价值生成数据。目前,在对价值生成数据进行异常识别时,通常采用的方式为:通过预先训练的lightgbm(light gradient boosting machine)机器学习模型进行异常识别。

2、然而,专利技术人发现,当采用上述方式对价值生成数据进行异常识别时,经常会存在如下技术问题:实际应用场景多样,lightgbm机器学习模型预先通过训练样本得到固定的阈值或规则进行异常识别,造成适用的应用场景较少,导致识别异常价值生成数据的准确性较低,从而造成异常价值数据误报或漏报的次数较多。

3、该
技术介绍
部分中所公开的以上信息仅用于增强对本公开构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。

2、本公开的一些实施例提出了数据异常识别模型训练方法、数据异常识别方法和装置、电子设备、计算机可读介质和程序产品,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。

3、第一方面,本公开的一些实施例提供了一种数据异常识别模型训练方法,该方法包括:确定对应价值生成业务的初始异常识别配置信息和初始异常特征识别引导信息;基于从样本价值生成数据集中选取的样本价值生成数据,执行以下训练步骤:将样本价值生成数据输入对应初始异常特征识别引导信息的初始异常特征信息生成模型,得到样本数据异常特征信息,其中,上述样本价值生成数据集对应上述价值生成业务;根据对应初始异常识别配置信息的初始数据异常识别模型,对上述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息;将对应样本价值生成数据的数据异常标签信息和上述样本数据异常信息进行比较,得到比较结果;响应于确定上述比较结果满足训练完成条件,将初始异常识别配置信息、初始异常特征识别引导信息、初始异常特征信息生成模型和初始数据异常识别模型分别确定为异常识别配置信息、异常特征识别引导信息、异常特征信息生成模型和数据异常识别模型。

4、可选地,上述初始数据异常识别模型包括原因信息生成子模型和对应初始异常识别配置信息的异常类型生成子模型;以及上述根据对应初始异常识别配置信息的初始数据异常识别模型,对上述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息,包括:将上述样本数据异常特征信息输入上述异常类型生成子模型,得到样本数据异常类型;响应于确定上述样本数据异常类型满足预设异常类型条件,将上述样本数据异常特征信息输入原因信息生成子模型,得到样本异常原因信息;将上述样本数据异常类型和上述样本异常原因信息确定为样本数据异常信息。

5、可选地,上述初始数据异常识别模型包括各个异常类型生成子模型;以及上述根据对应初始异常识别配置信息的初始数据异常识别模型,对上述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息,包括:将上述各个异常类型生成子模型中对应初始异常识别配置信息的各个异常类型生成子模型确定为各个目标异常类型生成子模型;将上述样本数据异常特征信息分别输入各个目标异常类型生成子模型中,得到样本异常识别结果信息集;根据上述样本异常识别结果信息集,确定样本数据异常类型。

6、可选地,上述训练步骤还包括:响应于确定上述比较结果不满足上述训练完成条件,执行以下步骤:根据上述比较结果和上述选取的样本价值生成数据,对初始异常特征识别引导信息、初始异常特征信息生成模型、初始异常识别配置信息和初始数据异常识别模型进行更新处理;从上述样本价值生成数据集中重新选取样本价值生成数据;基于更新后的初始异常识别配置信息、初始异常特征识别引导信息、初始异常特征信息生成模型和初始数据异常识别模型,以及重新选取的样本价值生成数据,再次执行上述训练步骤。

7、可选地,上述根据上述比较结果和上述选取的样本价值生成数据,对初始异常特征识别引导信息、初始异常特征信息生成模型、初始异常识别配置信息和初始数据异常识别模型进行更新处理,包括:对对应初始异常特征识别引导信息的初始异常特征信息生成模型和初始数据异常识别模型进行调参处理;对上述选取的样本价值生成数据对应的各个订单信息进行编码处理,得到至少一个订单状态向量;对初始异常识别配置信息和上述比较结果进行编码处理,得到元数据状态向量;对于上述至少一个订单状态向量包括的每个订单状态向量,将上述订单状态向量和上述元数据状态向量进行拼接处理,得到目标状态向量;将所得到的各个目标状态向量输入预先训练的更新异常识别配置信息生成模型,得到更新异常识别配置信息;根据上述更新异常识别配置信息,对初始异常识别配置信息进行更新处理。

8、可选地,在上述基于所获取的每个样本价值生成数据,执行以下训练步骤之前,上述方法还包括:获取样本价值生成数据集作为初始样本价值生成数据集;对上述初始样本价值生成数据集中的各个初始样本价值生成数据进行解析处理;对解析后的各个初始样本价值生成数据进行转换处理,得到样本价值生成数据集。

9、可选地,上述方法还包括:获取对应上述异常特征信息生成模型和上述数据异常识别模型的反馈数据异常信息集;根据上述反馈数据异常信息集,生成模型评估信息;根据上述模型评估信息,对上述异常特征信息生成模型和上述数据异常识别模型进行更新处理。

10、第二方面,本公开的一些实施例提供了一种数据异常识别方法,该方法包括:将价值生成数据输入对应异常特征识别引导信息的异常特征信息生成模型,得到数据异常特征信息,其中,上述异常特征识别引导信息和上述异常特征信息生成模型是通过如上述第一方面任一实现方式所描述的方法确定的;将上述数据异常特征信息输入对应异常识别配置信息的数据异常识别模型得到数据异常信息,其中,上述异常识别配置信息和上述数据异常识别模型是通过上述第一方面任一实现方式所描述的方法确定的。

11、可选地,上述方法还包括:控制相关联的显示设备显示上述数据异常信息。

12、第三方面,本公开的一些实施例提供了一种数据异常识别模型训练装置,装置包括:确定单元,被配置成确定对应价值生成业务的初始异常识别配置信息和初始异常特征识别引导信息;执行单元,被配置成基于从样本价值生成数据集中选取的样本价值生成数据,执行以下训练步骤:将样本价值生成数据输入对应初始异常特征识别引导信息的初始异常特征信息生成模型,得到样本数据异常特征信息,其中,上述样本价值生成数据集对应上述价值生成业务;根据对应初始异常识别配置信息的初始数据异常识别模型,对上述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息;将对应样本价值生成数据的数据异常标签信息和本文档来自技高网...

【技术保护点】

1.一种数据异常识别模型训练方法,包括:

2.根据权利要求1所述的方法,其中,所述初始数据异常识别模型包括原因信息生成子模型和对应初始异常识别配置信息的异常类型生成子模型;以及所述根据对应初始异常识别配置信息的初始数据异常识别模型,对所述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息,包括:

3.根据权利要求1所述的方法,其中,所述初始数据异常识别模型包括各个异常类型生成子模型;以及所述根据对应初始异常识别配置信息的初始数据异常识别模型,对所述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息,包括:

4.根据权利要求1所述的方法,其中,所述训练步骤还包括:

5.根据权利要求4所述的方法,其中,所述根据所述比较结果和所选取的样本价值生成数据,对初始异常特征识别引导信息、初始异常特征信息生成模型、初始异常识别配置信息和初始数据异常识别模型进行更新处理,包括:

6.根据权利要求1所述的方法,其中,在所述基于所获取的每个样本价值生成数据,执行以下训练步骤之前,所述方法还包括:

7.根据权利要求1-6之一所述的方法,其中,所述方法还包括:

8.一种数据异常识别方法,包括:

9.根据权利要求8所述的方法,其中,所述方法还包括:

10.一种数据异常识别模型训练装置,包括:

11.一种数据异常识别装置,包括:

12.一种电子设备,包括:

13.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-7或8-9中任一所述的方法。

14.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7或8-9中任一项所述的方法。

...

【技术特征摘要】

1.一种数据异常识别模型训练方法,包括:

2.根据权利要求1所述的方法,其中,所述初始数据异常识别模型包括原因信息生成子模型和对应初始异常识别配置信息的异常类型生成子模型;以及所述根据对应初始异常识别配置信息的初始数据异常识别模型,对所述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息,包括:

3.根据权利要求1所述的方法,其中,所述初始数据异常识别模型包括各个异常类型生成子模型;以及所述根据对应初始异常识别配置信息的初始数据异常识别模型,对所述样本数据异常特征信息进行异常识别处理,得到样本数据异常信息,包括:

4.根据权利要求1所述的方法,其中,所述训练步骤还包括:

5.根据权利要求4所述的方法,其中,所述根据所述比较结果和所选取的样本价值生成数据,对初始异常特征识别引导信息、初始异常特征信息生成模型、初始异常识别配...

【专利技术属性】
技术研发人员:郝素雅
申请(专利权)人:北京京东远升科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1