System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 异常业务识别模型的训练方法、装置、计算机设备、可读存储介质和程序产品制造方法及图纸_技高网

异常业务识别模型的训练方法、装置、计算机设备、可读存储介质和程序产品制造方法及图纸

技术编号:44425473 阅读:0 留言:0更新日期:2025-02-28 18:39
本申请涉及一种异常业务识别模型的训练方法、装置、计算机设备、可读存储介质和程序产品。通过初始业务信息负样本和初始业务信息正样本对待训练的异常业务识别模型进行第一训练,基于第一训练得到的第一异常业务识别模型对无标签的业务信息样本进行识别,得到对应的业务类型识别结果,基于业务类型识别结果和数据集,对第一异常业务识别模型进行第二训练,直至满足预设训练结束条件时,得到经训练的异常业务识别模型。相较于传统的通过大量明确标注的正负样本进行训练,本方案通过结合有标签的初始样本以及无标签样本,对异常业务识别模型进行多种迭代训练,减少了对标签样本的需求,提高了异常业务识别模型的训练效率。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种异常业务识别模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、随着业务规模的发展,目前金融业务已经广泛融入到人们的生活中。为满足用户的金融业务需求,需要对金融业务进行管理。在用户办理金融业务时,存在以虚假原因进行不正常的业务办理的情况,为保证企业和用户的业务处理安全性,需要对异常的业务进行准确识别。目前对异常业务进行识别的方式通常是通过人工智能模型进行识别。然而,目前的人工智能模型需要使用大量明确标注的正负样本进行训练,导致模型的训练效率降低。

2、因此,目前对识别异常业务的模型的训练方法存在训练效率低的缺陷。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高模型训练效率的异常业务识别模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种异常业务识别模型的训练方法,所述方法包括:

3、获取待训练的异常业务识别模型和对应的数据集;所述数据集包括携带负样本标签的初始业务信息负样本和携带正样本标签的初始业务信息正样本;

4、基于所述数据集中的所述初始业务信息负样本和所述初始业务信息正样本,对所述异常业务识别模型进行第一训练,得到第一异常业务识别模型;

5、获取无标签的业务信息样本,将所述业务信息样本输入所述第一异常业务识别模型,由所述第一异常业务识别模型基于所述业务信息样本输出对应的业务类型识别结果;

6、根据所述业务类型识别结果和所述数据集,对所述第一异常业务识别模型进行第二训练,直至满足预设训练结束条件时,得到经训练的异常业务识别模型。

7、在其中一个实施例中,获取待训练的异常业务识别对应的数据集的步骤,包括:

8、获取无标签的各个业务信息样本和携带正样本标签的各个初始业务信息正样本;

9、根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本并添加负样本标签,得到携带负样本标签的各个初始业务信息负样本;

10、根据各个所述初始业务信息负样本和各个所述初始业务信息正样本,生成所述数据集。

11、在其中一个实施例中,所述根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本,包括:

12、将各个所述业务信息样本标记为各个候选业务信息负样本,根据各个所述候选业务信息负样本构建分类器;

13、由所述分类器根据各个所述业务信息样本的异常信息进行分类,根据所述分类的结果确定各个所述初始业务信息负样本并添加负样本标签,得到携带负样本标签的各个初始业务信息负样本。

14、在其中一个实施例中,所述根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本,包括:

15、根据预设经验库和各个所述业务信息样本的各个异常信息,对各个所述业务信息样本进行评分,得到各个所述业务信息样本对应的各个样本评分;

16、根据所述样本评分确定各个所述初始业务信息负样本。

17、在其中一个实施例中,所述将所述业务信息样本输入所述第一异常业务识别模型,由所述第一异常业务识别模型基于所述业务信息样本输出对应的业务类型识别结果,包括:

18、将所述业务信息样本输入所述第一异常业务识别模型,由所述第一异常业务识别模型识别所述业务信息样本对应的业务类型以及所述业务类型对应的置信度;

19、根据所述业务类型确定对应的预测标签;

20、根据所述预测标签以及所述置信度,输出所述业务信息样本对应的业务类型识别结果。

21、在其中一个实施例中,所述根据所述业务类型识别结果和所述数据集,对所述第一异常业务识别模型进行第二训练,直至满足预设训练结束条件时,得到经训练的异常业务识别模型,包括:

22、根据所述业务类型识别结果,确定所述置信度大于预设阈值的目标业务信息样本;

23、根据携带所述预测标签的所述目标业务信息样本扩充所述数据集,得到新的数据集;

24、将新的所述数据集输入所述第一异常业务识别模型,由所述第一异常业务识别模型基于新的所述数据集输出新的业务类型识别结果;

25、根据新的所述业务类型识别结果调整所述第一异常业务识别模型的模型参数,并返回根据所述业务类型识别结果,确定所述置信度大于预设阈值的目标业务信息样本的步骤,直至满足所述预设训练结束条件时,得到经训练的异常业务识别模型。

26、第二方面,本申请提供了一种异常业务识别模型的训练装置,所述装置包括:

27、获取模块,用于获取待训练的异常业务识别模型和对应的数据集;所述数据集包括携带负样本标签的初始业务信息负样本和携带正样本标签的初始业务信息正样本;

28、第一训练模块,用于基于所述数据集中的所述初始业务信息负样本和所述初始业务信息正样本,对所述异常业务识别模型进行第一训练,得到第一异常业务识别模型;

29、输入模块,用于获取无标签的业务信息样本,将所述业务信息样本输入所述第一异常业务识别模型,由所述第一异常业务识别模型基于所述业务信息样本输出对应的业务类型识别结果;

30、第二训练模块,用于根据所述业务类型识别结果和所述数据集,对所述第一异常业务识别模型进行第二训练,直至满足预设训练结束条件时,得到经训练的异常业务识别模型。

31、第三方面,本申请提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。

32、第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

33、第五方面,本申请提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。

34、上述异常业务识别模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过初始业务信息负样本和初始业务信息正样本对待训练的异常业务识别模型进行第一训练,基于第一训练得到的第一异常业务识别模型对无标签的业务信息样本进行识别,得到对应的业务类型识别结果,基于业务类型识别结果和数据集,对第一异常业务识别模型进行第二训练,直至满足预设训练结束条件时,得到经训练的异常业务识别模型。相较于传统的通过大量明确标注的正负样本进行训练,本方案通过结合有标签的初始样本以及无标签样本,对异常业务识别模型进行多种迭代训练,减少了对标签样本的需求,提高了异常业务识别模型的训练效率。

本文档来自技高网...

【技术保护点】

1.一种异常业务识别模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取待训练的异常业务识别对应的数据集的步骤,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本,包括:

4.根据权利要求2所述的方法,其特征在于,所述根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本,包括:

5.根据权利要求1至4任意一项所述的方法,其特征在于,所述将所述业务信息样本输入所述第一异常业务识别模型,由所述第一异常业务识别模型基于所述业务信息样本输出对应的业务类型识别结果,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述业务类型识别结果和所述数据集,对所述第一异常业务识别模型进行第二训练,直至满足预设训练结束条件时,得到经训练的异常业务识别模型,包括:

7.一种异常业务识别模型的训练装置,其特征在于,所述装置包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种异常业务识别模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取待训练的异常业务识别对应的数据集的步骤,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本,包括:

4.根据权利要求2所述的方法,其特征在于,所述根据各个所述业务信息样本的异常信息,确定各个所述业务信息样本中的各个初始业务信息负样本,包括:

5.根据权利要求1至4任意一项所述的方法,其特征在于,所述将所述业务信息样本输入所述第一异常业务识别模型,由所述第一异常业务识别模型基于所述业务信息样本输出对应的业务类型识别结果,包括:

6.根据权利要求...

【专利技术属性】
技术研发人员:郭江涛秦宗国
申请(专利权)人:中国人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1