System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 异常业务数据确定方法、装置和设备制造方法及图纸_技高网

异常业务数据确定方法、装置和设备制造方法及图纸

技术编号:44077324 阅读:8 留言:0更新日期:2025-01-17 16:11
本公开提供了一种异常业务数据确定方法。可以应用于金融科技技术领域和信息安全技术领域。该方法包括:获取a个新增业务下载数据,将所述a个新增业务下载数据输入预先训练的并且调优后的空间聚类模型,输出b个非离群新增业务下载数据点,作为b个第一数据点,其中,每个第一数据点包括新增业务下载数据点的坐标。将所述b个第一数据点的坐标导入预先生成的第一密度可达图,生成第二密度可达图。基于所述第二密度可达图,从b个第一数据点中筛选出d个异常数据点,根据所述d个异常数据点,确定d个异常业务数据。

【技术实现步骤摘要】

本公开涉及金融科技,具体涉及信息安全,特别是涉及一种异常业务数据确定方法、装置、设备、介质和程序产品。


技术介绍

1、在包括银行在内的在企业和组织中,业务报表是决策和管理的重要依据。然而,业务报表通常包含敏感信息,如财务数据、客户信息等。因此,业务报表下载系统通常拥有强大的访问控制和身份认证机制,确保只有授权用户可以访问和下载报表,并防止非授权下载行为,防范数据泄露等各种安全风险。然而,对于已经取得授权的业务人员,如何定义他们下载的业务报表是工作需要的是十分困难的。通常,对业务报表下载行为进行分析依赖于专业人员通过业务规则和逻辑,人为捕捉这些复杂的信息,然后通过个人经验判断该业务报表下载行为是否是异常下载行为。此方法极度依赖专业人员的业务经验并要消耗业务人员大量的时间,工作效率及其低下。


技术实现思路

1、鉴于上述问题,本公开提供了一种异常业务数据确定方法、装置、设备、介质和程序产品。

2、根据本公开的第一个方面提供了一种异常业务数据确定方法,其特征在于,该方法包括:获取a个新增业务下载数据,将所述a个新增业务下载数据输入预先训练的并且调优后的空间聚类模型,输出b个非离群新增业务下载数据点,作为b个第一数据点,其中,每个第一数据点包括新增业务下载数据点的坐标,其中,a大于或等于2,b小于或等于a,且a和b都为正整数;将所述b个第一数据点的坐标导入预先生成的第一密度可达图,生成第二密度可达图;以及基于所述第二密度可达图,从b个第一数据点中筛选出d个异常数据点,根据所述d个异常数据点,确定d个异常业务数据,其中,d小于或等于b,且d为正整数。

3、根据本公开实施例,其特征在于,所述第一密度可达图中包括:历史业务下载数据点中的离群点坐标,所述基于所述第二密度可达图,从b个第一数据点中筛选出d个异常数据点,包括:从所述第二密度可达图中获取所述历史业务下载数据点中的离群点坐标的领域半径,生成多个第一历史数据点;从所述第二密度可达图中获取每个第一数据点领域半径内的多个第一历史数据点,生成与每个第一数据点对应的多个第二历史数据点;计算每个第一数据点与多个第二历史数据点的欧式距离,生成每个第一数据点的多个第一距离,其中,每个与第一数据点生成第一距离的第二历史数据点的领域半径不相同;获取每个与第一数据点生成第一距离的第二历史数据点的领域半径,生成多个第二距离,其中,所述第二距离和所述第一距离通过相同的历史数据点映射为一一对应的关系;判断每个第一数据点对应的多个第二历史数据点中,是否存在第一距离小于与其对应的第二距离的第二历史数据点,如果存在第一距离小于与其对应的第二距离的第二历史数据点,则获取存在第一距离小于与其对应的第二距离的第二历史数据点的c个第一数据点,生成c个第二数据点,其中,c小于或等于b,且c为正整数;获取每个第二数据点的第一距离小于与其对应的第二距离的第二历史数据点,生成每个第二数据点的相关数据点;以及基于每个第二数据点的相关数据点,从c个第二数据点中筛选出d个异常数据点,其中,d小于或等于c,且d为正整数。

4、根据本公开实施例,其特征在于,该方法还包括:将所述a个新增业务下载数据输入预先训练的并且调优后的空间聚类模型,输出e个离群新增业务下载数据点,其中,e为正整数,d与e的和等于a;以及根据所述e个离群新增业务下载数据点,确定e个异常业务数据。

5、根据本公开实施例,其特征在于,该方法还包括:获取不存在第一距离小于与其对应的第二距离的第二历史数据点的f个第一数据点,生成f个第三数据点,其中,f小于或等于b,且f为正整数;获取每个第三数据点领域半径内的第二历史数据点的数量,如果第三数据点领域半径内的第二历史数据点的数量大于或等于预设阈值,则从f个第三数据点获取领域半径内的第二历史数据点的数量大于或等于预设阈值的g个第三数据点,生成g个第四数据点,其中,g小于或等于f,且g为正整数;以及基于所述g个第四数据点,确定g个异常业务数据。

6、根据本公开实施例,其特征在于,所述每个第一历史数据点包括特征标签,该方法还包括:如果第三数据点领域半径内的第二历史数据点的数量小于预设阈值,则从f个第三数据点获取领域半径内的第二历史数据点的数量小于预设阈值的h个第三数据点,生成h个第五数据点,其中h与g的和等于f,h为正整数;以及获取每个第五数据点领域半径内的第二历史数据点的特征标签并进行累加,从h个第二数据点中筛选出i个异常数据点,根据所述i个异常数据点,确定i个异常业务数据,其中,i小于或等于h,且i为正整数。

7、根据本公开实施例,其特征在于,对预先训练的空间聚类模型进行调优,包括:基于a个新增业务下载数据,通过网格搜索法对预先训练的空间聚类模型进行最佳参数调优,生成调优后的空间聚类模型,其中,所述最佳参数包括:领域半径。

8、根据本公开实施例,其特征在于,其中,所述每个第一数据点包括本批新增业务下载数据点的领域半径,所述预先生成第一密度可达图,包括:获取多批次历史新增业务下载数据,其中,每批次历史新增业务下载数据包括多个业务下载数据点的坐标,同一批次历史新增业务下载数据中的多个业务下载数据点的坐标具有相同的领域半径,不同批次历史新增业务下载数据中的多个业务下载数据点的坐标具有相同的领域半径;以及将所述多批历史新增业务下载数据导入同一坐标图,生成第一密度可达图。

9、根据本公开实施例,其特征在于,所述每个第一历史数据点包括特征标签,基于每个第二数据点的相关数据点,从c个第二数据点中筛选出d个异常数据点,包括:获取每个第二数据点的相关数据点的特征标签,生成每个第二数据点的多个相关特征标签;对所述每个第二数据点的多个相关特征标签进行累加,生成每个第二数据点的特征标签;以及基于每个第二数据点的特征标签,从c个第二数据点中筛选出d个异常数据点。

10、根据本公开的第二个方面提供了一种异常业务数据确定装置,其特征在于,该装置包括:第一获取模块,用于获取a个新增业务下载数据,将所述a个新增业务下载数据输入预先训练的并且调优后的空间聚类模型,输出b个非离群新增业务下载数据点,作为b个第一数据点,其中,每个第一数据点包括新增业务下载数据点的坐标,其中,a大于或等于2,b小于或等于a,且a和b都为正整数;第一生成模块,用于将所述b个第一数据点的坐标导入预先生成的第一密度可达图,生成第二密度可达图;以及第一确定模块,用于基于所述第二密度可达图,从b个第一数据点中筛选出d个异常数据点,根据所述d个异常数据点,确定d个异常业务数据,其中,d小于或等于b,且d为正整数。

11、根据本公开实施例,其特征在于,所述第一密度可达图中包括:历史业务下载数据点中的离群点坐标,所述第二确定模块包括:第四生成模块,用于从所述第二密度可达图中获取所述历史业务下载数据点中的离群点坐标的领域半径,生成多个第一历史数据点;第五生成模块,用于从所述第二密度可达图中获取每个第一数据点领域半径内的多个第一历史数据点,生成与每个第一数据点对应的多个第二历史数本文档来自技高网...

【技术保护点】

1.一种异常业务数据确定方法,其特征在于,该方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一密度可达图中包括:历史业务下载数据点中的离群点坐标,所述基于所述第二密度可达图,从b个第一数据点中筛选出d个异常数据点,包括:

3.根据权利要求1所述的方法,其特征在于,该方法还包括:

4.根据权利要求2所述的方法,其特征在于,该方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述每个第一历史数据点包括特征标签,该方法还包括:

6.根据权利要求1所述的方法,其特征在于,对预先训练的空间聚类模型进行调优,包括:

7.根据权利要求1至6任意一项所述的方法,其特征在于,其中,所述每个第一数据点包括本批新增业务下载数据点的领域半径,所述预先生成第一密度可达图,包括:

8.根据权利要求2所述的方法,其特征在于,所述每个第一历史数据点包括特征标签,基于每个第二数据点的相关数据点,从c个第二数据点中筛选出d个异常数据点,包括:

9.一种异常业务数据确定装置,其特征在于,该装置包括:>

10.一种电子设备,包括:

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1~8中任一项所述方法的步骤。

12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种异常业务数据确定方法,其特征在于,该方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一密度可达图中包括:历史业务下载数据点中的离群点坐标,所述基于所述第二密度可达图,从b个第一数据点中筛选出d个异常数据点,包括:

3.根据权利要求1所述的方法,其特征在于,该方法还包括:

4.根据权利要求2所述的方法,其特征在于,该方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述每个第一历史数据点包括特征标签,该方法还包括:

6.根据权利要求1所述的方法,其特征在于,对预先训练的空间聚类模型进行调优,包括:

7.根据权利要求1至6任意一项所述的方法,其特征在于,其中,...

【专利技术属性】
技术研发人员:徐钰楼闯宇敬涛刘宇驰
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1