System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图结构数据处理,尤其涉及一种用户标签确定方法及装置。
技术介绍
1、在金融系统中,使用图神经网络(graph neural network,gnn)模型判断用户属于欺诈用户还是正常用户,对于确定用户是否能够按时还款十分重要,而用户能否按时还款又对降低金融公司借贷风险具有重大意义。gnn的性能在很大程度上依赖于用于训练gnn模型的标签数量以及标签质量,对于大型金融图结构来说,对用户进行标签标注需要花费大量的时间和人力资源。
2、因而,如何高效且有效地给用户进行标签标注是gnn在金融场景落地过程中一个非常重要的问题。
技术实现思路
1、本申请提供一种用户标签确定方法,用以提升用户标签确定的效率。
2、第一方面,本申请提供一种用户标签确定方法,该方法包括:
3、获取图数据,其中,所述图数据中的每个节点表示一个用户,所述图数据中的每个边表明通过该边连接的两个节点所对应的两个用户具有关联关系;
4、根据所述图数据,确定多个数据簇,其中,每个数据簇对应所述图数据中的多个节点,且与所述多个节点中的任意一个节点连接的任意一个节点也属于所述多个节点;
5、针对每个数据簇中的每个节点的度数计算相应的指标值,并确定每个数据簇中最大指标值对应的节点;
6、根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签。
7、本申请获取图数据后,首先将图数据划分为多个数据簇,再对每个数据簇中的每个节点根据其度数
8、在一种可能的设计中,所述两个用户具有关联关系是指所述两个用户中的一个用户为另一个用户的联系人。
9、在一种可能的设计中,还包括:
10、所述图数据中的每个节点的金融数据包括与该节点对应的用户的一笔或多笔借贷记录,每笔借贷记录包括借贷金额,承诺还款时间,实际还款时间。
11、在一种可能的设计中,在根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签之后,还包括:
12、根据所述图数据中的各个节点的金融数据采用损失函数进行训练,获得第一模型,所述第一模型用于根据第一用户的联系人信息确定所述第一用户的信用状态。
13、在一种可能的设计中,所述第一用户的联系人信息包括与所述第一用户关联的用户信息;
14、根据第一用户的联系人信息确定所述第一用户的信用状态,包括:
15、根据与所述第一用户关联的用户的信息查询与所述第一用户关联的用户的金融数据;
16、将所述第一用户的基本信息和与所述第一用户关联的用户的金融数据输入所述第一模型,获得所述第一用户的信用状态。
17、上述根据图数据进行训练获得的第一模型,可以根据与第一用户关联的用户的金融数据确定第一用户的信用状态,也就是说,第一模型可以在用户自身的金融数据缺失的情况下,根据与其关联的用户的金融数据预测该用户的信用状态。
18、在一种可能的设计中,所述损失函数为邻域传播熵损失函数和/或交叉熵损失函数。
19、在一种可能的设计中,针对每个数据簇中的每个节点的度数计算相应的指标值,包括:
20、针对每个数据簇中的每个节点的度数计算相应的佩奇排名值。
21、第二方面,本申请还提供一种用户标签确定装置,该装置包括:
22、收发单元,用于获取图数据,其中,所述图数据中的每个节点表示一个用户,所述图数据中的每个边表明通过该边连接的两个节点所对应的两个用户具有关联关系;
23、处理单元,用于根据所述图数据,确定多个数据簇,其中,每个数据簇对应所述图数据中的多个节点,且与所述多个节点中的任意一个节点连接的任意一个节点也属于所述多个节点;针对每个数据簇中的每个节点的度数计算相应的指标值,并确定每个数据簇中最大指标值对应的节点;根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签。
24、在一种可能的设计中,所述两个用户具有关联关系是指所述两个用户中的一个用户为另一个用户的联系人。
25、在一种可能的设计中,还包括:
26、所述图数据中的每个节点的金融数据包括与该节点对应的用户的一笔或多笔借贷记录,每笔借贷记录包括借贷金额,承诺还款时间,实际还款时间。
27、在一种可能的设计中,所述处理单元,还用于在根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签之后:根据所述图数据中的各个节点的金融数据采用损失函数进行训练,获得第一模型,所述第一模型用于根据第一用户的联系人信息确定所述第一用户的信用状态。
28、在一种可能的设计中,所述第一用户的联系人信息包括与所述第一用户关联的用户信息,所述处理单元,用于在根据第一用户的联系人信息确定所述第一用户的信用状态时:根据与所述第一用户关联的用户的信息查询与所述第一用户关联的用户的金融数据;将所述第一用户的基本信息和与所述第一用户关联的用户的金融数据输入所述第一模型,获得所述第一用户的信用状态。
29、在一种可能的设计中,所述损失函数为邻域传播熵损失函数和/或交叉熵损失函数。
30、在一种可能的设计中,所述处理单元,用于在针对每个数据簇中的每个节点的度数计算相应的指标值时:针对每个数据簇中的每个节点的度数计算相应的佩奇排名值。
31、第三方面,本申请还提供一种用户标签确定装置,包括:一个或多个处理器和一个或多个存储器,其中,所述一个或多个存储器存储有一个或多个程序,当所述程序被所述一个或多个处理器执行时,使得所述装置执行如上述第一方面中任一项所述的方法。
32、第四方面,本申请还提供一种计算机可读存储介质,所述可读存储介质包括程序,当所述程序在装置上执行时,使得所述装置执行如上述第一方面中任一项所述的方法。
本文档来自技高网...【技术保护点】
1.一种用户标签确定方法,其特征在于,该方法包括:
2.如权利要求1所述的方法,其特征在于,所述两个用户具有关联关系是指所述两个用户中的一个用户为另一个用户的联系人。
3.如权利要求1所述的方法,其特征在于,所述图数据中的每个节点的金融数据包括与该节点对应的用户的一笔或多笔借贷记录,每笔借贷记录包括借贷金额,承诺还款时间,实际还款时间。
4.如权利要求1所述的方法,其特征在于,在根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签之后,还包括:
5.如权利要求4所述的方法,其特征在于,所述第一用户的联系人信息包括与所述第一用户关联的用户的信息;
6.如权利要求4所述的方法,其特征在于,所述损失函数为邻域传播熵损失函数和/或交叉熵损失函数。
7.如权利要求1所述的方法,其特征在于,针对每个数据簇中的每个节点的度数计算相应的指标值,包括:
8.一种用户标签确定装置,其特征在于,该装置包括:
9.一种用户标签确定装置,其特征在于,包括:一个或多个处理器和一个或多个存储器;其中,
10.一种计算机可读存储介质,其特征在于,所述可读存储介质包括程序,当所述程序在装置上运行时,使得所述装置执行如权利要求1-7中任一所述的方法。
...【技术特征摘要】
1.一种用户标签确定方法,其特征在于,该方法包括:
2.如权利要求1所述的方法,其特征在于,所述两个用户具有关联关系是指所述两个用户中的一个用户为另一个用户的联系人。
3.如权利要求1所述的方法,其特征在于,所述图数据中的每个节点的金融数据包括与该节点对应的用户的一笔或多笔借贷记录,每笔借贷记录包括借贷金额,承诺还款时间,实际还款时间。
4.如权利要求1所述的方法,其特征在于,在根据每个数据簇中最大指标值对应的节点的金融数据为相应的用户设置标签之后,还包括:
5.如权利要求4所述的方法,其特征在于,所述第一用户的联系人信息包括与所述第一用户关联的用户的信息;
6.如权利要求4所...
【专利技术属性】
技术研发人员:黄仁泓,孙逸飞,杨洋,王扬,王玉翔,陈磊,
申请(专利权)人:上海上湖信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。