System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种基于多模态的账户类型识别方法、装置及电子设备。
技术介绍
1、在资源转移场景中,经常使用二维码作为资源转移的凭证,常见的有付款码、乘车码等。二维码作为一种图形编码很容易被复制和盗用,引发资源转移风险。
2、目前,通过二维码进行资源转移时,相关技术主要是基于二维码关联的资源数据(如付款金额、付款商品、付款次数、付款方式等)和风险账户聚集分析来识别风险账户的,首先通过对资源数据进行特征统计识别出异常账户,然后将异常账户和已有标签的风险账户进行聚集分析,从而确定异常账户的风险类型。
3、然而,上述方法通常是基于专业经验构建的高维统计特征进行识别的,即需要转移数据达到一定的规模,才能准确识别出异常账户,而在资源数据的数据量较小时,容易产生漏判和误判,风险较高。
4、另一方面,基于风险账户聚集分析是基于有监督学习的,由于有监督学习的标签是人工预先标记的,只能对已知风险类型的账户进行识别,扩展性差。
5、因此,提高以二维码形式进行资源转移的安全性,成为资源转移中亟待解决的问题。
技术实现思路
1、本申请实施例提供了一种基于多模态的账户类型识别方法、装置及电子设备,用于提高基于二维码进行资源转移的安全性。
2、一方面,本申请实施例提供一种基于多模态的账户类型识别方法,包括:
3、扫描待处理的目标二维码图片,获得所述目标二维码图片包含的资源转移文本,以及,获取基于所述目标二维码图片进行资源转移操作
4、基于所述资源转移文本和所述评价文本,获得所述目标二维码图片的文本特征,以及提取所述目标二维码图片的图像特征;
5、基于所述目标二维码图片的文本特征和图像特征,结合已处理的多个历史二维码图片的文本特征和图像特征,将所述目标二维码图片对应的当前账户与所述多个历史二维码图片各自对应的历史账户,划分为多个账户子集;
6、基于所述资源转移文本和所述评价文本包含的各关键词,确定包含所述当前账户的账户子集的账户类型。
7、另一方面,本申请实施例提供一种基于多模态的账户类型识别装置,包括:
8、文本获取模块,用于扫描待处理的目标二维码图片,获得所述目标二维码图片包含的资源转移文本,以及,获取基于所述目标二维码图片进行资源转移操作产生的评价文本;
9、特征提取模块,用于基于所述资源转移文本和所述评价文本,获得所述目标二维码图片的文本特征,以及提取所述目标二维码图片的图像特征;
10、账户划分模块,用于基于所述目标二维码图片的文本特征和图像特征,结合已处理的多个历史二维码图片的文本特征和图像特征,将所述目标二维码图片对应的当前账户与所述多个历史二维码图片各自对应的历史账户,划分为多个账户子集;
11、类型确定模块,用于基于所述资源转移文本和所述评价文本包含的各关键词,确定包含所述当前账户的账户子集的账户类型。
12、可选的,所述账户划分模块具体用于:
13、针对所述目标二维码图片和所述多个历史二维码图片中的每个二维码图片,对所述二维码图片的文本特征和图像特征进行特征拼接,得到融合特征;
14、基于各二维码图片各自的融合特征,确定每两个二维码图片对应的账户间的类型相似度;
15、基于确定的各类型相似度,将所述各二维码图片对应的账户划分为多个账户子集。
16、可选的,所述账户划分模块具体用于:
17、将每个二维码图片对应的账户作为一个节点,将每两个二维码图片对应的账户间的类型相似度作为节点间边的权重,获得无向图;
18、将各节点分别作为一个社区,基于所述各节点间边的权重,计算社区模块度;
19、基于所述社区模块度,对所述无向图进行分割,获得多个子图,每个子图作为一个账户子集。
20、可选的,所述账户划分模块具体用于:
21、基于所述各节点中每两个节点间边的权重,计算初始的社区模块度;
22、对所述各节点进行至少一次合并,并基于每次合并后的新节点间边的权重,重新计算社区模块度,直至所述社区模块度满足预设条件;
23、将满足所述预设条件时的各社区,分别作为一个子图。
24、可选的,所述账户划分模块具体用于:
25、基于确定的各类型相似度,对所述各二维码图片对应的账户进行聚类,获得多个簇;
26、分别将获得的每个簇作为一个账户子集。
27、可选的,所述类型确定模块具体用于:
28、提取所述资源转移文本和所述评价文本中的各关键词,并分别将所述各关键词与预设历史词库进行比对;
29、基于各比对结果,确定包含所述当前账户的账户子集的账户类型。
30、可选的,所述类型确定模块还用于:
31、获取包含所述当前账户的账户子集中,置信度低于预设置信度阈值的候选账户;
32、基于累计的历史账户标签,获得各候选账户的账户类型;
33、基于所述各候选账户的账户类型,调整无向图或者簇的结构以更新已有的账户类型,其中,所述无向图或所述簇用于划分账户子集。
34、可选的,所述特征提取模块还用于:
35、基于预设文本长度,对一个文本进行截断,获得用于文本特征提取的多个文本段;
36、对所述一个文本进行过滤,剔除与资源转移无关的信息;
37、基于预设文本格式,对所述一个文本进行格式转换。
38、另一方面,本申请实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述基于多模态的账户类型识别方法的步骤。
39、另一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令被电子设备执行时实现上述基于多模态的账户类型识别方法的步骤。
40、另一方面,本申请实施例提供一种计算机程序产品,包含计算机程序,所述计算机程序被电子设备执行时实现上述基于多模态的账户类型识别方法的步骤。
41、本申请实施例的有益效果如下:
42、本申请实施例提供的基于多模态的账户类型识别方法、装置及电子设备中,通过充分利用目标二维码图片本身包含的资源转移文本及图像信息进行识别,减小了对资源转移数据的高维统计特征的依赖,有助于提高账户子集划分的准确性;同时,基于资源转移文本和基于目标二维码图片进行资源转移操作产生的评价文本获得的文本特征,以及从目标二维码图片本身中提取的图像特征这两种模态的特征,将目标二维码图片对应的当前账户与多个历史二维码图片各自对应的历史账户划分为各账户子集,相对于单一模态特征,提高了聚集分析的准确性;进一步地,通过资源转移文本和评价文本中的各关键词,来确定包含当前账户的账户子集的账户类型,相对于人工标注的类型标签对账户子集进行定性,本文档来自技高网...
【技术保护点】
1.一种基于多模态的账户类型识别方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述基于所述目标二维码图片的文本特征和图像特征,结合已处理的多个历史二维码图片的文本特征和图像特征,将所述目标二维码图片对应的当前账户与所述多个历史二维码图片各自对应的历史账户,划分为多个账户子集,包括:
3.如权利要求2所述的方法,其特征在于,所述基于确定的各类型相似度,将所述各二维码图片对应的账户划分为多个账户子集,包括:
4.如权利要求3所述的方法,其特征在于,所述基于所述各节点间边的权重,计算社区模块度;基于所述社区模块度,对所述无向图进行分割,获得多个子图,包括:
5.如权利要求2所述的方法,其特征在于,所述基于确定的各类型相似度,将所述各二维码图片对应的账户划分为多个账户子集,包括:
6.如权利要求1所述的方法,其特征在于,所述基于所述资源转移文本和所述评价文本包含的各关键词,确定包含所述当前账户的账户子集的账户类型,包括:
7.如权利要求1所述的方法,其特征在于,确定包含所述当前账户的账户子集的账户
8.如权利要求1-7中任一项所述的方法,其特征在于,在获得所述目标二维码的目标文本特征之前,针对所述资源转移文本和所述评价文本中的至少一个文本,分别执行以下至少一项操作:
9.一种基于多模态的账户类型识别装置,其特征在于,包括:
10.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1-8中任一所述方法的步骤。
11.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1-8中任一所述方法的步骤。
12.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行权利要求1-8中任一所述方法的步骤。
...【技术特征摘要】
1.一种基于多模态的账户类型识别方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述基于所述目标二维码图片的文本特征和图像特征,结合已处理的多个历史二维码图片的文本特征和图像特征,将所述目标二维码图片对应的当前账户与所述多个历史二维码图片各自对应的历史账户,划分为多个账户子集,包括:
3.如权利要求2所述的方法,其特征在于,所述基于确定的各类型相似度,将所述各二维码图片对应的账户划分为多个账户子集,包括:
4.如权利要求3所述的方法,其特征在于,所述基于所述各节点间边的权重,计算社区模块度;基于所述社区模块度,对所述无向图进行分割,获得多个子图,包括:
5.如权利要求2所述的方法,其特征在于,所述基于确定的各类型相似度,将所述各二维码图片对应的账户划分为多个账户子集,包括:
6.如权利要求1所述的方法,其特征在于,所述基于所述资源转移文本和所述评价文本包含的各关键词,确定包含所述当前账户的账户子集的账户类型,包括:
7.如权利要求1所述的方法,其特征在...
【专利技术属性】
技术研发人员:邱际宝,宗旋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。