本公开提供了一种账户类型的识别方法、装置、电子设备及存储介质,方法包括:获取样本集和待识别账户的交易数据,样本集中包括多个样本账户的交易数据,样本账户的类型至少包括正常和异常;根据交易数据分别构建待识别账户和样本账户的特征矩阵;根据样本账户的特征矩阵对样本集进行聚类,得到多个样本簇,每个样本簇对应一个类型;确定每个样本簇的中心节点的特征矩阵;根据待识别账户的特征矩阵和中心节点的特征矩阵,确定待识别账户与每个样本簇在时间维度的第一相似度和在交易维度的第二相似度,合并第一相似度和第二相似度,确定待识别账户与相应样本簇的第三相似度;根据待识别账户与每个样本簇之间的第三相似度,确定待识别账户的类型。别账户的类型。别账户的类型。
【技术实现步骤摘要】
一种账户类型的识别方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能领域,尤其涉及一种账户类型的识别方法、装置、电子设备及存储介质。
技术介绍
[0002]随着计算机技术和互联网技术的不断发展,越来越多的异常交易行为也逐渐渗入到互联网中,正常或异常的账户难以分辨。
[0003]当前,账户类型的识别模型通常都是利用经验规则对交易信息进行逐一排查,实现对正常账户和异常账户的识别。现有技术会根据账户的特征如交易频率、交易金额、交易习惯等等,编写账户类型识别的经验规则以对账户进行分析,并对分析结果进行不断评估与纠正。
[0004]但是,现有技术存在如下不足:1、在依靠经验规则识别账户的类型还需要人工进行进一步审核,消耗了大量的人力物力;2、传统的账户类型识别模型需要不断更新经验规则,存在一定风险,同时不一定能够完全捕捉潜藏的异常交易;3、针对于不同经济发展水平的地区中发生的交易行为也不尽相同,采用一套经验规则不具备普适性。
技术实现思路
[0005]本公开提供了一种账户类型的识别方法、装置、电子设备及存储介质,以至少解决现有技术中存在的以上技术问题。
[0006]根据本公开的第一方面,提供了一种账户类型的识别方法,所述方法包括:获取样本集和待识别账户的交易数据,所述样本集中包括多个样本账户的交易数据,所述样本账户的类型至少包括正常和异常;根据所述交易数据分别构建所述待识别账户和样本账户的特征矩阵;所述特征矩阵的列向量表示交易维度,所述特征矩阵的行向量表示时间维度;根据所述样本账户的特征矩阵对所述样本集进行聚类,得到多个样本簇,每个样本簇对应一个类型;确定每个样本簇的中心节点的特征矩阵;根据所述待识别账户的特征矩阵和中心节点的特征矩阵,确定所述待识别账户与每个样本簇之间在所述时间维度的第一相似度和在所述交易维度的第二相似度;将所述第一相似度和第二相似度进行合并,确定所述待识别账户与相应样本簇之间的第三相似度;根据所述待识别账户与每个样本簇之间的第三相似度,确定所述待识别账户的类型。
[0007]在一可实施方式中,所述样本账户的特征矩阵与所述待识别账户的特征矩阵的大小相同;所述样本账户的特征矩阵与所述待识别账户的特征矩阵同一个行向量对应的时
间相同;所述样本账户的特征矩阵与所述待识别账户的特征矩阵同一个列向量对应的交易维度相同。
[0008]在一可实施方式中,当存在多个待识别账户,则在确定每个待识别账户的类型之后,所述方法还包括:根据所有待识别账户的类型执行验证操作,得到每个待识别账户的类型验证结果;若每个待识别账户的类型验证结果为错误,则重新确定每个待识别账户的类型,并根据重新确定的所有待识别账户的类型执行验证操作,直至每个待识别账户的类型验证结果为正确。
[0009]在一可实施方式中,所述重新确定每个待识别账户的类型,包括:根据上一次识别出的所有待识别账户的类型,对所述聚类得到的样本簇的中心节点进行更新;根据所述样本簇更新后的中心节点,返回执行所述第一相似度、第二相似度和第三相似度的确定操作,确定每个待识别账户的类型。
[0010]在一可实施方式中,所述验证操作,包括:根据本次识别出的所有待识别账户的类型,对所述聚类得到的样本簇的中心节点进行更新;分别确定每个样本簇更新后的中心节点和更新前的中心节点之间的第四相似度;当所有样本簇的第四相似度之和小于预设阈值时,确定每个待识别账户的类型验证结果为错误;当所有样本簇的第四相似度之和大于等于预设阈值时,确定每个待识别账户的类型验证结果为正确。
[0011]在一可实施方式中,所述对所述聚类得到的样本簇的中心节点进行更新,包括:根据所述样本簇中样本账户的特征矩阵以及与所述样本簇相同类型的待识别账户的特征矩阵,更新所述样本簇的中心节点。
[0012]在一可实施方式中,确定所述第一相似度和所述第二相似度,包括:分别计算所述待识别账户的特征矩阵中每个行向量与每个样本簇的中心节点的特征矩阵中对应时间区间的行向量的相似度值,构建所述待识别账户与每个样本簇的第一相似度;分别计算所述待识别账户的特征矩阵中每个列向量与每个样本簇的中心节点的特征矩阵中对应的列向量的相似度值,构建所述待识别账户与每个样本簇的第二相似度。
[0013]在一可实施方式中,所述对应时间区间的行向量包括在所述中心节点的特征矩阵中与所述待识别账户的特征矩阵中的行向量对应的行向量,以及与该行向量相邻的行向量;相应的,所述构建所述待识别账户与每个样本簇的第一相似度,包括:分别计算所述待识别账户的特征矩阵中每个行向量与每个样本簇的中心节点的特征矩阵中对应时间区间内所有行向量的相似度值,采用最大的相似度值构建所述第一相似度。
[0014]在一可实施方式中,根据所述待识别账户与每个样本簇之间的第三相似度,确定所述待识别账户的类型,包括:将所述待识别账户与每个样本簇之间的第三相似度中对应的相似度值做差值;若差值大于等于0的数量大于差值小于0的数量,则确定所述待识别账户的类型为所述第三相似度较大的样本簇的类型。
[0015]根据本公开的第二方面,提供了一种账户类型的识别装置,所述装置包括:获取模块,用于获取样本集和待识别账户的交易数据,所述样本集中包括多个样本账户的交易数据,所述样本账户的类型至少包括正常和异常;构建模块,用于根据所述交易数据分别构建所述待识别账户和样本账户的特征矩阵;所述特征矩阵的列向量表示交易维度,所述特征矩阵的行向量表示时间维度;聚类模块,用于根据所述样本账户的特征矩阵对所述样本集进行聚类,得到多个样本簇,每个样本簇对应一个类型;确定模块,用于确定每个样本簇的中心节点的特征矩阵;所述确定模块,还用于根据所述待识别账户的特征矩阵和中心节点的特征矩阵,确定所述待识别账户与每个样本簇之间在所述时间维度的第一相似度和在所述交易维度的第二相似度;所述确定模块,还用于将所述第一相似度和第二相似度进行合并,确定所述待识别账户与相应样本簇之间的第三相似度;所述确定模块,还用于根据所述待识别账户与每个样本簇之间的第三相似度,确定所述待识别账户的类型。
[0016]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
[0017]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
[0018]本公开的账户类型的识别方法、装置、电子设备及存储介质,通过获取样本集和待识别账户的交易数据,根据待识别账户和样本账户的交易数据,构建待识别账户和样本账户的特征矩阵;再对所有样本账户的特征矩阵进行聚类得到多个样本簇,计算每个样本簇的中心节点的特征矩阵;然后根据待识别账户的特征矩阵和中心节点的特征矩阵,执行待识别账户与每个样本簇之间的第一相似度、第二相似度和第三相似度的确本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种账户类型的识别方法,其特征在于,所述方法包括:获取样本集和待识别账户的交易数据,所述样本集中包括多个样本账户的交易数据,所述样本账户的类型至少包括正常和异常;根据所述交易数据分别构建所述待识别账户和样本账户的特征矩阵;所述特征矩阵的列向量表示交易维度,所述特征矩阵的行向量表示时间维度;根据所述样本账户的特征矩阵对所述样本集进行聚类,得到多个样本簇,每个样本簇对应一个类型;确定每个样本簇的中心节点的特征矩阵;根据所述待识别账户的特征矩阵和中心节点的特征矩阵,确定所述待识别账户与每个样本簇之间在所述时间维度的第一相似度和在所述交易维度的第二相似度;将所述第一相似度和第二相似度进行合并,确定所述待识别账户与相应样本簇之间的第三相似度;根据所述待识别账户与每个样本簇之间的第三相似度,确定所述待识别账户的类型。2.根据权利要求1所述的方法,其特征在于,所述样本账户的特征矩阵与所述待识别账户的特征矩阵的大小相同;所述样本账户的特征矩阵与所述待识别账户的特征矩阵同一个行向量对应的时间相同;所述样本账户的特征矩阵与所述待识别账户的特征矩阵同一个列向量对应的交易维度相同。3.根据权利要求1所述的方法,其特征在于,当存在多个待识别账户,则在确定每个待识别账户的类型之后,所述方法还包括:根据所有待识别账户的类型执行验证操作,得到每个待识别账户的类型验证结果;若每个待识别账户的类型验证结果为错误,则重新确定每个待识别账户的类型,并根据重新确定的所有待识别账户的类型执行验证操作,直至每个待识别账户的类型验证结果为正确。4.根据权利要求3所述的方法,其特征在于,所述重新确定每个待识别账户的类型,包括:根据上一次识别出的所有待识别账户的类型,对所述聚类得到的样本簇的中心节点进行更新;根据所述样本簇更新后的中心节点,返回执行所述第一相似度、第二相似度和第三相似度的确定操作,确定每个待识别账户的类型。5.根据权利要求3所述的方法,其特征在于,所述验证操作,包括:根据本次识别出的所有待识别账户的类型,对所述聚类得到的样本簇的中心节点进行更新;分别确定每个样本簇更新后的中心节点和更新前的中心节点之间的第四相似度;当所有样本簇的第四相似度之和小于预设阈值时,确定每个待识别账户的类型验证结果为错误;当所有样本簇的第四相似度之和大于等于预设阈值时,确定每个待识别账户的类型验证结果为正确。
6.根据权利要求4或5所述的方法,其特征在于,所述对所述聚类得到的样本簇的中心节点进行更新,包括:根据所述样本簇中样本账户的特征矩阵以及与所述样本簇相同类型的待识别账户的特征矩阵,更新所述样本簇的中心节点。7.根据权利要求1或4所述的方法,其特征在于,确定所述第一相似度和所述第二相似度,包括:...
【专利技术属性】
技术研发人员:刘登涛,孙悦,蔡准,
申请(专利权)人:北京芯盾时代科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。