一种异常交易识别方法及装置制造方法及图纸

技术编号:32550752 阅读:31 留言:0更新日期:2022-03-05 11:50
本发明专利技术实施例提供一种异常交易识别方法及装置,该方法包括:根据所述各分词对应的相似度确定所述商户名称在各聚类特征下的第一聚类特征向量,其中,各聚类特征是样本商户名称在各特征下差异度大于预设阈值的特征;根据各聚类特征的第一权重,确定所述第一聚类特征向量与各样本商户名称的第二聚类特征向量的聚类结果,所述第一权重是根据所述各样本商户名称在各聚类特征下的离散程度确定;根据所述聚类结果中的各样本商户名称的识别结果确定所述商户名称的识别结果;所述识别结果用于指示商户名称对应的商户是否为异常商户。上述方法用于提高不同交易类型的用户筛选结果的准确性。确性。确性。

【技术实现步骤摘要】
一种异常交易识别方法及装置


[0001]本申请涉及网络
,尤其涉及一种异常交易识别方法及装置。

技术介绍

[0002]近年来,随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出更高的要求。如,为了保证交易合法,现有技术中一般会对交易信息进行合法性验证,验证通过后,才会对交易进行处理,以此保证交易处理的安全性。
[0003]现有技术中,不同的交易类型面对的用户不一样。如,期货、股票、债券类交易面对的用户可以是有具体的生产设备,生产材料,或是拥有实体物质的实业类企业。如,生产型企业、原料加工型企业、制造型企业、矿山开采型企业、金属冶炼型企业、原油开采企业等,也可以是个人储蓄用户。但是该种类型交易不对房产业商户、彩票业商户、保险业商户等开放交易。因此,在交易系统得到待处理交易信息后,需要识别系统根据商户黑名单(如,包含房产业商户、彩票业商户、保险业商户等)对待处理交易信息中的商户名称进行识别,若不属于商户黑名单,则可以对该待处理交易进行处理,否则不对该待处理交易处理。虽然该方式可以实现对不同交易类型的用户进行筛选,保证交易的正常进行,但是仍然不能实现更准确的识别筛选。
[0004]因此,现在亟需一种异常交易识别方法及装置,用于提高不同交易类型的用户筛选结果的准确性。

技术实现思路

[0005]本专利技术实施例提供一种异常交易识别方法及装置,用于提高不同交易类型的用户筛选结果的准确性。<br/>[0006]第一方面,本专利技术实施例提供一种异常交易识别方法,该方法包括:
[0007]根据所述各分词对应的相似度确定所述商户名称在各聚类特征下的第一聚类特征向量,其中,各聚类特征是样本商户名称在各特征下差异度大于预设阈值的特征;根据各聚类特征的第一权重,确定所述第一聚类特征向量与各样本商户名称的第二聚类特征向量的聚类结果,所述第一权重是根据所述各样本商户名称在各聚类特征下的离散程度确定;根据所述聚类结果中的各样本商户名称的识别结果确定所述商户名称的识别结果;所述识别结果用于指示商户名称对应的商户是否为异常商户。
[0008]上述方法中,计算待处理交易中商户名称的每个分词与各异常关键词的相似度,得到各分词对应的相似度。如此,可以得到待处理交易中商户名称异常的程度。进一步根据各分词对应的相似度确定商户名称在各聚类特征下的第一聚类特征向量,根据各聚类特征的第一权重,确定所述第一聚类特征向量与各具有正常商户名称或异常商户名称标签的样本商户名称的第二聚类特征向量的聚类结果。如此,可以得到商户名称与正常商户名称更类似还是与异常商户名称更类似的聚类结果。由于不同的聚类特征对商户名称异常程度的
表征不一样,在样本商户名称中的同一聚类特征的差异度也不一样。因此,根据聚类特征对应的第一权重对各样本商户名称的第二聚类特征向量进行相应的运算,使得聚类结果中融合考虑到不同的聚类特征对商户名称异常程度的表征和样本商户名称中的同一聚类特征的差异度两种因素,提高聚类结果的准确性。
[0009]可选的,根据所述聚类结果中的各样本商户名称的识别结果确定所述商户名称的识别结果,包括:
[0010]根据所述聚类结果中各聚类距离的第二权重,确定所述聚类结果中各样本商户的权重聚类距离;所述第二权重中距离越近的权重值越高;
[0011]根据所述权重聚类距离中最小值的样本商户名称确定识别结果,确定为所述商户名称的识别结果。
[0012]上述方法中,不仅根据各聚类特征对应的第一权重获取第一聚类特征向量与各样本商户名称的第二聚类特征向量的聚类结果。以使得聚类结果中融合考虑到不同的聚类特征对商户名称异常程度的表征和样本商户名称中的同一聚类特征的差异度两种因素,提高聚类结果的准确性。
[0013]还可以进一步的设置与商户名称聚类距离的设定聚类距离。针对在离该商户名称的不同聚类距离对应的第二权重,根据第二权重,确定聚类结果中识别结果为正常商户的第一识别权重及识别结果为异常商户的第二识别权重。进一步确定第一识别权重和第二识别权重中权重高的识别结果,确定为该商户名称对应的识别结果。如此,根据不同聚类距离对应的第二权重,可以进一步对聚类结果优化,即使样本商户名称中异常商户名称样本和正常商户名称样本数量不均衡,也可以根据样本商户名称与待处理交易中的商户名称的距离做调整,消除这种不均衡影响。
[0014]可选的,计算所述待处理交易中商户名称的每个分词与各异常关键词的相似度,得到各分词对应的相似度,包括:获取所述待处理交易中的商户名称,通过结巴分词技术获取所述商户名称的各分词;通过分词转换向量工具获取所述各分词的各分词向量;针对所述商户名称的每个分词向量,计算所述分词向量分别与所述各异常关键词向量的相似度,得到所述分词对应的相似度。
[0015]上述方法中,通过商户名称的分词向量和各异常关键词向量的相似度确定表征商户名称异常程度的聚类特征向量。如此,通过将分词转化为向量的方式,可以将文字转化数字实现异常程度的量化,提高异常交易识别结果的准确性。
[0016]可选的,各聚类特征是样本商户名称在各特征下差异度大于设定阈值的特征,包括:针对任一样本商户名称,根据所述样本商户名称的各分词对应的相似度确定所述样本商户名称在各特征下的特征值;根据各样本商户名称在各特征下的特征值,确定每个特征的方差;将方差不小于预设阈值的特征确定为聚类特征。
[0017]上述方法中,根据各分词对应的相似度确定样本商户名称在各特征下的特征值后,通过方差选择法得到聚类特征和聚类特征的预设阈值,通过各聚类特征的预设阈值实现对识别商户名称聚类特征进行筛选,节约计算资源。如此,也可以将不能表征商户名称异常程度和表征商户名称异常程度不明显的特征去除,降低计算量,节约计算资源。如,将由于相似度中最低相似度不能表征商户名称异常程度,则将该项去除。
[0018]可选的,所述各聚类特征包括各分词对应的相似度中最高相似度、平均相似度,以
及商户名称的分词数。
[0019]上述方法中,最高相似度体现商户名称异常程度最明显、平均相似度体现商户名称各相似特征平均异常程度、分词数体现该商户名称长度及各特征所基于的数据基础。如此,聚类特征向量至少包含明显异常特征、一般异常特征和特征数据基础三大主要因素,保证聚类结果的准确度。
[0020]可选的,所述第一权重是根据所述各样本商户名称在各聚类特征下的离散程度确定,包括:针对每个异常样本商户名称,确定所述异常样本商户名称在各聚类特征下的特征值;针对每个聚类特征,根据各异常样本商户名称在所述聚类特征下的特征值,确定所述聚类特征的变异系数;根据各聚类特征的变异系数,确定各聚类特征的第一权重。
[0021]上述方法中,确定样本商户名称在各聚类特征下的特征值,针对每个聚类特征,根据各样本商户名称在聚类特征下的特征值,确定聚类特征的变异系数。也就是说,根据样本商户名称获取每个聚类特征的离散程度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常交易识别方法,其特征在于,所述的方法包括:根据所述各分词对应的相似度确定所述商户名称在各聚类特征下的第一聚类特征向量,其中,各聚类特征是样本商户名称在各特征下差异度大于预设阈值的特征;根据各聚类特征的第一权重,确定所述第一聚类特征向量与各样本商户名称的第二聚类特征向量的聚类结果,所述第一权重是根据所述各样本商户名称在各聚类特征下的离散程度确定;根据所述聚类结果中的各样本商户名称的识别结果确定所述商户名称的识别结果;所述识别结果用于指示商户名称对应的商户是否为异常商户。2.如权利要求1中所述的方法,其特征在于,根据所述聚类结果中的各样本商户名称的识别结果确定所述商户名称的识别结果,包括:根据所述聚类结果中各聚类距离的第二权重,确定所述聚类结果中各样本商户的权重聚类距离;所述第二权重中距离越近的权重值越高;根据所述权重聚类距离中最小值的样本商户名称确定识别结果,确定为所述商户名称的识别结果。3.如权利要求1中所述的方法,其特征在于,计算所述待处理交易中商户名称的每个分词与各异常关键词的相似度,得到各分词对应的相似度,包括:获取所述待处理交易中的商户名称,通过结巴分词技术获取所述商户名称的各分词;通过分词转换向量工具获取所述各分词的各分词向量;针对所述商户名称的每个分词向量,计算所述分词向量分别与所述各异常关键词向量的相似度,得到所述分词对应的相似度。4.如权利要求1中所述的方法,其特征在于,各聚类特征是样本商户名称在各特征下差异度大于设定阈值的特征,包括:针对任一样本商户名称,根据所述样本商户名称的各分词对应的相似度确定所述样本商户名称在各特征下的特征值;根据各样本商户名称在各特征下的特征值,确定每个特征的方差;将方差不小于预设阈值的特征确定为聚类特征。5.如权利要求1中所述的方法,其特征在于,所述各聚类特征包括各分词对应的相似度中最高相似度、平均相似度,以及商户名称的分词数。6.如权利要求1

5...

【专利技术属性】
技术研发人员:曾佳
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1