基于金融交易数据的用户画像构建方法技术

技术编号:36798457 阅读:17 留言:0更新日期:2023-03-08 23:21
本发明专利技术涉及数据处理技术领域,具体涉及基于金融交易数据的用户画像构建方法,包括:构建每个用户的基本属性向量以及行为向量;根据一个属性将用户分为多个属性类别,获取每个属性类别的属性代表值以及活跃度标量,进一步获取独立属性以及非独立属性;根据两个非独立属性的每个属性类别构建的无向图获取匹配类别对;根据所有匹配类别对的属性二元组以及活跃度二元组获取多个组合属性;根据所有独立属性以及组合属性将用户分为多个用户类别,根据每个用户类别的行为向量获取活跃度;获取每个用户类别的属性值均值向量;属性值均值向量以及活跃度构成每个用户类别的用户画像。本发明专利技术有助于精准的营销推荐。助于精准的营销推荐。助于精准的营销推荐。

【技术实现步骤摘要】
基于金融交易数据的用户画像构建方法


[0001]本专利技术涉及数据处理
,具体涉及基于金融交易数据的用户画像构建方法。

技术介绍

[0002]用户画像是将一类有共同特征的用户聚类分析后得到的,因而并非针对某个具象的特定个人。现有用户画像方法是通过对用户的交易行为进行分析,实现用户分类,根据每个用户类别得到用户画像,该方法只对用户的交易行为进行分析,没有结合用户的基本属性,例如:年龄、收入等情况,得到的用户分类结果只是单纯的从交易数据角度出发的,局限性较大。若将根据用户分类结果得到的用户画像用于营销、推荐等方面时,效果往往不够理想。基于此,本专利技术提出了一种基于金融交易数据的用户画像构建方法,通过计算与活跃度相关程度较大的独立属性和组合属性,结合用户的活跃度得到用户画像,有助于精准的营销推荐。

技术实现思路

[0003]本专利技术提供基于金融交易数据的用户画像构建方法,以解决现有的问题。
[0004]本专利技术的基于金融交易数据的用户画像构建方法采用如下技术方案:本专利技术一个实施例提供了基于金融交易数据的用户画像构建方法,该方法包括以下步骤:S1:构建每个用户的基本属性向量以及行为向量;S2:根据一个属性将用户分为多个属性类别,获取每个属性类别的属性代表值;对每个属性类别中所有用户的行为向量进行降维,得到每个属性类别的类别代表行为向量;根据所有属性类别的类别代表行为向量获取每个属性类别的活跃度标量;根据所有属性类别的属性代表值以及活跃度标量获取独立属性或非独立属性;将所有的非独立属性组成非独立属性序列;S3:对非独立属性序列中前两个非独立属性进行组合属性获取操作,包括:根据两个非独立属性的每个属性类别构建无向图,利用KM匹配的方法对无向图进行最优最小匹配,得到两个非独立属性的属性类别之间的匹配关系,将匹配的两个属性类别作为匹配类别对;对匹配类别对中的属性类别进行更新,将匹配类别对中所有属性类别更新后的属性代表值作为匹配类别对的属性二元组,将匹配类别对中所有属性类别更新前的活跃度标量作为匹配类别对的活跃度二元组;根据所有匹配类别对的属性二元组以及活跃度二元组获取组合属性或基本单元;当获得组合属性时,将组合属性从非独立属性序列删除;当获得基本单元时,将基本单元作为非独立属性序列中第一个非独立属性;S4:重复S3直到非独立属性序列的长度小于等于1时停止迭代;S5:根据所有独立属性以及组合属性对所有用户进行分类,得到多个用户类别;根
据每个用户的行为向量获取每个用户类别的活跃度;获取每个用户类别的属性值均值向量;每个用户类别的属性值均值向量以及活跃度构成该用户类别的用户画像。
[0005]优选的,所述根据一个属性将用户分为多个属性类别,获取每个属性类别的属性代表值,包括的具体步骤如下:获取所有用户同一个属性的所有不同属性值,统计每个属性值的频率;将所有属性值按照从小到大的顺序排列得到属性值序列,根据属性值序列中每个属性值的频率利用多阈值分割的方法对属性值序列进行分割,将属性值序列分成多个类别,将每个类别中所有属性值对应的用户作为一个属性类别;将每个属性类别中所有用户对应属性的属性值的均值作为该属性类别的属性代表值。
[0006]优选的,所述根据所有属性类别的类别代表行为向量获取每个属性类别的活跃度标量,包括的具体步骤如下:设投影向量为,将一个属性对应的每个属性类别的类别代表行为向量分别表示、; 其中Q表示属性对应的每个属性类别的类别代表行为向量的个数,构建标量的计算模型:计算模型中分别为一个属性对应的多个属性类别的类别代表行为向量;为投影向量;为点积运算符;分别为转化后的标量;条件模型中分别为一个属性对应的多个属性类别的类别代表行为向量;、分别为的模;分别为转化后的标量;对标量的计算模型和条件模型利用线性代数进行求解,得到投影向量以及每个属性类别的类别代表行为向量转换得到的标量;将得到的标量分别作为每个属性类别的活跃度标量。
[0007]优选的,所述根据所有属性类别的属性代表值以及活跃度标量获取独立属性或非独立属性,包括的具体步骤如下:
将所有属性类别的属性代表值按照从小到大的顺序排序得到类别属性标量序列,将类别属性标量序列中每个属性代表值对应的类别属性的活跃度标量组成活跃度标量序列;计算类别属性标量序列与活跃度标量序列的皮尔逊相关系数,若所得结果大于第一预设阈值,将属性类别对应的属性作为独立属性,若所得结果小于或等于第一预设阈值,将属性类别对应的属性作为非独立属性。
[0008]优选的,所述根据两个非独立属性的每个属性类别构建无向图,包括的具体步骤如下:将两个非独立属性的每个属性类别分别作为一个节点,将每个属性类别的属性代表值作为节点值,将两个非独立属性的属性类别的属性代表值的比值作为两个节点之间的边权值,根据节点、节点值以及边权值构建无向图。
[0009]优选的,所述对匹配类别对中的属性类别进行更新,包括的具体步骤如下:将匹配类别对中不重叠的用户从匹配类别对中的每个属性类别中删除,实现匹配类别对中的属性类别的更新。
[0010]优选的,所述根据所有匹配类别对的属性二元组以及活跃度二元组获取组合属性或基本单元,包括的具体步骤如下:将属性二元组的L2范数作为属性二元组的大小,记为二元组属性值;将活跃度二元组的L2范数作为活跃度二元组的大小,记为二元组活跃度值;将所有匹配类别对的二元组属性值按照从小到大的顺序排序得到二元组属性值序列,获取二元组属性值序列对应的二元组活跃度值序列;计算二元组属性值序列与二元活跃度值序列的余弦相似度,若所述余弦相似度大于第二预设阈值,匹配类别对对应的两个非独立属性为一个组合属性,若所述余弦相似度小于或等于第二预设阈值,匹配类别对对应的两个非独立属性为一个基本单元。
[0011]优选的,所述根据所有独立属性以及组合属性对所有用户进行分类,得到多个用户类别,包括的具体步骤如下:将任意两个用户的同一个独立属性的属性值的比值作为所述两个用户的同一个独立属性的相似度;将一个用户的一个组合属性对应的多个属性的属性值作为所述一个用户的一个组合属性的向量,将任意两个用户的同一个组合属性的向量之间的余弦相似度作为所述两个用户的同一个组合属性的相似度;将任意两个用户的所有独立属性的相似度以及所有组合属性的相似度之和作为两个用户的相似度,将相似度大于相似度阈值的用户划分为一个用户类别,根据每个用户所属的用户类别对所有用户类别进行更新;所述根据每个用户所属的用户类别对所有用户类别进行更新,包括:若一个用户属于多个用户类别时,将该用户所属的用户类别称为预备用户类别,将该用户从所有预备用户类别中删除,实现用户类别的第一次更新;计算该用户与每个预备用户类别中所有用户的相似度的均值,作为该用户与每个预备用户类别的相似度,将其中相似度最大的预备用户类别作为该用户的真实用户类别,将该用户添加到真实用户类别中,实现用户类别的第二次更新;同理,根据所有属于多个用户类别的用户对用户类别进行多次更新,使得最终每个用户仅属于一个用户类别。
[0012]优选的,所述根据每个用户的行为向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于金融交易数据的用户画像构建方法,其特征在于,该方法包括以下步骤:S1:构建每个用户的基本属性向量以及行为向量;S2:根据一个属性将用户分为多个属性类别,获取每个属性类别的属性代表值;对每个属性类别中所有用户的行为向量进行降维,得到每个属性类别的类别代表行为向量;根据所有属性类别的类别代表行为向量获取每个属性类别的活跃度标量;根据所有属性类别的属性代表值以及活跃度标量获取独立属性或非独立属性;将所有的非独立属性组成非独立属性序列;S3:对非独立属性序列中前两个非独立属性进行组合属性获取操作,包括:根据两个非独立属性的每个属性类别构建无向图,利用KM匹配的方法对无向图进行最优最小匹配,得到两个非独立属性的属性类别之间的匹配关系,将匹配的两个属性类别作为匹配类别对;对匹配类别对中的属性类别进行更新,将匹配类别对中所有属性类别更新后的属性代表值作为匹配类别对的属性二元组,将匹配类别对中所有属性类别更新前的活跃度标量作为匹配类别对的活跃度二元组;根据所有匹配类别对的属性二元组以及活跃度二元组获取组合属性或基本单元;当获得组合属性时,将组合属性从非独立属性序列删除;当获得基本单元时,将基本单元作为非独立属性序列中第一个非独立属性;S4:重复S3直到非独立属性序列的长度小于等于1时停止迭代;S5:根据所有独立属性以及组合属性对所有用户进行分类,得到多个用户类别;根据每个用户的行为向量获取每个用户类别的活跃度;获取每个用户类别的属性值均值向量;每个用户类别的属性值均值向量以及活跃度构成该用户类别的用户画像。2.根据权利要求1所述的基于金融交易数据的用户画像构建方法,其特征在于,所述根据一个属性将用户分为多个属性类别,获取每个属性类别的属性代表值,包括的具体步骤如下:获取所有用户同一个属性的所有不同属性值,统计每个属性值的频率;将所有属性值按照从小到大的顺序排列得到属性值序列,根据属性值序列中每个属性值的频率利用多阈值分割的方法对属性值序列进行分割,将属性值序列分成多个类别,将每个类别中所有属性值对应的用户作为一个属性类别;将每个属性类别中所有用户对应属性的属性值的均值作为该属性类别的属性代表值。3.根据权利要求1所述的基于金融交易数据的用户画像构建方法,其特征在于,所述根据所有属性类别的类别代表行为向量获取每个属性类别的活跃度标量,包括的具体步骤如下:设投影向量为,将一个属性对应的每个属性类别的类别代表行为向量分别表示为、;其中Q表示属性对应的每个属性类别的类别代表行为向量的个数,构建标量的计算模型:
计算模型中分别为一个属性对应的多个属性类别的类别代表行为向量;为投影向量;为点积运算符;分别为 转化后的标量;构建标量的条件模型:条件模型中分别为一个属性对应的多个属性类别的类别代表行为向量;、分别为的模;分别为转化后的标量;对标量的计算模型和条件模型利用线性代数进行求解,得到投影向量以及每个属性类别的类别代表行为向量转换得到的标量;将得到的标量分别作为每个属性类别的活跃度标量。4.根据权利要求1所述的基于金融交易数据的用户画像构建方法,其特征在于,所述根据所有属性类别的属性代表值以及活跃度标量获取独立属性或非独立属性,包括的具体步骤如下:将所有属性类别的属性代表值按照从小到大的顺序排序得到类别属性标量序列,将类别属性标量序列中每个属性代表值对应的类别属性的活跃度标量组成活跃度标量序列;计算类别属性标量序列与活跃度标量序列的皮尔逊相关系数,若所得结果大于第一预设阈值,将属性类别对应的属性作为独立属性,若所得结果小于或等于第一预设阈值,将属性类别对应的属性作...

【专利技术属性】
技术研发人员:贾庆佳张磊孙剑李瑞敏柏琳陆星
申请(专利权)人:万链指数青岛信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1