用户画像的生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39003051 阅读:16 留言:0更新日期:2023-10-07 10:34
本申请涉及金融科技领域,公开了一种用户画像的生成方法、装置、计算机设备及存储介质,包括:获取画像维度;创建每个画像维度对应的物化视图;获取目标用户数据集合和目标画像维度;对目标用户数据集合与目标画像维度对应的目标物化视图进行交集运算,得到交集用户数据;根据交集用户数据,得到目标用户数据集合在目标画像维度上的用户画像。本申请在指定需求下只需要对目标用户数据集合与其中的部分物化视图取交集即可得到用户画像,而不需要对全量用户进行分析,节省了画像分析的运算量,也节省了存储空间,实现了快速得到人群画像的目的。可满足在金融科技领域例如银行、保险等行业,快速进行用户画像分析的需求。快速进行用户画像分析的需求。快速进行用户画像分析的需求。

【技术实现步骤摘要】
用户画像的生成方法、装置、计算机设备及存储介质


[0001]本申请涉及数据处理及金融科技
,尤其涉及一种用户画像的生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]画像分析是一种快速营销场景中,用于快速评估经营人群是否达到预期或者确定经营人群特征的一种手段。例如通过画像分析可以确定所经营的人群年龄分布、教育程度分布、性别分布等。再结合经验判断是否达到预期,从而辅助决策或者节约成本。
[0003]现有技术针对人群的画像分析,往往需要对全量用户进行画像分析,得到用户画像,尤其针对多个画像维度的分析耗时更久,往往很难满足业务快速分析的需求。尤其在金融科技领域,例如银行、保险等行业,线上业务快速发展,在业务迅速增长的需求下,需要对不同客群进行有针对性的业务挖掘,因此,快速进行用户画像分析是必不可少的环节。

技术实现思路

[0004]本申请的主要目的在于提供一种用户画像的生成方法、装置、计算机设备及存储介质,可以解决现有技术中的画像分析耗时久的技术问题。
[0005]为实现上述目的,本申请第一方面提供一种用户画像的生成方法,该方法包括:
[0006]获取画像维度;
[0007]基于数据源,创建每个画像维度对应的物化视图;
[0008]获取目标用户数据集合和目标画像维度;
[0009]从已创建的物化视图中匹配目标画像维度的目标物化视图;
[0010]对目标用户数据集合与目标物化视图进行交集运算,得到交集用户数据;
[0011]根据交集用户数据,得到目标用户数据集合在目标画像维度上的用户画像。
[0012]为实现上述目的,本申请第二方面提供一种用户画像的生成装置,该装置包括:
[0013]第一数据获取模块,用于获取画像维度;
[0014]物化视图创建模块,用于基于数据源,创建每个画像维度对应的物化视图;
[0015]第二数据获取模块,用于获取目标用户数据集合和目标画像维度;
[0016]匹配模块,用于从已创建的物化视图中匹配目标画像维度的目标物化视图;
[0017]第一运算模块,用于对目标用户数据集合与目标物化视图进行交集运算,得到交集用户数据;
[0018]整合模块,用于根据交集用户数据,得到目标用户数据集合在目标画像维度上的用户画像。
[0019]为实现上述目的,本申请第三方面提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
[0020]获取画像维度;
[0021]基于数据源,创建每个画像维度对应的物化视图;
[0022]获取目标用户数据集合和目标画像维度;
[0023]从已创建的物化视图中匹配目标画像维度的目标物化视图;
[0024]对目标用户数据集合与目标物化视图进行交集运算,得到交集用户数据;
[0025]根据交集用户数据,得到目标用户数据集合在目标画像维度上的用户画像。
[0026]为实现上述目的,本申请第四方面提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
[0027]获取画像维度;
[0028]基于数据源,创建每个画像维度对应的物化视图;
[0029]获取目标用户数据集合和目标画像维度;
[0030]从已创建的物化视图中匹配目标画像维度的目标物化视图;
[0031]对目标用户数据集合与目标物化视图进行交集运算,得到交集用户数据;
[0032]根据交集用户数据,得到目标用户数据集合在目标画像维度上的用户画像。
[0033]采用本申请实施例,具有如下有益效果:
[0034]本申请预先根据画像维度对数据源的用户数据进行聚合,得到每个画像维度的物化视图,在指定需求下只需要对目标用户数据集合与其中的部分物化视图取交集即可得到用户画像,而不需要对全量用户进行分析,物化视图存储的数据量相对于源数据而言大大减少,节省了画像分析的运算量,也节省了存储空间,实现了快速得到人群画像的目的。可满足在金融科技领域,例如银行、保险等行业,在业务迅速增长的需求下,快速进行用户画像分析的需求。
附图说明
[0035]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]其中:
[0037]图1为本申请实施例中用户画像的生成方法的流程图;
[0038]图2为本申请实施例中生成用户画像的示意图;
[0039]图3为本申请实施例中用户画像的生成装置的结构框图;
[0040]图4为本申请实施例中计算机设备的结构框图。
具体实施方式
[0041]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0042]现有技术中针对人群的画像分析,往往是一个比较繁重的操作,因为它需要将所有人群信息输入,按照某个标签聚合然后才能得到结果,尤其针对多个画像维度的分析更是耗时更久,往往很难满足业务快速分析的需求。基于此,本申请提出了快速生成用户画像
的方案。
[0043]如图1所示,在一个实施例中,提供了一种用户画像的生成方法。该方法既可以应用于终端,也可以应用于服务器。该用户画像的生成方法具体包括如下步骤:
[0044]S100:获取画像维度。
[0045]具体地,用户画像的生成方法具体应用于用户画像的生成系统,画像维度是对用户画像的生成系统具有管理权限的用户配置的。画像维度可以通过输入或语音的方式提供给用户画像的生成系统,也可以通过在可视化操作界面选择维度并以指令的方式下发给用户画像的生成系统。
[0046]可选择的画像维度根据数据源中用户的属性标签决定。例如,数据源中存储有用户的年龄、资产、学历、所在城市、存款、信用等级、用户等级等各种属性标签对应的属性值。
[0047]画像维度是从属性标签中选择的。
[0048]S200:基于数据源,创建每个画像维度对应的物化视图。
[0049]具体地,数据源可以是业务系统对应的数据库的全量数据。物化视图是包括一个查询结果的数据库对象,存储基于远程表的数据。将一些大的耗时的表连接用物化视图实现,可以提高查询的效率。
[0050]本实施例对数据源中的源表数据通过画像维度进行聚合汇总,得到每个画像维度对应的物化视图。物化视图即Materialized View,StarRocks中的物化视图是一个特殊的物理表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户画像的生成方法,其特征在于,所述方法包括:获取画像维度;基于数据源,创建每个所述画像维度对应的物化视图;获取目标用户数据集合和目标画像维度;从已创建的物化视图中匹配所述目标画像维度的目标物化视图;对所述目标用户数据集合与所述目标物化视图进行交集运算,得到交集用户数据;根据所述交集用户数据,得到所述目标用户数据集合在所述目标画像维度上的用户画像。2.根据权利要求1所述的方法,其特征在于,在对所述目标用户数据集合与所述目标物化视图进行交集运算,得到交集用户数据之前,所述方法还包括:将每个物化视图转换为位图数据并存储,得到每个物化视图的物化视图位图数据;所述对所述目标用户数据集合与所述目标物化视图进行交集运算,得到交集用户数据,包括:将所述目标用户数据集合转换为位图数据,得到目标用户位图数据;将所述目标用户位图数据与目标物化视图位图数据进行交集计算,得到交集用户数据,其中,所述目标物化视图位图数据为目标物化视图对应的物化视图位图数据。3.根据权利要求1所述的方法,其特征在于,所述交集用户数据包括在所述目标画像维度的至少一个分区上的交集用户数据,每个分区对应目标画像维度的一个取值或一个取值范围;若所述目标画像维度包括至少两个,则所述根据所述交集用户数据,得到所述目标用户数据集合在所述目标画像维度上的用户画像,包括:对所有目标画像维度的交集用户数据按照分区组合进行交集运算,得到所述目标用户数据集合在所有目标画像维度的不同分区组合上的用户分布,其中,每个所述分区组合包括每个目标画像维度的一个分区。4.根据权利要求2所述的方法,其特征在于,若所述目标画像维度包括至少两个,则所述将所述目标用户位图数据与目标物化视图位图数据进行交集计算,得到交集用户数据,包括:将所述目标用户位图数据与一个目标物化视图位图数据进行交集计算,得到对应的第一交集位图数据,所述第一交集位图数据包括在对应目标画像维度的至少一个分区上的交集位图数据,每个分区对应目标画像维度的一个取值或一个取值范围;对所有目标画像维度的第一交集位图数据按照分区组合进行交集运算,得到所述目标用户数据集合在所有目标画像维度的不同分区组合上的第二交集位图数据,其中,每个所述分区组合包括每个目标画像维度的一个分区;将每个分区组合的第二交集位图数据映射为交集用户数据。5.根据权利要求1所述的方法,其特征在于,在获取画像维度之前,所述方法还包括:从用户画像配置需求中提取出画像维度,将所述画像维度添加至已创建的画像维度表中;在创建物化视图之后,所述方法还包括:在所述画像维度表中记录每个画像维度所关联的源数据的源表信息;
根据物化视图的创建情况,在所述画像维度表中为每个画像维度添加物化视图标识,其中,所述物化视图标识用于指示对应画像维度是否已创建物化视图以及对应的物化视图;根据物化视图的当前状态,在所述画像维度表中为每个画像维度添加状态标识,其中,所述状态标识用于...

【专利技术属性】
技术研发人员:魏勇杨丹丹
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1