用户数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35243720 阅读:23 留言:0更新日期:2022-10-19 09:49
本申请涉及一种用户数据处理方法、装置、计算机设备和存储介质。所述方法包括:获取待分类的目标用户群,目标用户群包括多个目标用户,基于候选特征维度集合中的候选特征维度分别对目标用户群进行划分,得到候选特征维度对应的划分用户群集合,获取划分用户群集合中的各个划分用户群对应的用户群特征,获取用户群特征之间的特征差异,基于特征差异得到候选特征维度对应的特征区分度,特征区分度与特征差异成正相关关系,基于特征区分度从候选特征维度集合中选取得到目标特征维度,目标特征维度用于对目标用户群进行分类。本申请中可以利用基于人工智能的聚类算法或神经网络模型对目标用户群进行划分。采用本方法能够提高划分用户群的准确度。户群的准确度。户群的准确度。

【技术实现步骤摘要】
用户数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种用户数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术以及人工智能技术的发展,在很多情况下都需要对用户数据进行处理,例如进行用户分群。用户分群指的是将多个用户划分为多个群体。还可以基于划分后的群体进行内容推送,提高内容推送的准确度。目前可以通过人工对用户打标签来对用户进行分群,或者利用人工智能的算法对用户进行分群。
[0003]然而,现有的用户分群方法存在不能准确划分用户群体的情况,例如人工打标签的分群方法中由于主观意识的影响而不能准确划分用户群体,导致划分用户群的准确度较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高划分用户群的准确度的用户数据处理方法、装置、计算机设备和存储介质。
[0005]一种用户数据处理方法,所述方法包括:获取待分类的目标用户群;所述目标用户群包括多个目标用户;基于候选特征维度集合中的候选特征维度分别对所述目标用户群进行划分,得到所述候选特征维度对应的划分用户群集合;获取所述划分用户群集合中的各个划分用户群对应的用户群特征;获取所述用户群特征之间的特征差异,基于所述特征差异得到所述候选特征维度对应的特征区分度,所述特征区分度与所述特征差异成正相关关系;基于所述特征区分度从所述候选特征维度集合中选取得到目标特征维度,所述目标特征维度用于对所述目标用户群进行分类。
[0006]一种用户数据处理装置,所述装置包括:目标用户群获取模块,用于获取待分类的目标用户群;所述目标用户群包括多个目标用户;划分用户群集合得到模块,用于基于候选特征维度集合中的候选特征维度分别对所述目标用户群进行划分,得到所述候选特征维度对应的划分用户群集合;用户群特征获取模块,用于获取所述划分用户群集合中的各个划分用户群对应的用户群特征;特征差异获取模块,用于获取所述用户群特征之间的特征差异,基于所述特征差异得到所述候选特征维度对应的特征区分度,所述特征区分度与所述特征差异成正相关关系;目标特征维度得到模块,用于基于所述特征区分度从所述候选特征维度集合中选取得到目标特征维度,所述目标特征维度用于对所述目标用户群进行分类。
[0007]在一些实施例中,所述用户群特征获取模块包括:目标统计值得到单元,用于对所述划分用户群对应的多个用户特征进行统计,得到各个所述用户特征对应的目标统计值;用户群特征得到单元,用于获取各个所述目标统计值对应的目标特征值,将各个所述目标特征值进行排列,得到所述用户群特征。
[0008]在一些实施例中,所述用户特征包括交互行为特征,所述目标统计值得到单元,还用于对所述划分用户群中与第一交互内容具有交互关联关系的用户进行统计,得到所述交互行为特征对应的目标统计值。
[0009]在一些实施例中,所述用户群特征得到单元,还用于获取第一参考统计值,所述第一参考统计值为对参考用户群对应的所述用户特征进行统计得到的统计值;基于所述目标统计值与所述第一参考统计值之间的数值关系得到对应的目标特征值。
[0010]在一些实施例中,所述数值关系包括比值关系,所述用户群特征得到单元,还用于对所述目标统计值与所述第一参考统计值进行占比运算,得到目标比值;获取所述目标比值所在的目标比值范围,将所述目标比值范围所对应的范围特征值作为所述目标特征值。
[0011]在一些实施例中,所述目标特征维度得到模块,还用于基于所述特征区分度从所述候选特征维度集合中选取满足区分度条件的候选特征维度,将满足区分度条件的候选特征维度作为目标特征维度;所述区分度条件包括特征区分度大于区分度阈值或区分度排序在排序阈值之前的至少一个。
[0012]在一些实施例中,目标特征维度得到模块,还用于基于所述特征区分度从所述候选特征维度集合中选取满足区分度条件的候选特征维度,将各个满足区分度条件的候选特征维度作为选取特征维度组成选取特征维度集合;所述区分度条件包括特征区分度大于区分度阈值或者区分度排序在排序阈值之前的至少一个;获取所述选取特征维度集合中的选取特征维度之间的特征相关度;获取特征相关度大于相关度阈值的选取特征维度组合,所述选取特征维度组合中包括特征相关度大于所述相关度阈值的选取特征维度,从所述选取特征维度组合中确定待去除的选取特征维度,在所述选取特征维度集合中去除所述待去除的选取特征维度,将所述选取特征维度集合中剩余的选取特征维度中的至少一个作为目标特征维度。
[0013]在一些实施例中,目标特征维度得到模块,还用于获取所述选取特征维度组合中的各个选取特征维度在所述目标用户群中的特征覆盖度;将所述选取特征维度组合中特征覆盖度较小的选取特征维度作为待去除的选取特征维度。
[0014]在一些实施例中,特征差异获取模块包括:特征距离计算单元,用于计算所述用户群特征之间的特征距离,将计算得到的特征距离作为所述用户群特征之间的特征差异;特征区分度得到单元,用于将所述特征距离作为所述候选特征维度对应的特征区分度。
[0015]在一些实施例中,所述装置还包括:目标子用户群得到模块,用于基于所述目标特征维度对所述目标用户群进行分类,得到目标子用户群;用户标签得到模块,用于对所述目标子用户群中的用户的用户特征进行统计,基于统计得到的用户统计特征得到所述目标子用户群对应的用户标签。
[0016]在一些实施例中,所述用户标签得到模块包括:用户统计值得到单元,用于对所述目标子用户群中与第二交互内容具有交互关联关系的用户进行统计,得到所述第二交互内容对应的用户统计值;统计差异值获取单元,用于获取所述第二交互内容对应的第二参考统计值,获取所述用户统计值与所述第二参考统计值之间的统计差异值;用户标签得到单元,用于当所述统计差异值大于差异阈值时,基于所述第二交互内容所对应的内容属性得到所述目标子用户群对应的用户标签,以基于所述用户标签进行内容推送。
[0017]在一些实施例中,所述用户标签得到模块还包括:属性统计特征得到单元,用于对
所述目标子用户群中的用户的属性特征进行统计,得到所述目标子用户群对应的属性统计特征,将所述属性统计特征作为所述目标子用户群对应的用户标签;属性统计特征得到单元,用于当接收到针对所述目标子用户群中的用户的属性特征获取请求时,向发送所述属性特征获取请求的设备发送所述属性统计特征。
[0018]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述用户数据处理方法中的步骤。
[0019]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述用户数据处理方法中的步骤。
[0020]在一些实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户数据处理方法,其特征在于,所述方法包括:获取待分类的目标用户群;所述目标用户群包括多个目标用户;基于候选特征维度集合中的候选特征维度分别对所述目标用户群进行划分,得到所述候选特征维度对应的划分用户群集合;获取所述划分用户群集合中的各个划分用户群对应的用户群特征;获取所述用户群特征之间的特征差异,基于所述特征差异得到所述候选特征维度对应的特征区分度,所述特征区分度与所述特征差异成正相关关系;基于所述特征区分度从所述候选特征维度集合中选取得到目标特征维度,所述目标特征维度用于对所述目标用户群进行分类。2.根据权利要求1所述的方法,其特征在于,所述获取所述划分用户群集合中的各个划分用户群对应的用户群特征包括:对所述划分用户群对应的多个用户特征进行统计,得到各个所述用户特征对应的目标统计值;获取各个所述目标统计值对应的目标特征值,将各个所述目标特征值进行排列,得到所述用户群特征。3.根据权利要求2所述的方法,其特征在于,所述用户特征包括交互行为特征,所述对所述划分用户群对应的多个用户特征进行统计,得到各个所述用户特征对应的目标统计值包括:对所述划分用户群中与第一交互内容具有交互关联关系的用户进行统计,得到所述交互行为特征对应的目标统计值。4.根据权利要求2所述的方法,其特征在于,所述获取各个所述目标统计值对应的目标特征值包括:获取第一参考统计值,所述第一参考统计值为对参考用户群对应的所述用户特征进行统计得到的统计值;基于所述目标统计值与所述第一参考统计值之间的数值关系得到对应的目标特征值。5.根据权利要求4所述的方法,其特征在于,所述数值关系包括比值关系,所述基于所述目标统计值与所述第一参考统计值之间的数值关系得到对应的目标特征值包括:对所述目标统计值与所述第一参考统计值进行占比运算,得到目标比值;获取所述目标比值所在的目标比值范围,将所述目标比值范围所对应的范围特征值作为所述目标特征值。6.根据权利要求1所述的方法,其特征在于,所述基于所述特征区分度从所述候选特征维度集合中选取得到目标特征维度包括:基于所述特征区分度从所述候选特征维度集合中选取满足区分度条件的候选特征维度,将满足区分度条件的候选特征维度作为目标特征维度;所述区分度条件包括特征区分度大于区分度阈值或者区分度排序在排序阈值之前的至少一个。7.根据权利要求1所述的方法,其特征在于,所述基于所述特征区分度从所述候选特征维度集合中选取得到目标特征维度包括:基于所述特征区分度从所述候选特征维度集合中选取满足区分度条件的候选特征维
度,将各个满足区分度条件的候选特征维度作为选取特征维度组成选取特征维度集合;所述区分度条件包括特征区分度大于区分度阈值或者区分度排序在排序阈值之前的至少一个;获取所述选取特征维度集合中的选取特征维度之间的特征相关度;获取特征相关度大于相关度阈值的选取特征维度组合,所述选取特征维度组合中包括特征相关度大于所述相关度阈值的选取特征维度,从所述选取特征维度组合中确定待去除的选取特征维度,在所述选取特征维度集合中去除所述待去除的选取特征维度,将所述选取特征维度集合中剩余的选取特征维度中的至少一个作为目标特征...

【专利技术属性】
技术研发人员:蒋凯肖桂菊柳金晶
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1