账户分类方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37625779 阅读:10 留言:0更新日期:2023-05-18 12:17
本申请涉及一种账户分类方法、装置、计算机设备、存储介质和计算机程序产品。通过获取待分类账户的在预设时间段内按照时间顺序排列的行为数据序列,将待分类账户的行为数据序列输入训练好的目标分类模型,该目标分类模型基于携带有账户类型标签的多个样本账户的行为数据序列,对待训练分类模型训练得到,并且账户类型标签根据行为数据序列的数据分布确定,基于目标分类模型输出的分类结果确定待分类账户的账户类型。相较于传统的基于汇总数据进行分类的方式,本方案利用账户按照时间顺序排列的行为数据训练分类模型,能够准确把握账户的行为随时间变化的影响,提高了账户分类的准确度。准确度。准确度。

【技术实现步骤摘要】
账户分类方法、装置、计算机设备和存储介质


[0001]本申请涉及大数据
,特别是涉及一种账户分类方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着大数据技术的不断发展,用户的精细划分成为重要课题和前进方向。更精确、立体的用户划分、用户画像正发挥越来越重要的作用。为用户的账户进行更精确的分类,可以给用户进行更准确的个性化内容的推荐,进而提高用户的使用体验。目前对用户进行分类的方法通常是通过对用户的某项数据进行包括均值或求和等汇总后,再基于汇总数据对用户进行分类。然而,由于用户的爱好会随着时间变化,基于数值运算对用户的账户数据进行汇总的分类,难以把握用户的数据随时间的变化的影响,从而降低账户分类的准确度。
[0003]因此,目前的账户分类方法存在分类准确度低的缺陷。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高分类准确度的账户分类方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种账户分类方法,所述方法包括:
[0006]获取待分类账户的行为数据序列;所述行为数据序列包括对应账户在预设时间段内按照时间顺序排列的行为数据;
[0007]将所述待分类账户的行为数据序列输入到训练好的目标分类模型,根据所述目标分类模型输出的分类结果,确定所述待分类账户的账户类型;所述目标分类模型基于携带有账户类型标签的多个样本账户的行为数据序列,对待训练分类模型训练得到,所述账户类型标签基于所述行为数据序列的数据分布确定。
[0008]在其中一个实施例中,所述方法还包括:
[0009]获取样本账户的行为数据序列;所述行为数据序列包括所述样本账户在预设时间段内按照时间顺序排列的行为数据;
[0010]由预设聚类模型基于所述行为数据序列的数据分布对多个行为数据序列进行聚类,得到不同类型的多个序列集合;每个序列集合中包括带有相同账户类型标签的行为数据序列;
[0011]根据携带有所述账户类型标签的多个行为数据序列训练待训练分类模型,得到训练完成的目标分类模型,以基于所述目标分类模型确定待分类账户的账户类型。
[0012]在其中一个实施例中,所述获取样本账户的行为数据序列,包括:
[0013]过滤多个原始行为数据序列中待过滤的行为数据序列,得到过滤后的原始行为数据序列;所述待过滤的行为数据序列包括序列长度小于或等于预设长度阈值和/或行为数据数量小于预设数量阈值的原始行为数据序列;
[0014]对过滤后的原始行为数据序列进行裁剪和数据填充处理,得到所述样本账户的行
为数据序列。
[0015]在其中一个实施例中,所述对过滤后的原始行为数据序列进行裁剪和数据填充处理,得到所述样本账户的行为数据序列,包括:
[0016]将过滤后的原始行为数据序列裁剪为预设长度,得到裁剪后的行为数据序列;
[0017]若所述裁剪后的行为数据序列中存在缺失行为数据的时间点,根据所述样本账户的历史行为数据补充所述时间点的行为数据,得到所述样本账户的行为数据序列。
[0018]在其中一个实施例中,所述原始行为数据序列包括至少一个周期的行为数据;所述根据所述样本账户的历史行为数据补充所述时间点的行为数据,得到所述样本账户的行为数据序列,包括:
[0019]获取所述裁剪后的行为数据序列中缺失数据的待补充时间点;
[0020]获取所述样本账户对应的历史周期中与所述待补充时间点相同的历史时间点,并获取所述历史时间点中存在行为数据的目标历史时间点;
[0021]补充所述目标历史时间点的行为数据至所述待补充时间点中,得到所述样本账户的行为数据序列。
[0022]在其中一个实施例中,所述由预设聚类模型基于所述行为数据序列的数据分布对多个行为数据序列进行聚类,得到不同类型的多个序列集合,包括:
[0023]获取所述行为数据序列中各个时间点的数据值,根据所述各个时间点的数据值确定所述行为数据序列的分布曲线;
[0024]由所述预设聚类模型基于所述分布曲线的曲线相似度对所述多个行为数据序列进行聚类,得到不同类型的多个序列集合。
[0025]在其中一个实施例中,所述由所述预设聚类模型基于上述分布曲线的曲线相似度对所述多个行为数据序列进行聚类,得到不同类型的多个序列集合,包括:
[0026]由所述预设聚类模型基于所述分布曲线的曲线相似度对所述多个行为数据序列进行聚类,得到多个序列集合;
[0027]将每个所述序列集合中的行为数据序列分割为均匀分布的多个子时间段;
[0028]若所述序列集合中行为数据序列的第一子时间段的数据值大于剩余子时间段的数据值,确定所述序列集合的类型为初期行为偏好类型;
[0029]若所述序列集合中行为数据序列的第二子时间段的数据值大于剩余子时间段的数据值,确定该聚合后的行为数据序列的类型为末期行为偏好类型;
[0030]所述第一子时间段为所述行为数据序列中开头预设时间内的时间段,所述第二子时间段为所述行为数据序列中结尾预设时间内的时间段。
[0031]第二方面,本申请提供了一种账户分类装置,所述装置包括:
[0032]获取模块,用于获取待分类账户的行为数据序列;所述行为数据序列包括对应账户在预设时间段内按照时间顺序排列的行为数据;
[0033]分类模块,用于将所述待分类账户的行为数据序列输入到训练好的目标分类模型,根据所述目标分类模型输出的分类结果,确定所述待分类账户的账户类型;所述目标分类模型基于携带有账户类型标签的多个样本账户的行为数据序列,对待训练分类模型训练得到,所述账户类型标签基于所述行为数据序列的数据分布确定。
[0034]第三方面,本申请提供了一种计算机设备,包括存储器和处理器,所述存储器存储
有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
[0035]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0036]第五方面,本申请提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
[0037]上述账户分类方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待分类账户的在预设时间段内按照时间顺序排列的行为数据序列,将待分类账户的行为数据序列输入训练好的目标分类模型,该目标分类模型基于携带有账户类型标签的多个样本账户的行为数据序列,对待训练分类模型训练得到,并且账户类型标签根据行为数据序列的数据分布确定,基于目标分类模型输出的分类结果确定待分类账户的账户类型。相较于传统的基于汇总数据进行分类的方式,本方案利用账户按照时间顺序排列的行为数据训练分类模型,能够准确把握账户的行为随时间变化的影响,提高了账户分类的准确度。
附图说明
[0038]图1为一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种账户分类方法,其特征在于,所述方法包括:获取待分类账户的行为数据序列;所述行为数据序列包括对应账户在预设时间段内按照时间顺序排列的行为数据;将所述待分类账户的行为数据序列输入到训练好的目标分类模型,根据所述目标分类模型输出的分类结果,确定所述待分类账户的账户类型;所述目标分类模型基于携带有账户类型标签的多个样本账户的行为数据序列,对待训练分类模型训练得到,所述账户类型标签基于所述行为数据序列的数据分布确定。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取样本账户的行为数据序列;所述行为数据序列包括所述样本账户在预设时间段内按照时间顺序排列的行为数据;由预设聚类模型基于所述行为数据序列的数据分布对多个行为数据序列进行聚类,得到不同类型的多个序列集合;每个序列集合中包括带有相同账户类型标签的行为数据序列;根据携带有所述账户类型标签的多个行为数据序列训练待训练分类模型,得到训练完成的目标分类模型,以基于所述目标分类模型确定待分类账户的账户类型。3.根据权利要求2所述的方法,其特征在于,所述获取样本账户的行为数据序列,包括:过滤多个原始行为数据序列中待过滤的行为数据序列,得到过滤后的原始行为数据序列;所述待过滤的行为数据序列包括序列长度小于或等于预设长度阈值和/或行为数据数量小于预设数量阈值的原始行为数据序列;对过滤后的原始行为数据序列进行裁剪和数据填充处理,得到所述样本账户的行为数据序列。4.根据权利要求3所述的方法,其特征在于,所述对过滤后的原始行为数据序列进行裁剪和数据填充处理,得到所述样本账户的行为数据序列,包括:将过滤后的原始行为数据序列裁剪为预设长度,得到裁剪后的行为数据序列;若所述裁剪后的行为数据序列中存在缺失行为数据的时间点,根据所述样本账户的历史行为数据补充所述时间点的行为数据,得到所述样本账户的行为数据序列。5.根据权利要求4所述的方法,其特征在于,所述原始行为数据序列包括至少一个周期的行为数据;所述根据所述样本账户的历史行为数据补充所述时间点的行为数据,得到所述样本账户的行为数据序列,包括:获取所述裁剪后的行为数据序列中缺失数据的待补充时间点;获取所述样本账户对应的历史周期中与所述待补充时间点相同的历史时间点,并获取所述历史时间点中存在行为数据的目标历史时间点;补充所述目标历史时间点的行为数据至所述待补...

【专利技术属性】
技术研发人员:张翼鹏宋承展施好健梁侃
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1