一种用户数据处理方法和系统技术方案

技术编号：36291546 阅读：50 留言：0更新日期：2023-01-13 10:04

本发明专利技术涉及大数据分析技术领域中的一种用户数据处理方法和系统，包括以下步骤：获取初始用户分层指标数据和分层数量，并构建累计人数占比关于累计分值占比的初始洛伦兹曲线；基于初始洛伦兹曲线获取第一分层点，并获取第一分层数据；获取累计分值占比高于第一分层点的累计分值占比的剩余用户分层指标数据，并构建累计人数占比关于累计分值占比的重置洛伦兹曲线；基于重置洛伦兹曲线获取第二分层点，并获取第二分层数据；循环构建重置洛伦兹曲线的步骤，并基于重置洛伦兹曲线获取第n分层点，根据第n分层点获取第n分层数据，具有用户分层更合理的优点，突破了人工干预导致用户分层不精确的瓶颈。精确的瓶颈。精确的瓶颈。

全部详细技术资料下载

【技术实现步骤摘要】
一种用户数据处理方法和系统

[0001]本专利技术涉及大数据分析
，具体涉及一种用户数据处理方法和系统。

技术介绍

[0002]基于大数据的用户分层分类方法是无监督算法在工业领域的一种应用，目前被频繁应用于解决该类问题的方案有聚类和RFM方法，其中聚类算法基于样本间指标数据的距离或者样本分布的密集程度对目标数据进行聚类，RFM方法基于用户近度、频度、值度三个重要指标对数据的等频或等距划分，继而采用专家打分或聚类的方式进行用户分层。
[0003]然而，上述两种分层分类方式均为较为成熟的用户分层分类方式，二者均为依据指标的不同特点对样本进行划分，不足点在于聚类算法业务解释相对复杂，聚类算法本身不够具备解释性，无法表明清楚聚类时用户的分层分类依据，而RFM方法存在较多的人工干预，并非局部最优算法。

技术实现思路

[0004]本专利技术针对现有技术中的缺点，提供了一种用户数据处理方法和系统，具有用户分层更合理的优点，突破了人工干预导致用户分层不精确的瓶颈。
[0005]为了解决上述技术问题，本专利技术通过下述技术方案得以解决：
[0006]一种用户数据处理方法，包括以下步骤：
[0007]获取初始用户分层指标数据和分层数量，并构建累计人数占比关于累计分值占比的初始洛伦兹曲线；
[0008]基于所述初始洛伦兹曲线获取第一分层点，并根据所述第一分层点获取第一分层数据；
[0009]获取累计分值占比高于第一分层点的累计分值占比的剩余用户分层指标数据，并基于所述剩...

【技术保护点】

【技术特征摘要】
1.一种用户数据处理方法，其特征在于，包括以下步骤：获取初始用户分层指标数据和分层数量，并构建累计人数占比关于累计分值占比的初始洛伦兹曲线；基于所述初始洛伦兹曲线获取第一分层点，并根据所述第一分层点获取第一分层数据；获取累计分值占比高于第一分层点的累计分值占比的剩余用户分层指标数据，并基于所述剩余用户分层指标数据，构建累计人数占比关于累计分值占比的重置洛伦兹曲线；基于所述重置洛伦兹曲线获取第二分层点，并根据所述第二分层点获取第二分层数据；循环构建重置洛伦兹曲线的步骤，并基于所述重置洛伦兹曲线获取第n分层点，根据所述第n分层点获取第n分层数据，其中n为大于2的正整数，且n＝分层数量
‑
1。2.根据权利要求1所述的一种用户数据处理方法，其特征在于，获取初始用户分层指标数据，包括以下步骤：获取设定周期内的用户样本数据，根据分层数量和标准分层规则，将所述用户样本数据进行标准化分层，得到标准化层级；计算标准化分层后，各个层级对应的用户样本数据的累计分值总和以及累计人数总和；基于各个层级对应的所述累计分值总和以及累计人数总和，计算各个层级对应的累计分值占比以及累计人数占比，生成初始用户分层指标数据。3.根据权利要求2所述的一种用户数据处理方法，其特征在于，基于所述初始洛伦兹曲线获取第一分层点，包括以下步骤：构建所述初始洛伦兹曲线的绝对平等线；获取所述绝对平等线与初始洛伦兹曲线距离最远的点作为第一分层点。4.根据权利要求2所述的一种用户数据处理方法，其特征在于，还包括以下步骤：获取每组分层点对应的累计分值占比和累计人数占比，以及各组累计分值占比对应的累计分值总和、累计人数总和，其中，所述分层点为第一分层点、第二分层点或第n分层点；基于各组累计分值占比对应的累计分值总和以及累计人数总和，将每组所述分层点对应的关键分值指标值作为用户分层指标，并基于所述用户分层指标将所述用户样本数据进行优化分层。5.根据权利要求2所述的一种用户数据处理方法，其特征在于，各个层级对应的用户样本数据的累计分值总和为各个层级对应的用户样本数据中，每个用户的资产管理规模。6.根据权利要求2所述的一种用户数据处理方法，其特征在于，各个层级对应的用户样本数据的累计分值总和为各个层级对应的用户样本数据中，每个用户的活跃度、贡献度以及忠诚度的分值之和。7.一种用户数据处理系统，其特征在...

【专利技术属性】
技术研发人员：王联军，沈福恩，马平男，王有兵，
申请(专利权)人：杭州雅拓信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人