平台用户流失的预测方法技术

技术编号:32215788 阅读:33 留言:0更新日期:2022-02-09 17:21
一种平台用户流失的预测方法,属于计算机技术领域,用于解决平台用户流失预测不准确的问题,包括,获取原始数据并对所述原始数据预处理;基于RFM模型提取用户流失预测特征变量,将用户行为数据转换为体现用户价值的所述用户流失预测特征变量;基于随机森林算法对所述用户流失预测特征变量进行分析,得到用户流失预警模型;依据用户流失预警模型对平台用户分析,计算各用户流失概率,对用户进行分类。方便了电商平台从数据化和技术层面的角度对用户进行分类,为电商平台的运营提供数据性的指导,可以针对不同的用户提供个性化的运营策略;同时本发明专利技术提高了电商平台运营效率,实现了平台数字化、差异化的运营。差异化的运营。差异化的运营。

【技术实现步骤摘要】
平台用户流失的预测方法


[0001]本专利技术涉及数据分析
,更具体地说,涉及一种基于工业电商平台用户流失的预测方法。

技术介绍

[0002]随着互联网从消费领域向工业领域不断拓展,企业数字化转型势在必行,以B2B为主要特征,以供应链管理为核心的工业电子商务迎来巨大机遇,成为各方关注焦点,发展工业电子商务是推动工业互联网平台落地的重要抓手,对制造业数字化转型具有重要的先导作用和引领作用。工业电商平台的核心还是用户,面对不同行为特征的用户群体,科学识别流失用户并精准细分,从而制定差异化的营销策略进行流失预警,是企业做好忠诚度维护的关键。
[0003]目前用户流失预警的方法主要有RFM模型、K

means聚类、逻辑回归等。RFM模型根据R、F、M三个指标的值将用户划分为8类,导致用户分类存在模糊不清的问题。经典的聚类算法K

means聚类,常与RFM模型结合使用,以提高分类的精确度,但因k需要人工确定,存在聚类不精确;CN112465544A公开了一种用户流失预警的方法和装置,根据历史用户数据生成数据集;依据数据集中的训练集和测试集进行回归模型训练,得到用户流失预警模型,但这种回归方式不够灵活,无法自然地捕捉到更复杂的关系,而且比较耗时,不能准确的对用户分类进行预警。

技术实现思路

[0004]有鉴于以上预测平台用户流失耗时、不准确等问题,有必要提出一种平台用户流失的预测方法,所述预测方法可以准确的预测用户流失、并对流失的用户进行分类,为平台营销提供数据,以提高用户的忠诚度,实现平台利益的最大化。
[0005]一种平台用户流失的预测方法,包括,
[0006]S01,获取原始数据并对所述原始数据预处理;
[0007]S02,基于RFM模型提取用户流失预测特征变量,将用户行为数据转换为体现用户价值的所述用户流失预测特征变量;
[0008]S03,基于随机森林算法对所述用户流失预测特征变量进行分析,得到用户流失预警模型;
[0009]S04,依据用户流失预警模型对平台用户分析,计算各用户流失概率,对用户进行分类。
[0010]本专利技术帮助电商平台管理者根据用户状态实现用户流失预测,有助于平台运营人员区分重要价值客户,跟踪监控用户行为,及时对用户流失情况进行预警,降低平台运营成本,实现平台数字化运营。
[0011]进一步地,在所述获取原始数据并对所述原始数据预处理的步骤中,获取的原始数据包括用户基础信息数据和用户交易记录数据。
[0012]更进一步地,所述预处理是剔除有缺失和有异常的所述用户基础信息数据和用户交易记录数据,以保证获取的原始数据的完整性,以使后续分析更准确。
[0013]更近一步地,将预处理后的所述用户基础信息数据和所述用户交易记录数据形成以用户ID为主键的数据群组,所述数据群组包含第一样本和第二样本;样本的划分标准是,确定预测日期并进行第一次数据划分,在某一段时间内购买行为、但最近无购买行为的用户视为第一样本;在某一段时间内有购买行为、最近也有购买的用户视为第二样本。
[0014]进一步地,在所述基于RFM模型提取用户流失预测特征变量的步骤中,所述RFM模型是一个经典的用户分类以增强客户关系管理的模型,通过通用交易环节中最核心的三个指标Recency

最近一次消费、Frequency

消费次数和Monetary

消费金额来衡量用户价值,从而实现用户的细分。为了使所述RFM模型能够精准的预测用户流失,在所述RFM模型中引入首次购买与最后一次购买的时间间隔D和二次回购的时间间隔T,形成了RFMDT模型,所述RFMDT模型对电商平台用户的消费行为和用户价值进行了更细致的诠释。所述RFMDT模型的值优秀则表示用户价值高、所述RFMDT模型的值一般则表示用户价值中、所述RFMDT模型的值差则表示用户价值小。
[0015]更进一步地,所述时间间隔D的计算方法是用最后一次购买的日期减去首次购买的日期,单位为天,所述时间间隔D用以表示用户与企业关系的生命周期的长度。
[0016]更进一步地,所述时间间隔T的计算方法是用第二次购买的日期减去第一次购买的日期,单位为天,所述时间间隔T用以反应企业各个用户群的复购率的高低。
[0017]进一步地,根据所述RFMDT模型,执行S03,所述基于随机森林算法对所述用户流失预测特征变量进行分析,包括如下内容:
[0018]S11,获取所述用户流失预测特征变量;
[0019]S12,将所述用户流失预测特征变量以ID主键按照8:2的比例随机分为两组,将随机分出的80%的所述用户流失预测特征变量组成的数据形成模型训练数据组,用以模型的训练;将随机分出的20%的所述用户流失预测特征变量的数据形成模型测试数据组,用以预测平台用户的流失;
[0020]S13,为防止模型出现过拟合现象,采用K折交叉验证法对所述模型训练数据组和模型测试数据组进行验证;具体地,1)将所述模型训练数据组划分为K小组,随机轮流使用所述K

1小组数据组成用以训练的数据进行模型训练,每次训练即可形成一个训练后的模型数据组;2)采用所述K小组数据中未参与训练的数据组对所述训练后的模型数据组进行预测,得到K个测试结果;3)对K个所述测试结果加和求平均,得到预测训练数据组;4)同理,采用K折交叉验证法对所述模型测试数据组进行训练和预测,得到预测测试数据组;
[0021]S14,在S13的基础上,建立完整的随机森林算法,对所述预测训练数据组进行可放回的随机抽样,形成N组预测训练子数据组,在每个所述预测训练子数据组中随机抽取n个所述用户流失预测特征变量,N组所述用户流失预测特征变量形成最优学习模型y=F(x);在所述最优学习模型y=F(x)中输入或者导入所述预测测试数据组的数据,以验证所述最优学习模型y=F(x)的正确性和准确性,将获得的K个所述预测测试数据组的最优模型的值加和求平均值即可获得用户的流失概率值。所述最优学习模型y=F(x)即为用户流失预警模型。
[0022]进一步地,所述步骤S04的执行过程如下:
[0023]S21,输入未标签的数据,通过所述用户流失预警模型判断当前用户是否会出现流失;
[0024]S22,计算出每个用户流失的概率,根据用户价值与流失概率两个维度,构建用户价值

流失概率矩阵图;
[0025]S23,通过所述用户价值

流失概率矩阵图将平台用户分为9类,针对不同类别的用户,可有针对性的制定运营策略。
[0026]更进一步地,所述未标签的数据是不包含在所述数据群组中的用户的数据。
[0027]本专利技术技术方案的有益效果:使得可以根据用户的行为对用户进行预测,且本专利技术所述的用户流失预警模型能够方便电商平台从数据化和技术层面的角度对用户进行分类,可以根据用户的历史数据对用户行为进行预测,为电商本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种平台用户流失的预测方法,其特征在于,获取原始数据并对所述原始数据预处理;基于RFM模型提取用户流失预测特征变量,将用户行为数据转换为体现用户价值的所述用户流失预测特征变量;基于随机森林算法对所述用户流失预测特征变量进行分析,得到用户流失预警模型;依据用户流失预警模型对平台用户分析,计算各用户流失概率,对用户进行分类。2.如权利要求1所述的平台用户流失的预测方法,其特征在于,所述获取原始数据并对所述原始数据预处理的步骤中,获取的原始数据包括用户基础信息数据和用户交易记录数据。3.如权利要求2所述的平台用户流失的预测方法,其特征在于,所述预处理是剔除有缺失和有异常的所述用户基础信息数据和用户交易记录数据,以保证获取的原始数据的完整性。4.如权利要求3所述的平台用户流失的预测方法,其特征在于,将预处理后的所述用户基础信息数据和所述用户交易记录数据形成以用户ID为主键的数据群组,所述数据群组包含第一样本和第二样本;样本的划分标准是,确定预测日期并进行第一次数据划分,在某一段时间内购买行为、但最近无购买行为的用户视为第一样本;在某一段时间内有购买行为、最近也有购买的用户视为第二样本。5.如权利要求4所述的平台用户流失的预测方法,其特征在于,所述基于RFM模型提取用户流失预测特征变量,包括:将所述数据群组导入所述MySQL数据库后,对所述数据群组进行清洗、转换和补全,以用户ID作为主键形成一张数据表,也即所述数据表的一行包含一个用户的所有信息,从而方便后续数据的调取和使用;将所述第一样本视为流失用户、将第二样本视为未流失用户;搭建RFMDT模型,所述RFMDT模型包括用户流失预测特征变量Recency

最近一次消费、Frequency

消费次数、Monetary

消费金额、时间间隔D和时间间隔T。6.如权利要求5所述的平台用户流失的预测方法,其特征在于,所述时间间隔D的计算方法是用最后一次购买的日期减去首次购买的日期。7.如权利要求5所述的平台用户流失的预测方法,其特征在于,所述时间间隔T的计算方法是用第二次购买的日期减去第一次购买的日期。8.如权利要求5所述的平台用户流失的预测方法,其特征在于,所述基于随机森林算法对所述用户流失预测特征变量进行分析,包括:获取所述用户流失预测特征变量;将所述用户流失预测特征变量以ID主键按照8:2的比例随机分为...

【专利技术属性】
技术研发人员:何佳婧白晋成邱建斌唐晋升张俸山
申请(专利权)人:共享智能铸造产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1