一种基于XGBoost与MLP的客户流失预测方法技术

技术编号：35993836 阅读：24 留言：0更新日期：2022-12-17 23:09

本发明专利技术涉及一种基于XGBoost与MLP的客户流失预测方法，所述预测方法使用环境在申威平台上，且能够改善客户流失预测系统的准确性以及时效性，所述预测方法分为两个阶段：第一阶段，提取客户数据中的数值型特征，使用XGBoost算法计算出叶子节点的编号，并转换为one

全部详细技术资料下载

【技术实现步骤摘要】
一种基于XGBoost与MLP的客户流失预测方法

[0001]本专利技术涉及数据处理技术，尤其是指一种基于XGBoost与MLP的客户流失预测方法。

技术介绍

[0002]随着社会的快速发展以及产品的日趋同质化，企业之间的竞争日趋激烈，对于一家富有活力且经营正常的公司来说，客户是其最重要的资产之一。在业务多元化、市场饱和化以及经济全球化的背景下，企业吸引新客户的成本远远高于保留老客户，因此防止老客户的流失能够有效地提高企业的利润，越来越多的企业开始意识到保留现有客户的重要性。作为以客户为导向的经营策略中不可缺少的一部分，如何精准识别那些具有高度流失概率的客户，具有至关重要的意义。因此，基于客户的历史信息来构建针对客户流失的早期预警系统成为了企业发展的重点。
[0003]通过客户流失预测系统，企业能够及时发现潜在的流失客户并制定相应的策略，来改善客户不满意度并防止客户的流失。具体而言，客户流失预测就是根据客户的历史信息来计算其未来流失的概率值，即终止与公司关系的可能性，这些概率值可以被用来将客户从最不可能流失到最可能流失进行排序，并对最容易流失的客户进行促销优惠活动。在一项研究中，一家拥有500万客户的公司通过客户流失预测系统对10％的潜在流失客户进行了营销保留活动，由此获得了数十万美元的额外利润。
[0004]然而，由于客户历史数据存在复杂度高、冗余度高以及维度高的特点，如何构建预测模型成为了数据挖掘领域中一个重要的课题。近些年来，随着数据挖掘算法的不断优化，客户流失预测领域也得到了长足的发展，预测算...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost与MLP的客户流失预测方法，所述预测方法使用环境在申威平台上，且能够改善客户流失预测系统的准确性以及时效性，其特征在于，包括如下步骤：步骤S1：收集相关的客户历史数据包括流失客户与非流失客户的多属性数据，并打上对应的标签以形成相应的训练数据；步骤S2：计算特征的方差，然后排序并删除方差较低的特征，可以提高预测准确度并降低计算量；步骤S3：将数值型特征中缺失的数据替换为该特征的平均值，再进行Z
‑
Score归一化处理；步骤S4：使用one
‑
hot编码处理离散型特征，整理预处理后客户数据；步骤S5：使用XGBoost算法处理数值型特征，将计算后获得的叶子节点的编号替代原有的数值型特征，然后将更新后的客户数据输入MLP，构建损失函数，使用梯度下降算法训练预测模型；步骤S6：将训练好的预测模型部署在申威服务器上，计算出企业客户的流失概率。2.根据权利要求1所述的基于XGBoost与MLP的客户流失预测方法，其特征在于：所述步骤S1中标签以形成相应的客户数量为M特征数量为N的训练数据D＝{(x
i
,y
i
)|i＝1,
…
,M}，其中其中客户标签y
i
＝{0,1}表示如果y
i
＝0则客户为非流失客户，y
i
＝1则客户为流失客户；另外定义pred
i
为客户流失预测系统的预测值。3.根据权利要求1所述的基于XGBoost与MLP的客户流失预测方法，其特征在于：所述步骤S2方差的计算公式如下：对N个特征分别计算方差后，根据方差将特征从高到低排序，并删除方差低的特征。4.根据权利要求1所述的基于XGBoost与MLP的客户流失预测方法，其特征在于：所述步骤S3中归一化处理公式，如下：5.根据权利要求1所述的基于XGBoost与MLP的客户流失预测方法，其特征在于：所述步骤S4中one
‑
hot编码将输入样本处...

【专利技术属性】
技术研发人员：唐琪，张昊，朱仪，蒋敏，范昌华，张取义，
申请(专利权)人：中电科申泰信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人