一种用于客户流失预测的数据挖掘方法技术

技术编号:32562989 阅读:20 留言:0更新日期:2022-03-09 16:47
本发明专利技术为一种用于客户流失预测的数据挖掘方法,涉及数据监控技术领域,包括数据获取步骤,特征变量选择步骤,样本选取步骤,数据预处理步骤,构建训练集和和测试集步骤和执行训练步骤,数据获取步骤包括,建立数据库,对接银行数据系统;特征变量选择包括,选取满足预测算法的特征变量;样本选取步骤包括,根据原始算法,以所收集的数据,对客户流失量进行数据准备;数据预处理步骤包括,整合基础数据,清理无关数据和空值;构建训练集和测试集步骤包括,抽取样本,将所抽取的样本分为训练集和测试集;执行训练步骤包括,按照模型参数的重要性程度进行训练,并以最优解滚动迭代,根据本方法可以预测用户流失概率,从而方便工作人员进行维护。进行维护。进行维护。

【技术实现步骤摘要】
一种用于客户流失预测的数据挖掘方法


[0001]本专利技术涉及数据监控
,具体为一种用于客户流失预测的数据挖掘方法。

技术介绍

[0002]当下互联网上的金融理财程序越来越多,由于银行必须对所提供的理财产品严格负责,银行的所提供的理财产品相对于其它互联网平台所提供的或者所描述的相对保守,从而相对互联网平台的理财产品不容易吸引客户注意,导致了大量客户的存款的流失。
[0003]从成本收益角度看,存量客户产生收益远大于新增客户,同时存量客户的流失将会导致巨大的损失,挽留存量客户难度和成本低于获取新客户。

技术实现思路

[0004]本专利技术提出了一种用于客户流失预测的数据挖掘方法,增强银行对客户服务的提升和挽留效率,解决长尾客户无人管、无力管的状况。
[0005]本专利技术的技术方案如下:一种用于客户流失预测的数据挖掘方法,包括数据获取步骤,特征变量选择步骤,样本选取步骤,数据预处理步骤,构建训练集和和测试集步骤和执行训练步骤,其中,所述数据获取步骤包括,建立数据库,对接银行数据系统;所述特征变量选择步骤包括,选取满足预测算法的特征变量;所述样本选取步骤包括,根据原始算法,以所收集的数据,对客户流失量进行数据准备;所述数据预处理步骤包括,整合基础数据,清理无关数据和空值;所述构建训练集和测试集步骤包括,抽取样本,将所抽取的样本分为训练集和测试集;所述执行训练步骤包括,按照模型参数的重要性程度进行训练,并以最优解滚动迭代。
[0006]作为本方案的进一步优化,所述数据获取步骤包括建立数据库,同时对接银行的数据系统对数据库进行信息传递。
[0007]作为本方案的进一步优化,所建立的数据库内容包括客户身份信息、客户资产信息、客户交易信息和产品信息。
[0008]作为本方案的进一步优化,所述客户身份信息包括客户ID、年龄和性别,所述产品信息包括活期存款指标、定期存款指标、贷款情况指标、卡业务使用及办理情况、投资理财业务指标和产品综合指标,所述客户资产信息包括总金融资产情况 FA/AUM 及其变动情况,所述客户交易信息包括渠道产品签约情况指标,AUM 交易渠道情况指标、流入、流出情况、大小额转账和第三方及同名账户指标。
[0009]作为本方案的进一步优化,所述特征变量选择步骤包括,根据算法需求,设定条件,选取满足条件的特征变量;
所述样本选取步骤包括,将选取的特征变量带入原始的算法,进行预测准备。
[0010]作为本方案的进一步优化,所述数据预处理步骤包括根据原始算法,以个人客户号为连接条件,对所选取的特征值进行排列和总结,清理特征值中的无关数据和空值。
[0011]作为本方案的进一步优化,所述构建训练集和测试集步骤包括根据预测需求,选取样本数据进行试验,并根据设定,划分为训练集和测试集。
[0012]作为本方案的进一步优化,根据原始算法,得到对模型影响最重要的参数,模型训练从对模型影响最重要的参数作为起点,按照对模型影响的重要性程度递减方向依次训练,每次训练将之前训练得到的最优解作输入固定,滚动迭代。
[0013]本专利技术的工作原理及有益效果为:为原始的客户行为的预测算法提供特征和实际数据,对数据值进行不断模拟,将模拟结果与实际结果进行对比,本方案建立一个个人银行客户流失预测模型,预测贵宾客户在未来流失的概率,并根据模型中优势特征表现情况,给出客户流失原因分类作为参考,协助客户经理监控可能流失客户,及早预防贵宾客户流失。
附图说明
[0014]下面结合附图和具体实施方式对本专利技术作进一步详细的说明。
[0015]图1为本专利技术的流程框图;图2为本专利技术中实施例2的流程框图。
具体实施方式
[0016]下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都涉及本专利技术保护的范围。
[0017]具体实施例1,如说明书附图1所示,一种用于客户流失预测的数据挖掘方法,包括数据获取步骤,特征变量选择步骤,样本选取步骤,数据预处理步骤,构建训练集和和测试集步骤和执行训练步骤,其中,所述数据获取步骤包括,建立数据库,对接银行数据系统;所述特征变量选择步骤包括,选取满足预测算法的特征变量;所述样本选取步骤包括,根据原始算法,以所收集的数据,对客户流失量进行数据准备;所述数据预处理步骤包括,整合基础数据,清理无关数据和空值;所述构建训练集和测试集步骤包括,抽取样本,将所抽取的样本分为训练集和测试集;所述执行训练步骤包括,按照模型参数的重要性程度进行训练,并以最优解滚动迭代。通过数据挖掘,可以精准识别潜力客户,精确预警流失客户,进一步增强客户提升和挽留效率,解决长尾客户无人管、无力管的现状。
[0018]所述数据获取步骤包括建立数据库,同时对接银行的数据系统对数据库进行信息传递。其中数据库会进行分区包括所下载的数据存储入用户信息库,以及用于存储算法的,优化方法的算法信息库等,并由控制单元进行调动和计算,根据算法信息库中的数据处理用户信息库中的信息数据,进行计算和整合,技术的硬件实现可以直接采用现有的智能设
备,包括但不限于工控机、PC机、智能手机、手持单机、落地式单机等。其输入设备优选采用屏幕键盘,其数据存储和计算模块采用现有的存储器、计算器、控制器,其内部通信模块采用现有的通信端口和协议,其远程通信采用现有的gprs网络、万维互联网等,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0019]各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本专利技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read

Only Memory,ROM)、随机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于客户流失预测的数据挖掘方法,其特征在于,包括数据获取步骤,特征变量选择步骤,样本选取步骤,数据预处理步骤,构建训练集和和测试集步骤和执行训练步骤,其中,所述数据获取步骤包括,建立数据库,对接银行数据系统;所述特征变量选择步骤包括,选取满足预测算法的特征变量;所述样本选取步骤包括,根据原始算法,以所收集的数据,对客户流失量进行数据准备;所述数据预处理步骤包括,整合基础数据,清理无关数据和空值;所述构建训练集和测试集步骤包括,抽取样本,将所抽取的样本分为训练集和测试集;所述执行训练步骤包括,按照模型参数的重要性程度进行训练,并以最优解滚动迭代。2.根据权利要求1所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述数据获取步骤包括建立数据库,同时对接银行的数据系统对数据库进行信息传递。3.根据权利要求2所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所建立的数据库内容包括客户身份信息、客户资产信息、客户交易信息和产品信息。4.根据权利要求3所述的一种用于客户流失预测的数据挖掘方法,其特征在于,所述客户身份信息包括客户ID、年龄和性别,所述产品信息包括活期存款指标、定期存款指标、贷款情况指标、卡业务使用及办理情况、投资理...

【专利技术属性】
技术研发人员:李培森
申请(专利权)人:中国农业银行股份有限公司河北省分行
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1