一种面向券商业务的融资融券潜客发现预测方法技术

技术编号:35108941 阅读:25 留言:0更新日期:2022-10-01 17:21
本发明专利技术公开了一种面向券商业务的融资融券潜客发现预测方法,方法基于券商业务个人客户的基本信息、资产信息、交易行为、产品持有、持仓行为、盈亏等数据资源,结合业务经验及数据可视化探查,设计相应特征指标,形成特征宽表,利用机器学习梯度提升决策树算法识别和预测潜在开通融资融券的客户,利用Kmeans算法对潜在开通客户进行客户分群,找出每个细分客群中的共有特征,制定针对性的营销策略,本发明专利技术充分发挥算法的优势,运用机器学习算法多维度多角度进行模型训练、预测,其结果更具有准确性,此方法能够更加全面更多角度的发现影响客户开通融资融券的因素;通过对未来一个月潜在开通融资融券的客户进行预测,提前预知客户动态。态。态。

【技术实现步骤摘要】
一种面向券商业务的融资融券潜客发现预测方法


[0001]本专利技术属于券商业务大数据应用
,具体涉及一种面向券商业务的融资融券潜客发现预测方法。

技术介绍

[0002]随着大数据技术、人工智能的应用越来越普及,券商的经营方式从过去的以产品为中心过渡到以数据为中心阶段,数据驱动生产力成为券商发展的不可逆的方向。
[0003]在大数据改变人们金融生活、大数据助力证券业务转型升级进程中,通过主动挖掘潜在客户行为,发现数据价值,走数据化证券自主创新之路,以应对市场同业的竞争和挑战。
[0004]券商的融资融券交易又称“证券信用交易”或保证金交易,是指投资者向具有融资融券业务资格的证券公司提供担保物,借入资金买入证券(融资交易)或借入证券并卖出(融券交易)的行为。包括券商对投资者的融资、融券和金融机构对券商的融资、融券。结合当前大数据环境下,券商客户数据积累达到GB甚至TB的数据量水平,客户经理通过业务经验挖掘潜在融资融券潜在开通客户,挑战巨大。因此,需要充分利用大数据分析、机器学习等技术,根据客户历史行为特征、基本属性、产品偏好、盈亏、交易等数据,发现券商业开通融资融券客户的特征,进而挖掘出开通融资融券的潜在客户,提升券商融资融券营销精准度。

技术实现思路

[0005]本专利技术的目的在于提供一种面向券商业务的融资融券潜客发现预测方法,该方法基于券商业务个人客户的基本信息、资产信息、交易行为、产品持有、持仓行为、盈亏等方面进行统计分析,提前感知客户未来一段时间开通融资融券的可能性,制定针对性营销策略,实施精准营销,增加券商利润。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种面向券商业务的融资融券潜客发现预测方法:包括以下具体步骤:步骤1:数据获取:获取券商个人客户近一年来基本信息、资产、交易、盈亏、产品持有数据;步骤2:数据探查:从获取的券商个人客户近一年的数据中,探查样本总量、开通融资融券客户与未开通客户的样本数、数据缺失值情况、异常值情况、正负样本不平衡情况;步骤3:构建指标特征宽表:从获取的券商个人客户近一年的数据中,利用python进行可视化统计分析,探查开通融资融券客群基本信息中的共有特征、开通前后客户的资产、交易行为、产品持有、盈亏等变化情况以及开通客户与未开通客户的指标差异,设计相应的建模指标,构建指标特征宽表,全面刻画开通融资融券客户特征;步骤4:数据预处理:在指标特征宽表基础上对数据预处理,解决样本不平衡、异常值处理、缺失值填补等问题;
步骤5:模型构建:基于预处理后的数据,利用GBDT(梯度提升决策树)算法,进行模型的训练;步骤6:名单输出:基于训练好的模型,输出未来一个月潜在开通融资融券客户名单;步骤7:客户分群:针对预测名单,利用Kmeans算法进行客群细分,提炼每个细分客群的共有特征;步骤8:实施营销:制定针对性的营销策略,实施精准营销;优选的,步骤3中构建融资融券潜在开通客户指标特征宽表,指标特征数据包括:基本信息:包括年龄、性别、股龄、开户时长、营业部所在省份、客户等级、风险级别。
[0007]资产信息:包括最近一年资产峰值、当前资金余额、客户总资产、最近一年日均资产、最近6个月日均资产、最近3个月日均资产。
[0008]交易信息:包括最近一年股票交易量、最近6个月股票交易量、最近3个月股票交易量、最近3个月日均持仓、最近一年日均股票持仓、最近6个月日均股票持仓、最近3个月日均股票持仓。
[0009]产品偏好:最近6个月公墓基金购买金额、最近6个月现金类产品购买金额、最近6个月固收类产品购买金额、最近6个月权益类产品购买金额、最近6个月公墓基金购买次数、最近6个月现金类产品购买次数、最近6个月固收类产品购买次数、最近6个月权益类产品购买次数。
[0010]盈亏能力:包括最近6个月周转率、最近3个月周转率、最近6个月盈亏比例、最近3个月盈亏比例、最近一年盈利额、最近6个月盈利额、最近3个月盈利额。
[0011]优选的,步骤4中采用过采样技术解决数据样本的不平衡现象。
[0012]优选的,步骤4中采用SMOTE解决数据中正负样本的不平衡现象。
[0013]优选的,步骤4中数据预处理,采用箱线图法及业务规则,剔除数据异常值。
[0014]优选的,步骤4中数据预处理,采用数值型缺失值,其中年龄字段进行中位数填充,其余进行零填充,字符型缺失值进行众数填充的缺失值填充方法。
[0015]优选的,步骤5中,采用了GBDT(梯度提升决策树)算法预测未来一个月客户是否会开通融资融券;步骤5

1:基于全部N个样本,设置每个样本权重为1/N,选择单棵决策树训练,得到决策树1;步骤5

2:计算每个样本的残差,其中,残差的计算方式为:模型的预测结果与样本真实结果的差值,根据决策树1的分类结果,将分类错误的样本权重调高,将每个样本的残差作为目标变量,组成新样本集,选择单棵决策树训练,得到决策树2;步骤5

3:不断迭代步骤5

2,生成n棵决策树,将对生成的n棵决策树的结果,进行相加,得到最终的预测结果。
[0016]优选的,步骤7中,采用了Kmeans算法对潜在开通融资融券客户进行客群细分;步骤7

1:根据聚类个数K,随机抽取K个样本作为初始聚类中心;步骤7

2:计算每个样本到K个聚类中心的欧式距离,将其与聚类中心最短的距离中心归属到一类,迭代多次,并计算K个簇的轮廓系数,若轮库系数大于0.85,则停止迭代,
聚类完成。
[0017]与现有技术相比,本专利技术的有益效果是:本专利技术充分发挥算法的优势,运用机器学习算法多维度多角度进行模型训练、预测,其结果更具有准确性,弥补了客户经理考虑影响开通融资融券客户因素较少的缺陷,此方法,能够更加全面更多角度的发现影响客户开通融资融券的因素;本专利技术通过对未来一个月潜在开通融资融券的客户进行预测,提前预知客户动态,利用Kmeans对潜在开通融资融券客户进行细分,制定针对性的营销策略,进行精准营销;本专利技术提出以数据驱动的方式,进行融资融券潜在客户预测,避免业务经验的误导性以及考虑单一的弊端。
附图说明
[0018]图1是本专利技术的工作流程图;图2是本专利技术的缺失值处理图;图3是本专利技术的建模指标特征构建图;图4是本专利技术的GBDT算法建模过程图。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,获取券商业个人客户数据资源,提取2018年04月

2019年04月客户基本信息、资产分布、交易行为、产品偏好、盈亏能力等相关数据,利用机器学习算法,提前预测潜在开通融资融券客户情况,并制定精准策略,实施营销,降低营销成本,提高营销成功率,增加券商收入。
[0020]基于如上设计思想,本专利技术的具体限定方案,请阅图1至图4,券商个人客户融资融券潜在开通预测的方法,包括下列步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向券商业务的融资融券潜客发现预测方法,其特征在于:包括下列步骤:步骤1:数据获取:获取券商个人客户近一年来基本信息、资产、交易、盈亏、产品持有数据;步骤2:数据探查:从获取的券商个人客户近一年的数据中,探查样本总量、开通融资融券客户与未开通客户的样本数、数据缺失值情况、异常值情况、正负样本不平衡情况;步骤3:构建指标特征宽表:从获取的券商个人客户近一年的数据中,利用python、excel分析工具进行可视化统计分析,探查开通融资融券客群基本信息中的共有特征、开通前后客户的资产、交易行为、产品持有、盈亏变化情况以及开通客户与未开通客户的指标差异,设计相应的建模指标,构建指标特征宽表,全面刻画开通融资融券客户特征;步骤4:数据预处理:在指标特征宽表基础上对数据预处理,解决样本不平衡、异常值处理、缺失值填补的问题;步骤5:模型构建:基于预处理后的数据,利用GBDT算法,进行模型的训练;步骤6:名单输出:基于训练好的模型,输出未来一个月潜在开通融资融券客户名单;步骤7:客户分群:针对预测名单,利用Kmeans算法进行客群细分,提炼每个细分客群的共有特征;步骤8:实施营销:制定针对性的营销策略,达到千人千面的精准营销效。2.根据权利要求1所述的一种面向券商业务的融资融券潜客发现预测方法,其特征在于:所述步骤4中采用过采样SMOTE算法解决样本的...

【专利技术属性】
技术研发人员:李炜李挺宋林利
申请(专利权)人:上海琢学科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1