一种基于Logistic回归的充电客户优质度评分方法和计算机系统技术方案

技术编号:35276158 阅读:14 留言:0更新日期:2022-10-19 10:56
本发明专利技术公开了一种基于Logistic回归的充电客户优质度评分方法和计算机系统,其中方法包括以下步骤:S1,获取数据;S2,对S1获取的数据进行处理;S3,建立Logistic模型;S4,对S2处理后的数据进行数据的划分,分为训练集和测试集;S5,获取数据各维度的各自分布情况;S6,根据S5中获取的数据各维度的各自分布情况,对数据各维度进行数据分段;S7,对分段后的数据进行分析筛选,得到优质状态影响指标的排序;S8,根据S4中划分的测试集对训练好的Logistic模型进行检验。本发明专利技术通过对已有的充电桩客户数据的挖掘分析,结合信用评分卡的建立原理,创建了一个简单的优质程度评分系统。建了一个简单的优质程度评分系统。建了一个简单的优质程度评分系统。

【技术实现步骤摘要】
一种基于Logistic回归的充电客户优质度评分方法和计算机系统


[0001]本专利技术涉及智能评分方法领域,特别涉及一种基于Logistic回归的充电客户优质度评分方法和计算机系统。

技术介绍

[0002]充电桩运营公司对用户优劣程度的评价中,需用利用已有的数据进行建模分析,往常依靠运营经理的经验判断无法高效准确的评价充电客户的优劣程度,进而分析出优质客户应该给予的优惠和劣质客户应该预充的金额。

技术实现思路

[0003]为了解决现有问题,本专利技术提供了一种基于Logistic回归的充电客户优质度评分方法和计算机系统,具体方案如下:
[0004]一种基于Logistic回归的充电客户优质度评分方法,包括以下步骤:
[0005]S1,获取数据;
[0006]S2,对S1获取的数据进行处理;
[0007]S3,建立Logistic模型;
[0008]S4,对S2处理后的数据进行数据的划分,分为训练集和测试集;
[0009]S5,获取数据各维度的各自分布情况;
[0010]S6,根据S5中获取的数据各维度的各自分布情况,对数据各维度进行数据分段;
[0011]S7,对分段后的数据进行分析筛选,得到优质状态影响指标的排序;
[0012]S8,根据S4中划分的测试集对训练好的Logistic模型进行检验。
[0013]优选的,S1中的数据包括存量客户和潜在客户的数据。
[0014]优选的,S2中对数据进行处理的步骤包括:
[0015]S21,对S1获取的数据进行预处理;
[0016]S22,对预处理后的数据进行缺失值处理;
[0017]S23,对缺失值处理后的数据进行异常值处理。
[0018]优选的,S21中预处理包括将S1获取的数据转化为可用作模型开发的格式化数据,并根据Python内有describe函数,掌握数据集的缺失值、均值和中位数。
[0019]优选的,S22中所述缺失值处理方法包括:直接删除含有缺失值的样本数据、根据样本数据之间的相似性填补缺失值以及根据变量之间的相关关系填补缺失值中的至少一种,当变量缺失率大于设定阈值时,采用根据变量之间的相关关系填补缺失值的方法进行缺失值处理,并采用随机森林法进行预测填充缺失的数据。
[0020]优选的,S3中建立Logistic模型需要建立应变量与自变量的对应关系函数表达式,所述自变量指Logistic回归模型中的输入的各个维度数据,所述应变量指客户优质程度的评价。
[0021]优选的,S5采用探索性数据分析,获取数据各维度的各自分布情况。
[0022]优选的,S6中采用变量分箱算法,对数据各维度进行数据分段;其中,所述变量分箱算法对数据的分段方法包括等距分段、等深分段和最优分段。
[0023]优选的,S7中所述分析筛选,包括对分段后的数据进行相关性分析,之后再进行IV筛选,得到优质状态影响指标的排序;其中,优质状态影响指标的排序依据,包括各个维度的逻辑斯特回归系数大小,逻辑斯特回归系数越大,数据指标对优质状态的影响越大。
[0024]本专利技术还揭示了一种计算机系统,包括处理器、存储介质,存储介质上存有计算机程序,处理器从存储介质上读取并运行计算机程序以执行上述基于Logistic回归的充电客户优质度评分方法。
[0025]本专利技术的有益效果在于:
[0026]本专利技术通过对已有的充电桩客户数据的挖掘分析,结合信用评分卡的建立原理,从数据的预处理、变量选择、建模分析到创建信用评分,创建了一个简单的优质程度评分系统。基于AI的机器学习评分卡系统可通过把旧数据剔除掉后再进行自动建模、模型评估、并不断优化特征变量,使得系统更加强大。
附图说明
[0027]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0028]图1为本专利技术的方法流程图。
具体实施方式
[0029]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0030]如图1,一种基于Logistic回归的充电客户优质度评分方法,包括以下步骤:
[0031]S1,获取数据。
[0032]其中,该数据包括存量客户和潜在客户的数据。存量客户是指已经在充电公司开展相关充电类业务的客户;潜在客户是指未来拟在充电公司开展相关充电业务的客户。其中客户的数据维度包括了优劣客户的划分标签、客户年龄、月收入、净资产总额、家属人数、债务比率、每周工作时长、每月行车里程、每月充电次数等应变量。
[0033]S2,对S1获取的数据进行处理。
[0034]其中,对数据进行处理包括以下步骤:
[0035]S21,对获取的数据进行预处理;
[0036]其中,预处理包括将S1获取的数据转化为可用作模型开发的格式化数据,并根据Python内有describe函数,掌握数据集的缺失值、均值和中位数。
[0037]S22,对预处理后的数据进行缺失值处理。
[0038]其中,缺失值的出现在现实问题中非常普遍,这会导致一些不能处理缺失值的分析方法无法应用。因此,就要进行缺失值处理。缺失值处理的方法,包括如下几种:1、直接删除含有缺失值的样本;2、根据样本之间的相似性填补缺失值;3、根据变量之间的相关关系填补缺失值。
[0039]其中,当变量缺失率大于设定阈值时,采用根据变量之间的相关关系填补缺失值的方法进行缺失值处理,并采用随机森林法进行预测填充缺失的数据。
[0040]S23,对缺失值处理后的数据进行异常值处理。
[0041]其中,异常值是指明显偏离大多数抽样数据的数值,比如个人客户的年龄为0时,通常认为该值为异常值。通常采用离群值检测的方法找出样本数据总体中的异常值。对找出的异常值进行删除。
[0042]S3,建立Logistic模型。
[0043]其中,建立Logistic模型需要建立应变量与自变量的对应关系函数表达式,自变量指Logistic回归模型中的输入的各个维度数据,应变量指客户优质程度的评价。
[0044]S4,对S2处理后的数据进行数据的划分,分为训练集和测试集;将训练集按照各个维度的数据与对应的标签数据输入到Logistic模型中,进行逻辑斯特回归训练,得到各个维度数据的逻辑斯特回归系数。
[0045]S5,进行探索性数据分析,获取数据各维度的各自分布情况,包括年龄数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Logistic回归的充电客户优质度评分方法,其特征在于,包括以下步骤:S1,获取数据;S2,对S1获取的数据进行处理;S3,建立Logistic模型;S4,对S2处理后的数据进行数据的划分,分为训练集和测试集;S5,获取数据各维度的各自分布情况;S6,根据S5中获取的数据各维度的各自分布情况,对数据各维度进行数据分段;S7,对分段后的数据进行分析筛选,得到优质状态影响指标的排序;S8,根据S4中划分的测试集对训练好的Logistic模型进行检验。2.根据权利要求1所述的基于Logistic回归的充电客户优质度评分方法,其特征在于:S1中的数据包括存量客户和潜在客户的数据。3.根据权利要求1所述的基于Logistic回归的充电客户优质度评分方法,其特征在于,S2中对数据进行处理的步骤包括:S21,对S1获取的数据进行预处理;S22,对预处理后的数据进行缺失值处理;S23,对缺失值处理后的数据进行异常值处理。4.根据权利要求3所述的基于Logistic回归的充电客户优质度评分方法,其特征在于:S21中预处理包括将S1获取的数据转化为可用作模型开发的格式化数据,并根据Python内有describe函数,掌握数据集的缺失值、均值和中位数。5.根据权利要求3所述的基于Logistic回归的充电客户优质度评分方法,其特征在于,S22中所述缺失值处理方法包括:直接删除含有缺失值的样本数据、根据样本数据之间的相似性填补缺失值以及根据变量之间的相关关系填补...

【专利技术属性】
技术研发人员:戴勇谢发强卢继雄
申请(专利权)人:安徽易加能数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1