智能销售线索推荐理由生成方法及系统技术方案

技术编号:36798615 阅读:18 留言:0更新日期:2023-03-08 23:22
本公开涉及一种智能销售线索推荐理由生成方法及系统,方法包括:获取与目标客户相关的M个预测样本数据,将M个预测样本数据输入推荐模型得到M个推荐结果;基于每个预测样本数据以及对应的推荐结果,通过SHAP模型计算每个预测样本数据对应的N个SHAP值;基于每个预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个预测样本数据中N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于特征相关性矩阵将SHAP矩阵中SHAP值为零的SHAP值替换生成推荐理由重要系数矩阵;基于推荐理由重要系数矩阵对每个预测样本数据的N个不同的特征编码进行排序,基于排序结果和第一字典确定每个推荐结果对应的定制推荐理由。推荐结果对应的定制推荐理由。推荐结果对应的定制推荐理由。

【技术实现步骤摘要】
智能销售线索推荐理由生成方法及系统


[0001]本公开实施例涉及计算机
,尤其涉及一种智能销售线索推荐理由生成方法及系统。

技术介绍

[0002]面向企业客户的销售场景之下,使用基于机器学习或深度学习算法来挖掘推荐潜在的目标企业客户时,由于目前算法自身无法对推荐结果给出合理的推荐理由以及无法给出不同因素对推荐结果影响性大小,造成销售人员无法理解潜在目标企业客户的推荐逻辑,从而整体上使得难以组织制定合理准确的销售策略。
[0003]比如,在建立有申请知识产权需求的潜在企业客户推荐系统过程中,使用了企业专利数量、企业商标数量、企业品牌数量、企业成立时间等作为训练模型的特征数据,如果训练结束后的结果模型在最后推荐企业a作为最高可能性的潜在目标客户,则上述哪些特征数据(因素)导致其作为推荐结果,这些特征数据(因素)对推荐结果的影响程度大小如何难以给出,而解决这些问题对于企业的销售人员非常重要。
[0004]在上述场景下,当前业界并无相关解决方案。而在其他推荐场景下,有部分方案采用训练机器学习模型时所用的特征对最后训练得到的结果模型的贡献程度大小/特征重要性(Feature Importances),来代替对应特征对单一推荐结果的影响程度,从而生成每个预测结果的推荐理由。但是类似方法存在以下两个问题:第一,某个特征对模型的重要性,并不能代表该特征对某个推荐结果的影响程度。特征重要性只能用来衡量在使用训练特征数据对原始模型进行训练时特征所起作用的重要程度,因此特征重要性并不能代表单个样本在推理过程所起作用的重要程度。比如对于训练结果模型,特征重要性最高的两个特征是特征A和B,其次是特征C,但是在推荐结果名单中,企业a作为推荐结果,如果其特征A和B的数值为0,而特征C为非0,此时以特征A或B作为企业a的推荐理由均不合适。
[0005]第二,特征共线性问题严重时,对特征重要性的解释性也会出现问题,从而造成推荐理由过少。在使用树模型或者基于树模型的集成算法时,当一个特征重要性为非0的特征A时,如果存在一个或以上的其他特征与特征A高度相关(如基于皮尔逊相关系数Pearson Correlation Coefficient确定相关程度大小),如特征B和C,则特征B和C的特征重要性通常为0。这是由于特征A的信息增益率比特征B更高造成,具体推算过程不再累述。在上述销售场景下,由于特征数据的数量一般情况下不多,加上存在上述特征重要性为0的情况,这会导致出现推荐理由太少的问题,影响后续的销售策略准确制定。
[0006]综上,由于上述两个问题的存在,导致使用模型的特征重要性来代替推荐理由的相关方法在实际算法项目中效果不佳,即给出的推荐理由不够准确,另外在一些情况下给出的推荐理由数量太少,导致难以准确地制定销售策略。

技术实现思路

[0007]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种智能销售线索推荐理由生成方法及系统。
[0008]第一方面,本公开实施例提供了一种智能销售线索推荐理由生成方法,包括:获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。
[0009]在一个实施例中,所述特征相关性矩阵是皮尔逊相关系数矩阵,所述基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵,包括:按照以下公式将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵:其中, a
ij
表示SHAP矩阵中第i个预测样本数据对应的第j个SHAP值, a
ij
=0;ρ
nj
表示特征相关性矩阵中的第n个类型的样本数据与第j个类型的样本数据之间的相关性值。
[0010]在一个实施例中,该方法还包括:获取与潜在的目标客户相关的画像数据,基于所述画像数据生成所述多个训练样本数据;基于所述多个训练样本数据建立第二字典,所述第二字典包含所述N个不同的特征编码与对应的第一特征值之间的对应关系,每个所述第一特征值是占位符;基于所述第二字典建立所述第一字典,其中所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由中包含一个占位符。
[0011]在一个实施例中,该方法还包括:生成每个所述预测样本数据中N个不同类型的样本数据各自对应的第二特征值;所述基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由,包括:针对每个所述预测样本数据对应的每个所述推荐结果,根据所述排序结果中的N
个特征编码的顺序,依次从所述第一字典中获取对应的N个定制推荐理由,并将所述N个定制推荐理由中的占位符替换为所述N个不同类型的样本数据各自对应的第二特征值。
[0012]在一个实施例中,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序之前,该方法还包括:将所述推荐理由重要系数矩阵中重要系数为零的重要系数删除。
[0013]在一个实施例中,所述基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,包括:基于所述推荐理由重要系数矩阵中的重要系数的大小,对每个所述预测样本数据对应的N个不同的特征编码进行降序排序。
[0014]在一个实施例中,所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由均是文本推荐理由。
[0015]第二方面,本公开实施例提供一种智能销售线索推荐理由生成系统,包括:客户推荐模块,用于获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;数据计算模块,用于基于每个所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能销售线索推荐理由生成方法,其特征在于,包括:获取与目标客户相关的M个预测样本数据,将所述M个预测样本数据输入推荐模型以得到对应的M个推荐结果;其中每个所述预测样本数据包括N个不同类型的样本数据,所述推荐模型是预先基于多个训练样本数据对机器学习模型训练得到的,每个所述训练样本数据包括N个不同类型的样本数据,N是大于或等于2的自然数,M是大于或等于1的自然数;基于每个所述预测样本数据以及对应的推荐结果,通过SHAP模型计算每个所述预测样本数据对应的N个SHAP值,所述N个SHAP值一一对应每个所述预测样本数据中的N个不同类型的样本数据中的一个;基于每个所述预测样本数据对应的N个SHAP值生成SHAP矩阵,计算每个所述预测样本数据中的N个不同类型的样本数据的相关性以生成特征相关性矩阵,基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵;基于所述推荐理由重要系数矩阵对每个所述预测样本数据对应的N个不同的特征编码进行排序,并基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由;其中所述第一字典包括所述N个不同的特征编码与对应的定制推荐理由之间的对应关系,所述N个不同的特征编码预先设置且标识所述N个不同类型。2.根据权利要求1所述的方法,其特征在于,所述特征相关性矩阵是皮尔逊相关系数矩阵,所述基于所述特征相关性矩阵将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵,包括:按照以下公式将所述SHAP矩阵中SHAP值为零的SHAP值替换掉以生成推荐理由重要系数矩阵:其中, a
ij
表示SHAP矩阵中第i个预测样本数据对应的第j个SHAP值,a
ij
=0;ρ
nj
表示特征相关性矩阵中的第n个类型的样本数据与第j个类型的样本数据之间的相关性值。3.根据权利要求1或2所述的方法,其特征在于,该方法还包括:获取与潜在的目标客户相关的画像数据,基于所述画像数据生成所述多个训练样本数据;基于所述多个训练样本数据建立第二字典,所述第二字典包含所述N个不同的特征编码与对应的第一特征值之间的对应关系,每个所述第一特征值是占位符;基于所述第二字典建立所述第一字典,其中所述第一字典中所述N个不同的特征编码各自对应的定制推荐理由中包含一个占位符。4.根据权利要求3所述的方法,其特征在于,该方法还包括:生成每个所述预测样本数据中N个不同类型的样本数据各自对应的第二特征值;所述基于排序结果和第一字典确定每个所述推荐结果对应的定制推荐理由,包括:针对每个所述预测样本数据对应的每个所述推荐结...

【专利技术属性】
技术研发人员:卫晓祥吴传文唐绍祖
申请(专利权)人:启客北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1