用于XGBoost模型的解释方法技术

技术编号：25481258 阅读：55 留言：0更新日期：2020-09-01 23:02

本发明专利技术公开了一种用于XGBoost模型的解释方法，包括以下步骤：对XGBoost模型进行树模型元结构解析，以解析出每个单棵树的树结构；对所述XGBoost模型输入测试样本，根据树结构获取所述测试样本对应的有效叶子节点以及有效叶子节点的树的有效路径；根据有效路径计算出特征的贡献值；以及，根据获取到的贡献值对所述XGBoost模型进行解释。本发明专利技术根据XGBoost模型的结构信息，同时利用树型结构的路径来有效地对XGBoost模型的判别结果进行解释。

全部详细技术资料下载

【技术实现步骤摘要】
用于XGBoost模型的解释方法
本专利技术涉及机器学习
，特别涉及一种基于树型结构路径的用于XGBoost模型(梯度提升模型)的解释方法、电子设备和计算机可读介质。
技术介绍
目前，现有的模型解释方法一般有以下三种：1、通过求解出一个特征的重要性，即FeatureImportance；2、希望能够用一个线性模型来拟合复杂模型的局部样本点，如LIME方法(复杂模型可解释性方法)；3、通过求解出每一个特征的贡献值，如SHAP(SHapleyAdditiveexPlanations，一种解释模型输出的方法)值。以上几种方法在一定程度上能够解决关于复杂模型解释问题，但是本身存在一定缺陷。特征重要性(FeatureImportance)能够很好的表达出一个特征对模型整体预测的重要性，但是主要存在两方面的缺陷，一、特征重要性指标不能够表达特征对模型预测结果的正负相关性；二、特征重要性是一个整体指标，不同样本的特征会应为数值的变化而产生不一样的影响。根据局部线性方法来拟合复杂模型进而解释复杂模型能够解决特征重要性的两个缺陷，但是本身由于是局部解释，不能够有效地进行多样本之间的对比，同时线性的模型不能够表达出复杂模型中所发掘出的特征相互作用的影响，因子法也是跟LIME类似。SHAP指标能够解决如LINME方法中的第一个缺陷，但是不能够较好地突显出特征相互作用的影响，尤其是在树状结构中的特征之间继承关系对最终决策的影响。
技术实现思路
本专利技术要解决的技术问题是为了克服现有...

【技术保护点】
1.一种用于XGBoost模型的解释方法，其特征在于，包括以下步骤：/n对XGBoost模型进行树模型元结构解析，以解析出每个单棵树的树结构；/n对所述XGBoost模型输入测试样本，根据树结构获取所述测试样本对应的有效叶子节点以及有效叶子节点的树的有效路径；/n根据有效路径计算出特征的贡献值；以及，/n根据获取到的贡献值对所述XGBoost模型进行解释。/n

【技术特征摘要】
1.一种用于XGBoost模型的解释方法，其特征在于，包括以下步骤：
对XGBoost模型进行树模型元结构解析，以解析出每个单棵树的树结构；
对所述XGBoost模型输入测试样本，根据树结构获取所述测试样本对应的有效叶子节点以及有效叶子节点的树的有效路径；
根据有效路径计算出特征的贡献值；以及，
根据获取到的贡献值对所述XGBoost模型进行解释。

2.如权利要求1所述的解释方法，其特征在于，还包括以下步骤：
根据解析出的每个单棵树的树结构获取每个单棵树的叶子节点。

3.如权利要求2所述的解释方法，其特征在于，还包括以下步骤：
根据获取到的每个单棵树的叶子节点反向递推求解出整棵树的每个节点的贡献值。

4.如权利要求1所述的解释方法，其特征在于，所述根据树结构获取所述测试样本对应的有效叶子节点以及有效叶子节点的树的有效路径的步骤包括：
通过模型预测结果获取一组有效叶子节点，并且根据有效叶子节点的位置信息及树结构计算出有效叶子节点的树的有效路径。

5.如权利要求1所述的解释方法，其特征在于，还包括以下步骤：
根据有效路径还计算出特征组合的贡献值。

【专利技术属性】
技术研发人员：袁秋龙，周珊，江文斌，李健，
申请(专利权)人：上海携程国际旅行社有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人