特征提取方法、装置、设备、可读存储介质及程序产品制造方法及图纸

技术编号：37082287 阅读：22 留言：0更新日期：2023-03-29 19:57

本申请提供了一种特征提取方法、装置、设备、可读存储介质及程序产品。获取训练样本集以及初始分类模型；将训练样本集和所述初始分类模型输入至N个解释模型中，得到各解释模型输出的第一解释信息，各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值，重要程度值用于指示各特征对所述初始分类模型的预测结果的影响程度；将N个解释模型输出的N个第一解释信息进行融合处理，得到融合后的第二解释信息，第二解释信息包括第二特征集中各特征的融合重要程度值，第二特征集包括N个第一特征集中的相同特征；根据第二特征集中各特征的融合重要程度值，提取目标特征集。根据本申请实施例可以提高特征提取的准确性。据本申请实施例可以提高特征提取的准确性。据本申请实施例可以提高特征提取的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
特征提取方法、装置、设备、可读存储介质及程序产品

[0001]本申请属于模型解释
，尤其涉及一种特征提取方法、装置、设备、可读存储介质及程序产品。

技术介绍

[0002]在分类模型的实际应用中，人们不仅希望得到分类模型的预测结果，更希望了解分类模型是如何得到预测结果的，基于此，可以通过模型解释算法对分类模型进行解释。一般来说，可以基于对分类模型的特征影响解释，更好地理解和分析特征，进而提取到可解释性特征集来训练得到更精准的分类模型。然而，目前基于模型解释提取到的可解释性特征集存在准确性较低的缺陷。

技术实现思路

[0003]本申请实施例提供一种特征提取方法、装置、设备、可读存储介质及程序产品，以提升基于模型解释提取到的可解释性特征集的准确性。
[0004]第一方面，本申请实施例提供一种特征提取方法，方法包括：
[0005]获取训练样本集以及初始分类模型，初始分类模型由训练样本集训练得到；
[0006]将训练样本集和初始分类模型输入至N个解释模型中，得到各解释模型输出的第一解释信息，各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值，重要程度值用于指示各特征对初始分类模型的预测结果的影响程度，N为大于1的整数；
[0007]将N个解释模型输出的N个第一解释信息进行融合处理，得到融合后的第二解释信息，第二解释信息包括第二特征集中各特征的融合重要程度值，第二特征集包括N个解释模型对应的第一特征集中的相同特征；
[0008]根据第二特征集中各特征的融合...

【技术保护点】

【技术特征摘要】
1.一种特征提取方法，其特征在于，包括：获取训练样本集以及初始分类模型，所述初始分类模型由所述训练样本集训练得到；将所述训练样本集和所述初始分类模型输入至N个解释模型中，得到各解释模型输出的第一解释信息，所述各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值，所述重要程度值用于指示各特征对所述初始分类模型的预测结果的影响程度，N为大于1的整数；将所述N个解释模型输出的N个第一解释信息进行融合处理，得到融合后的第二解释信息，所述第二解释信息包括第二特征集中各特征的融合重要程度值，所述第二特征集包括所述N个解释模型对应的第一特征集中的相同特征；根据所述第二特征集中各特征的融合重要程度值，提取目标特征集，所述目标特征集包括融合重要程度值满足预设条件的目标特征。2.根据权利要求1所述的方法，其特征在于，所述将所述N个解释模型输出的N个第一解释信息进行融合处理，得到融合后的第二解释信息，包括：根据N个所述第一特征集中的相同特征，确定第二特征集；根据所述N个解释模型输出的N个所述第一解释信息，确定所述第二特征集中各特征对应的N个重要程度值；根据N个解释模型一一对应的N个权重值，以及所述第二特征集中各特征对应的N个重要程度值，确定所述第二特征集中各特征的融合重要程度值。3.根据权利要求2所述的方法，其特征在于，所述各解释模型输出的第一解释信息还包括所述初始分类模型的预测规则，所述预测规则基于所述第一特征集中各特征的变化对所述初始分类模型的预测结果所产生的变化情况确定，所述根据N个解释模型一一对应的N个权重值，以及所述第二特征集中各特征对应的N个重要程度值，确定所述第二特征集中各特征的融合重要程度值之前，所述方法还包括：将所述初始分类模型以及所述训练样本集中各样本分别输入至所述N个解释模型中，得到各解释模型输出的各样本的解释信息；根据所述各样本的解释信息，确定各解释模型的解释一致性；根据所述初始分类模型的预测规则对所述训练样本集进行预测，得到各解释模型对应的预测结果；根据所述预测结果确定各解释模型的规则命中率；根据所述解释一致性和所述规则命中率，确定各解释模型的权重值。4.根据权利要求3所述的方法，其特征在于，所述将所述初始分类模型以及所述训练样本集中各样本分别输入至所述N个解释模型中，得到各解释模型输出的各样本的解释信息，包括：获取所述训练样本集中任意两个相似样本，以及任意两个相似样本中各特征的差异值；将所述初始分类模型以及所述任意两个相似样本分别输入至所述N个解释模型中，得到各解释模型输出的所述任意两个相似样本中各特征的重要程度值；所述根据所述各样本的解释信息，确定各解释模型的解释一致性，包括：根据所述任意两个相似样本中各特征的重要程度值，确定各解释模型中的各特征的重
要程度差异值；根据所述各特征的差异值，以及所述各特征的重要程度差异值，确定各解释模型中的任意两个相似样本的解释一致性；根据所述各解释模型中的任意两个相似样本的解释一致性，确定各解释模型的解释一致性。5.根据权利要求3所述的方法，其特征在于，所述根据所述预测结果确定各解释模型的规则命中率，包括：获取所述训练样本集中第一样本的第一数量，以及所述训练样本集中所有样本的第二数量，其中，所述第一样本包括所述预测结...

【专利技术属性】
技术研发人员：田天，郭向，李元锋，景昕，王静，孙知洋，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人