特征提取方法、装置、设备、可读存储介质及程序产品制造方法及图纸

技术编号:37082287 阅读:22 留言:0更新日期:2023-03-29 19:57
本申请提供了一种特征提取方法、装置、设备、可读存储介质及程序产品。获取训练样本集以及初始分类模型;将训练样本集和所述初始分类模型输入至N个解释模型中,得到各解释模型输出的第一解释信息,各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值,重要程度值用于指示各特征对所述初始分类模型的预测结果的影响程度;将N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息,第二解释信息包括第二特征集中各特征的融合重要程度值,第二特征集包括N个第一特征集中的相同特征;根据第二特征集中各特征的融合重要程度值,提取目标特征集。根据本申请实施例可以提高特征提取的准确性。据本申请实施例可以提高特征提取的准确性。据本申请实施例可以提高特征提取的准确性。

【技术实现步骤摘要】
特征提取方法、装置、设备、可读存储介质及程序产品


[0001]本申请属于模型解释
,尤其涉及一种特征提取方法、装置、设备、可读存储介质及程序产品。

技术介绍

[0002]在分类模型的实际应用中,人们不仅希望得到分类模型的预测结果,更希望了解分类模型是如何得到预测结果的,基于此,可以通过模型解释算法对分类模型进行解释。一般来说,可以基于对分类模型的特征影响解释,更好地理解和分析特征,进而提取到可解释性特征集来训练得到更精准的分类模型。然而,目前基于模型解释提取到的可解释性特征集存在准确性较低的缺陷。

技术实现思路

[0003]本申请实施例提供一种特征提取方法、装置、设备、可读存储介质及程序产品,以提升基于模型解释提取到的可解释性特征集的准确性。
[0004]第一方面,本申请实施例提供一种特征提取方法,方法包括:
[0005]获取训练样本集以及初始分类模型,初始分类模型由训练样本集训练得到;
[0006]将训练样本集和初始分类模型输入至N个解释模型中,得到各解释模型输出的第一解释信息,各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值,重要程度值用于指示各特征对初始分类模型的预测结果的影响程度,N为大于1的整数;
[0007]将N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息,第二解释信息包括第二特征集中各特征的融合重要程度值,第二特征集包括N个解释模型对应的第一特征集中的相同特征;
[0008]根据第二特征集中各特征的融合重要程度值,提取目标特征集,目标特征集包括融合重要程度值满足预设条件的目标特征。
[0009]第二方面,本申请实施例提供了一种特征提取装置,装置包括:
[0010]获取模块,用于获取训练样本集以及初始分类模型,初始分类模型由训练样本集训练得到;
[0011]输出模块,用于将训练样本集和初始分类模型输入至N个解释模型中,得到各解释模型输出的第一解释信息,各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值,重要程度值用于指示各特征对初始分类模型的预测结果的影响程度,N为大于1的整数;
[0012]融合模块,用于将N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息,第二解释信息包括第二特征集中各特征的融合重要程度值,第二特征集包括N个解释模型对应的第一特征集中的相同特征;
[0013]提取模块,用于根据第二特征集中各特征的融合重要程度值,提取目标特征集,目标特征集包括融合重要程度值满足预设条件的目标特征。
[0014]第三方面,本申请实施例提供了一种电子设备,设备包括:
[0015]处理器以及存储有程序或指令的存储器;
[0016]处理器执行程序或指令时实现上述的方法。
[0017]第四方面,本申请实施例提供了一种机器可读存储介质,机器可读存储介质上存储有程序或指令,程序或指令被处理器执行时实现上述的方法。
[0018]第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述方法。
[0019]本申请实施例的特征提取方法、装置、设备、可读存储介质及程序产品,能够获取训练样本集以及初始分类模型,初始分类模型由训练样本集训练得到;将训练样本集和初始分类模型输入至N个解释模型中,得到各解释模型输出的第一解释信息,各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值;将N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息,第二解释信息包括第二特征集中各特征的融合重要程度值,第二特征集包括N个解释模型对应的第一特征集中的相同特征;根据第二特征集中各特征的融合重要程度值,提取目标特征集,目标特征集包括融合重要程度值满足预设条件的目标特征。
[0020]这样,可以结合考虑多个不同解释模型输出的第一解释信息,融合得到更全面、客观性更高的第二解释信息,并可以基于第二解释信息中的各特征的融合重要程度值来提取目标特征集,降低因单个解释模型的解释局限性导致各特征的重要程度值有误,影响到目标特征集提取准确性的风险,有效保证了目标特征集的准确性。
附图说明
[0021]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本申请一个实施例提供的特征提取方法的流程示意图;
[0023]图2是本申请一个实施例提供的特征提取方法的场景实施例流程图;
[0024]图3是本申请另一个实施例提供的特征提取方法的场景实施例流程图;
[0025]图4是本申请另一个实施例提供的特征提取装置的结构示意图;
[0026]图5是本申请又一个实施例提供的电子设备的结构示意图。
具体实施方式
[0027]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0028]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖
非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0029]为了解决现有技术问题,本申请实施例提供了一种特征提取方法、装置、设备、可读存储介质及程序产品。下面首先对本申请实施例所提供的特征提取方法进行介绍。
[0030]图1示出了本申请一个实施例提供的特征提取方法的流程示意图。如图1所示,该方法包括:
[0031]S110,获取训练样本集以及初始分类模型。
[0032]S120,将训练样本集和初始分类模型输入至N个解释模型中,得到各解释模型输出的第一解释信息。
[0033]S130,将N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息。
[0034]S140,根据第二特征集中各特征的融合重要程度值,提取目标特征集。
[0035]上述各个步骤的具体实现方式将在下文中进行详细描述。
[0036]在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征提取方法,其特征在于,包括:获取训练样本集以及初始分类模型,所述初始分类模型由所述训练样本集训练得到;将所述训练样本集和所述初始分类模型输入至N个解释模型中,得到各解释模型输出的第一解释信息,所述各解释模型输出的第一解释信息包括第一特征集中各特征的重要程度值,所述重要程度值用于指示各特征对所述初始分类模型的预测结果的影响程度,N为大于1的整数;将所述N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息,所述第二解释信息包括第二特征集中各特征的融合重要程度值,所述第二特征集包括所述N个解释模型对应的第一特征集中的相同特征;根据所述第二特征集中各特征的融合重要程度值,提取目标特征集,所述目标特征集包括融合重要程度值满足预设条件的目标特征。2.根据权利要求1所述的方法,其特征在于,所述将所述N个解释模型输出的N个第一解释信息进行融合处理,得到融合后的第二解释信息,包括:根据N个所述第一特征集中的相同特征,确定第二特征集;根据所述N个解释模型输出的N个所述第一解释信息,确定所述第二特征集中各特征对应的N个重要程度值;根据N个解释模型一一对应的N个权重值,以及所述第二特征集中各特征对应的N个重要程度值,确定所述第二特征集中各特征的融合重要程度值。3.根据权利要求2所述的方法,其特征在于,所述各解释模型输出的第一解释信息还包括所述初始分类模型的预测规则,所述预测规则基于所述第一特征集中各特征的变化对所述初始分类模型的预测结果所产生的变化情况确定,所述根据N个解释模型一一对应的N个权重值,以及所述第二特征集中各特征对应的N个重要程度值,确定所述第二特征集中各特征的融合重要程度值之前,所述方法还包括:将所述初始分类模型以及所述训练样本集中各样本分别输入至所述N个解释模型中,得到各解释模型输出的各样本的解释信息;根据所述各样本的解释信息,确定各解释模型的解释一致性;根据所述初始分类模型的预测规则对所述训练样本集进行预测,得到各解释模型对应的预测结果;根据所述预测结果确定各解释模型的规则命中率;根据所述解释一致性和所述规则命中率,确定各解释模型的权重值。4.根据权利要求3所述的方法,其特征在于,所述将所述初始分类模型以及所述训练样本集中各样本分别输入至所述N个解释模型中,得到各解释模型输出的各样本的解释信息,包括:获取所述训练样本集中任意两个相似样本,以及任意两个相似样本中各特征的差异值;将所述初始分类模型以及所述任意两个相似样本分别输入至所述N个解释模型中,得到各解释模型输出的所述任意两个相似样本中各特征的重要程度值;所述根据所述各样本的解释信息,确定各解释模型的解释一致性,包括:根据所述任意两个相似样本中各特征的重要程度值,确定各解释模型中的各特征的重
要程度差异值;根据所述各特征的差异值,以及所述各特征的重要程度差异值,确定各解释模型中的任意两个相似样本的解释一致性;根据所述各解释模型中的任意两个相似样本的解释一致性,确定各解释模型的解释一致性。5.根据权利要求3所述的方法,其特征在于,所述根据所述预测结果确定各解释模型的规则命中率,包括:获取所述训练样本集中第一样本的第一数量,以及所述训练样本集中所有样本的第二数量,其中,所述第一样本包括所述预测结...

【专利技术属性】
技术研发人员:田天郭向李元锋景昕王静孙知洋
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1