用于比较机器学习模型的系统技术方案

技术编号:39748766 阅读:15 留言:0更新日期:2023-12-17 23:46
系统

【技术实现步骤摘要】
【国外来华专利技术】用于比较机器学习模型的系统、方法和计算机程序产品
[0001]相关申请的交叉引用
[0002]本申请要求
2021
年3月
30
日提交的美国临时专利申请
63/167,882、2022
年1月7日提交的美国临时专利申请
63/297,288

2021
年9月
22
日提交的国际专利申请
PCT/US21/51458
的优先权,这些专利的全部公开内容以引用方式并入本文



[0003]本公开整体涉及机器学习模型,并且在一些非限制性实施方案或方面中,涉及用于比较机器学习模型的准确率的系统

方法和计算机程序产品


技术介绍

[0004]分类
(
例如,预测给定数据实例成为不同类别的可能性等
)
是机器学习
(ML)
中的基本问题

已针对这个问题提出了许多分类模型,包括传统模型
(
例如,支持向量机
(SVM)、
朴素贝叶斯
( Bayes)
分类器等
)、
集成学习模型
(
例如,随机森林模型

树提升模型等
)
,以及深度学习模型
(
例如,卷积神经网络
(CNN)、
递归神经网络
(RNN)

)。
这些分类器的出色性能使它们被广泛应用于许多真实世界应用中,诸如垃圾邮件过滤

广告的点击率
(CTR)
预测和自动驾驶的目标识别

这些模型的小改进可为对应领域的公司带来显著的营收增长

因此,每天都会产生数量快速增长的分类器

因此,对分类器进行比较并标识最佳分类器来使用成为越来越重要的问题

[0005]近年来,解释分类模型引起了越来越多的关注,并且已经提出了许多解决方案

粗略地说,模型解释可以分为模型特定解释和模型不可知解释

模型特定解释将分类模型视为“白盒”,人们可以在该白盒中访问所有内部细节

例如,使大多数针对深度学习模型的解释可视化并调查内部神经元的激活,以揭露数据如何在内部转换

模型不可知解释将预测模型视为“黑盒”,在该黑盒中只有模型的输入和输出可用

这些方法通常采用可解释的代理模型来局部或全局地模拟或探查经解释模型的行为

例如,局部可解释模型不可知解释
(LIME)
使用线性模型作为代理来模拟要解释的更复杂的分类器的局部行为

经由知识蒸馏的图像分类器深度视觉解释和诊断
(Deep Visual Interpretation and Diagnosis for Image Classifiers via Knowledge Distillation)(DeepVID)
使用从用于解释的原始分类器中蒸馏出的知识来训练可解释模型
。RuleMatrix
仅使用模型的输入

输出行为,将分类模型转换为一组标准化的
IF

THEN

ELSE
规则

两组解释解决方案的共同目标是回答问题“什么输入特征对模型的输出更重要?”。
也有统计地量化特征的重要性的解决方案

[0006]可以使用不同的数字指标
(
例如,准确率

精确率
、LogLoss

)
从不同的角度比较两个分类器,这可能有助于选择整体性能更好的模型

基于这些指标已经提出了多个模型不可知的可视化和比较解决方案,因为生成这些指标不需要打开不同分类器的“黑盒”。
然而,由于这些现有的解决方案不触及不同分类器的主干,所以该现有的解决方案通常未能揭示分类器在哪里可能优于其他分类器

此外,提供很少的细节来帮助模型设计者将性能差异与个体分类器的不相似工作机制联系起来

例如,许多模型建立和可视化工具包,诸如

scikit

learn
,为这些数字指标提供了内置的应用程序编程接口
(API)。
然而,这些聚合指标通常不足以在模型比较和选择中提供足够的细节

例如,两个模型可能以非常不同的方式实现相同的准确率,并且在对模型进行比较时,潜在的细节通常更受关注

[0007]许多视觉分析工作试图超越这些聚合指标以便进行更全面的模型比较

例如,通过揭示一致和不一致预测来比较两个模型

该比较是模型不可知的,并且对于用户选择的实例,可以标识促成模型之间的预测差异的特征
。DeepCompare
通过深度学习模型和不可比架构的激活模式将它们进行比较
(
例如,
CNN
对比
RNN

)。CNNComparator
将来自不同训练阶段的同一
CNN
进行比较以揭示模型的演变

去卷积技术也已经被用来比较
CNN。
这些现有的比较工作大多依赖于人的视觉理解来标识模型的行为差异

[0008]ML
中的特征可视化可能关注于
(1)
揭示预测模型已经捕获了什么特征,或者
(2)
基于特征的影响幅值或重要性对该特征进行优先化,以限制分析的范围

前者通常在图像数据上进行,并且可能使用“通过优化实现可视化
(visualization by optimization)”来产生激活不同神经元以解释深度学习模型的特征图

不同的显著图生成算法也共享相同的目标,即突出所捕获的特征以更好地理解深度神经网络

特征优先化的后一个重点通常在表格数据上进行,其中不同的指标用于对不同数据特征的贡献进行排序

例如,当解释基于树的模型时,每个特征被用来分割树节点的次数通常被用来对特征进行排名

局部可解释模型不可知解释
(LIME)
和沙普利加和解释
(SHapley Additive exPlanations)(SHAP)
也提供了量化指标来对不同的数据特征进行排序

[0009]用新模型替换旧的生产模型通常会带来重大的业务影响

为了降低风险,新模型通常最初以“影子模式”启动
(
例如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种用于比较机器学习模型的系统,所述系统包括:至少一个处理器,所述至少一个处理器被编程或配置为:接收数据实例的数据集,其中每个数据实例包括针对多个特征中的每个特征的特征值;基于所述数据实例的数据集生成第一机器学习模型的输出和第二机器学习模型的输出;确定所述第一机器学习模型的所述输出的第一子集和所述第二机器学习模型的所述输出的第二子集;生成不一致矩阵,所述不一致矩阵包括所述第一机器学习模型和所述第二机器学习模型的第一分组输出集以及所述第一机器学习模型和所述第二机器学习模型的第二分组输出集,其中所述第一分组输出集包括满足第一条件的所述第一机器学习模型的多个输出和不满足所述第一条件的所述第二机器学习模型的多个输出,并且其中所述第二分组输出集包括不满足所述第一条件的所述第一机器学习模型的多个输出和满足所述第一条件的所述第二机器学习模型的多个输出;基于所述第一分组输出集和所述第二分组输出集的真标签生成多个真标签矩阵,其中第一真标签矩阵包括满足所述第一条件的所述第一机器学习模型的所述多个输出中的真阳性输出和满足所述第一条件的所述第二机器学习模型的所述多个输出中的真阳性输出,并且其中第二真标签矩阵包括满足所述第一条件的所述第一机器学习模型的所述多个输出中的假阳性输出和满足所述第一条件的所述第二机器学习模型的所述多个输出中的假阳性输出;基于所述第一真标签矩阵训练第一分类器;基于所述第二真标签矩阵训练第二分类器;并且基于所述第一分类器和所述第二分类器确定所述第一机器学习模型的准确率和所述第二机器学习模型的准确率
。2.
如权利要求1所述的系统,其中所述第一机器学习模型的所述输出的所述第一子集和所述第二机器学习模型的所述输出的所述第二子集具有相同数量的值
。3.
如权利要求1所述的系统,其中当确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率时,所述至少一个处理器被编程或配置为:基于在所述第一分类器和所述第二分类器上执行的模型解释技术,确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率
。4.
如权利要求3所述的系统,其中所述模型解释技术是涉及沙普利加和解释
(SHAP)
值的模型解释技术
。5.
如权利要求4所述的系统,其中当确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率时,所述至少一个处理器被编程或配置为:计算针对所述第一分类器的所述数据集的每个数据实例的每个特征值的
SHAP
值;并且计算针对所述第二分类器的所述数据集的每个数据实例的每个特征值的
SHAP

。6.
如权利要求5所述的系统,其中当确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率时,所述至少一个处理器被编程或配置为:生成针对所述第一分类器的所述数据集的每个数据实例的每个特征值的所述
SHAP

和针对所述第二分类器的所述数据集的每个数据实例的每个特征值的所述
SHAP
值的图
。7.
如权利要求5所述的系统,其中当确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率时,所述至少一个处理器被编程或配置为:生成针对所述第一分类器的所述数据集的每个数据实例的第一特征的多个特征值的多个
SHAP
值和针对所述第二分类器的所述数据集的每个数据实例的所述第一特征的多个特征值的多个
SHAP
值的图
。8.
如权利要求5所述的系统,其中当确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率时,所述至少一个处理器被编程或配置为:计算与所述第一分类器的第一特征的准确率指标相关联的准确率指标值,其中与所述第一分类器的所述第一特征的所述准确率指标相关联的所述准确率指标值是基于针对所述第一分类器的所述数据集的每个数据实例的所述第一特征的多个特征值的多个
SHAP
值;并且计算与所述第二分类器的所述第一特征的所述准确率指标相关联的准确率指标值,其中与所述第二分类器的所述第一特征的所述准确率指标相关联的所述准确率指标值是基于针对所述第二分类器的所述数据集的每个数据实例的所述第一特征的多个特征值的多个
SHAP
值,其中所述准确率指标包括与特征的幅值的度量相关联的指标

与特征的一致性的度量相关联的指标

与特征的对比度的度量相关联的指标或者与特征的相关性的度量相关联的指标
。9.
一种计算机实现的方法,所述计算机实现的方法包括:利用至少一个处理器来接收数据实例的数据集,其中每个数据实例包括针对多个特征中的每个特征的特征值;利用所述至少一个处理器来基于所述数据实例的数据集生成第一机器学习模型的输出和第二机器学习模型的输出;利用所述至少一个处理器来确定所述第一机器学习模型的所述输出的第一子集和所述第二机器学习模型的所述输出的第二子集;利用所述至少一个处理器来生成不一致矩阵,所述不一致矩阵包括所述第一机器学习模型和所述第二机器学习模型的第一分组输出集以及所述第一机器学习模型和所述第二机器学习模型的第二分组输出集,其中所述第一分组输出集包括满足第一条件的所述第一机器学习模型的多个输出和不满足所述第一条件的所述第二机器学习模型的多个输出,并且其中所述第二分组输出集包括不满足所述第一条件的所述第一机器学习模型的多个输出和满足所述第一条件的所述第二机器学习模型的多个输出;利用所述至少一个处理器来基于所述第一分组输出集和所述第二分组输出集的真标签生成多个真标签矩阵,其中第一真标签矩阵包括满足所述第一条件的所述第一机器学习模型的所述多个输出中的真阳性输出和满足所述第一条件的所述第二机器学习模型的所述多个输出中的真阳性输出,并且其中第二真标签矩阵包括满足所述第一条件的所述第一机器学习模型的所述多个输出中的假阳性输出和满足所述第一条件的所述第二机器学习模型的所述多个输出中的假阳性输出;利用所述至少一个处理器来基于所述第一真标签矩阵训练第一分类器;
利用所述至少一个处理器来基于所述第二真标签矩阵训练第二分类器;以及利用所述至少一个处理器来基于所述第一分类器和所述第二分类器确定所述第一机器学习模型的准确率和所述第二机器学习模型的准确率
。10.
如权利要求9所述的计算机实现的方法,其中所述第一机器学习模型的所述输出的所述第一子集和所述第二机器学习模型的所述输出的所述第二子集具有相同数量的值
。11.
如权利要求9所述的计算机实现的方法,其中确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率包括:基于在所述第一分类器和所述第二分类器上执行的模型解释技术,确定所述第一机器学习模型的所述准确率和所述第二机器学习模型的所述准确率
。12.
如权利要求
11
所述的计算机实现的方法,其中所述模型解释技术是涉及沙普利加和解释
(SHAP)
值的模型解释技术
。13...

【专利技术属性】
技术研发人员:王俊朋L
申请(专利权)人:维萨国际服务协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1