机器学习模型错误检测制造技术

技术编号：36518858 阅读：19 留言：0更新日期：2023-02-01 15:52

一种系统包括存储器，其中具有指令；以及与存储器通信的至少一个处理器，其中至少一个处理器被配置为执行指令以：基于机器学习基础模型的第一预测来确定机器学习基础模型的可解释特征的全局级重要性的全局级重要性幅度值。至少一个处理器还被配置为执行指令以基于第一预测来确定可解释特征的全局级重要性的全局级重要性方向标签。至少一个处理器还被配置为执行指令以基于机器学习基础模型的第二预测、基于全局级重要性幅度值、并且基于全局级重要性方向标签，生成用于呈现给用户的传送。送。送。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】机器学习模型错误检测

技术介绍

[0001]本专利技术总体上涉及人工智能领域，更具体地涉及提高机器学习模型的准确性。
[0002]机器获取和应用知识和技能的各种能力已被归类为人工智能(“AI”)。机器学习被认为是AI的一种形式。机器学习已经采用了算法和统计模型，这些算法和统计模型使计算机系统能够主要基于数据模式和相关联的推理而不是显式指令来执行任务。一些机器学习模型已经执行了分类和/或其他预测任务。提供对这种模型何时以及如何被破坏的可操作洞察是有挑战性的。

技术实现思路

[0003]公开了一种用于校正针对用户的机器学习基础模型的错误预测的方法，方法包括：基于机器学习基础模型的第一预测，确定机器学习基础模型的可解释特征对于机器学习基础模型的全局级重要性的全局级重要性幅度值。方法还包括：基于机器学习基础模型的第一预测，确定机器学习基础模型的可解释特征对机器学习基础模型的全局级重要性的全局级重要性方向标签。方法还包括：基于机器学习基础模型的第二预测、基于全局级重要性幅度值、并且基于全局级重要性方向标签，生成用于呈现给用户的传送。
[0004]还公开了一种用于向用户警告机器学习基础模型的错误预测的方法，方法包括：在第一输入数据集上运行机器学习基础模型，以由机器学习基础模型生成基线预测对，并且确定机器学习基础模型的第一可解释特征对机器学习基础模型的预测类的局部级重要性。方法还包括：基于机器学习基础模型的第一可解释特征的局部级重要性来确定机器学习基础模型的第一可解释特征对机器学习基础模型的全局级重要性。方法还包括：在第二输...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于校正针对用户的机器学习基础模型的错误预测的方法，所述方法包括：基于所述机器学习基础模型的第一预测，确定所述机器学习基础模型的可解释特征对于所述机器学习基础模型的全局级重要性的全局级重要性幅度值；基于所述机器学习基础模型的所述第一预测，确定所述机器学习基础模型的所述可解释特征对所述机器学习基础模型的所述全局级重要性的全局级重要性方向标签；以及基于所述机器学习基础模型的第二预测、基于所述全局级重要性幅度值、并且基于所述全局级重要性方向标签，生成用于呈现给所述用户的传送。2.根据权利要求1所述的方法，其中生成用于呈现给所述用户的所述传送包括：接收对所述全局级重要性方向标签的错误评估。3.根据权利要求2所述的方法，还包括：基于所述全局级重要性方向标签、基于对所述全局级重要性方向标签的所述错误评估、并且基于所述机器学习基础模型的所述可解释特征对所述机器学习基础模型的预测类的局部级重要性，校正所述错误预测。4.根据权利要求3所述的方法，其中接收对所述全局级重要性方向标签的所述错误评估包括：接收对所述全局级重要性方向标签的人类错误评估。5.一种用于向用户警告机器学习基础模型的错误预测的方法，所述方法包括：在第一输入数据集上运行所述机器学习基础模型，以由所述机器学习基础模型生成基线预测对，并且确定所述机器学习基础模型的第一可解释特征对所述机器学习基础模型的预测类的局部级重要性；基于所述机器学习基础模型的所述第一可解释特征的所述局部级重要性，确定所述机器学习基础模型的所述第一可解释特征对所述机器学习基础模型的全局级重要性；在第二输入数据集上运行所述机器学习基础模型，以由所述机器学习基础模型生成新预测；基于所述机器学习基础模型的所述第一可解释特征的所述局部级重要性和所述机器学习基础模型的所述第一可解释特征的所述全局级重要性，确定针对所述新预测的错误指定；以及传送所述新预测和针对所述新预测的所述错误指定的指示，以用于呈现给所述用户。6.根据权利要求5所述的方法，还包括：基于全局级重要性幅度值，确定所述机器学习基础模型的所述第一可解释特征相对于所述机器学习基础模型的第二可解释特征的排序；基于所述机器学习基础模型的所述第一可解释特征的所述排序，传送所述机器学习基础模型的所述第一可解释特征；传送全局级重要性方向标签；接收所述机器学习基础模型的所述第一可解释特征的传送；以及计算针对所述新预测的局部错误得分，以作为由所述机器学习基础模型的所述第一可解释特征引入到所述新预测中的错误的归一化版本，其中所述机器学习基础模型的所述第一可解释特征的所述全局级重要性包括所述全局级重要性幅度值和所述全局级重要性方向标签，其中根据人类评估，所述全局级重要性方向标签是错误的，并且其中确定针对所述新预测的所述错误指定包括：基于针对所述新预测的所述局部错误
得分是否超过阈值来确定针对每个新预测的所述错误指定。7.根据权利要求6所述的方法，其中在所述第一输入数据集上运行所述机器学习基础模型，以由所述机器学习基础模型生成所述基线预测对，并且确定所述机器学习基础模型的所述第一可解释特征对所述机器学习基础模型的所述预测类的所述局部级重要性包括：使用数据扰动过程来由所述机器学习基础模型生成所述基线预测对，并且确定所述机器学习基础模型的所述第一可解释特征对所述机器学习基础模型的所述预测类的所述局部级重要性。8.根据权利要求7所述的方法，其中使用所述数据扰动过程来由所述机器学习基础模型生成所述基线预测对，并且确定所述机器学习基础模型的所述第一可解释特征对所述机器学习基础模型的所述预测类的所述局部级重要性包括：计算其中j表示所述第一可解释特征，其中d
i
，i∈{0，1，...，N}表示所述第一输入数据集中的第一数据实例，其中d
i
包括所述第一可解释特征j，其中表示除所述第一可解释特征j之外的所有第一数据实例d
i
，其中k∈{0，1，...，K}表示所述机器学习基础模型的对应的预测类，其中P(y＝k|d
i
)表示由所述机器学习基础模型从在所述第一数据实例d
i
上运行所述机器学习基础模型而生成的针对所述机器学习基础模型的对应的所述预测类k的第一预测概率，其中表示由所述机器学习基础模型从在上运行所述机器学习基础模型而生成的针对所述机器学习基础模型的对应的所述预测类k的第二预测概率，并且其中表示与对应的所述预测类k相关联的所述第一可解释特征j对所述第一数据实例d
i
的所述局部级重要性。9.根据权利要求8所述的方法，其中基于所述机器学习基础模型的所述第一可解释特征的所述局部级重要性来确定所述机器学习基础模型的所述第一可解释特征对所述机器学习基础模型的所述全局级重要性包括：计算其中N表示所述第一输入数据集中的数据实例集的基数，其中所述数据实例集中的每个数据实例包括所述第一可解释特征，并且其中k
*
表示所述第一可解释特征的所述全局级重要性的所述全局级重要性方向标签。10.根据权利要求9所述的方法，其中基于所述机器学习基础模型的所述第一可解释特征的所述局部级重要性来确定所述机器学习基础模型的所述第一可解释特征对所述机器学习基础模型的所述全局级重要性包括：计算
其中表示由所述机器学习基础模型生成的、并且与所述第一可解释特征的所述全局级重要性的所述全局级重要性方向标签相关联的第三预测概率的幅度，并且其中表示所述第一可解释特征的所述全局级重要性的所述全局级重要性幅度值。11.根据权利要求10所述的方法，其中计算针对所述新预测的所述局部错误得分包括：计算其中表示第一相应可解释特征j对由所述机器学习基础模型从在所述第二输入数据集中的第二数据实例上运行所述机器学习基础模型而生成的预测概率的贡献，其中根据所述人类评估，全局级重要性方向标签集中的每个全局级重要性方向标签是错误的，其中m表示所述全局级重要性方向标签集的基数，其中表示第二相应可解释特征i对由所述机器学习基础模型从在所述第二输入数据集中的所述第二数据实例上运行所述机器学习基础模型而生成的所述预测概率的贡献，其中所述第二相应可解释特征i的贡献方向与所述新预测一致，其中n表示可解释特征集的基数，并且其中所述可解释特征集中的每个可解释特征的贡献方向与所述新预测一致。12.一种用于校正针对用户的机器学习基础模型的错误预测的系统，所述系统包括：存储器，其中具有指令；以及与所述存储器通信的至少一个处理器，其中所述至少一个处理器被配置为执行所述指令以：基于所述机器学习基础模型的第一预测，确定所述机器学习基础模型的可解释特征对所述机器学习基础模型的全局级重要性的全局级重要性幅度值；基于所述机器学习基础模型的所述第一预测，确定所述机器学习基础模型的所述可解释特征对所述机器学习基础模型的所述全局级重要性的全局级重要性方向标签；以及基于所述机器学习基础模型的第二预测、基于所述全局级重要性幅度值、并且基于所述全局级重要性方向标签，生成用于呈现给所述用户的传送。13.根据权利要求12所述的系统，其中所述至少一个处理器还被配置以执行所述指令以：接收对所述全局级重要性方向标签的错误评估；以及基于所述错误评估来生成用于呈现给所述用户的所述传送。14.根据权利要求13所述的系统，其中所述至少一个处理器还被配置为执行所述指令，以基于所述全局级重要性方向标签、基于对所述全局...

【专利技术属性】
技术研发人员：刘喆，郭玙璠，J，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人