检测不可推理的数据制造技术

技术编号：35260035 阅读：18 留言：0更新日期：2022-10-19 10:19

一种检测不可信推理的数据。提供了一种方法、系统和程序产品标识多个模型以测试数据集的方法。多个模型中的每一个模型产生对应于多个目标中的一个目标的多个预测中的一个预测。该方法、系统和程序产品响应于对照多个模型中的每个模型而测试数据集来检测该多个预测之间的一个或多个冲突。所述方法、系统和程序产品响应于检测到所述一个或多个冲突而报告测试的不可推理的结果。试的不可推理的结果。试的不可推理的结果。

全部详细技术资料下载

【技术实现步骤摘要】
检测不可推理的数据

技术介绍

[0001]人工智能使用机器学习算法来基于样本数据(训练数据)以构建模型，以对主题做出预测或决定，而不被显式地编程为对该主题做出预测或决定。机器学习算法被用于各种各样的应用中，在这些应用中开发常规算法以执行所需任务是困难或不可行的。
[0002]机器学习模型的精确度等级基于其“真肯定”、“真否定”、“假肯定”以及“假否定”。真肯定是其中机器学习模型正确地预测肯定类别的结果。真否定是其中机器学习模型正确地预测否定类别的结果。假肯定是其中机器学习模型不正确地预测肯定类别的结果。并且，假否定是其中机器学习模型不正确地预测否定类别的结果。
[0003]当机器学习模型生成假肯定结果时，机器学习模型可能试图预测不可预测的结果，在本文中称为“不可推理的”。需要机器学习模型来预测特定结果，即使预测具有低置信度。当系统使用多个机器学习模型来达到最终结果时，用户不能够区分不同机器学习模型的各个结果与随后生成假肯定最终结果之间是否存在冲突。尽管存在变通方案(诸如，创建“其他”类别的结果)，但是这些方法不在二进制分类中起作用。

技术实现思路

[0004]根据本公开的一个实施例，提供方式，其中方法、系统和程序产品标识多个模型以测试数据集。多个模型中的每个模型产生对应于多个目标中的一个目标的多个预测中的一个预测。该方法、系统和程序产品响应于对照多个模型中的每个模型来测试数据集来检测该多个预测之间的一个或多个冲突。所述方法、系统和程序产品响应于检测到所述一个或多个冲突，报告测试的不可推理的结果。
[00...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法，包括：标识多个模型以测试数据集，其中所述多个模型中的每个模型产生对应于多个目标中的一个目标的多个预测中的一个预测；响应于对照多个模型中的每个模型来测试所述数据集，检测所述多个预测之间的一个或多个冲突；以及响应于检测到所述一个或多个冲突，报告所述测试的不可推理的结果。2.根据权利要求1所述的计算机实现的方法，其中所述多个模型包括第一模型和第二模型，所述方法还包括：由所述第一模型生成对应于所述多个目标中的第一目标的强第一预测；从所述第二模型生成对应于所述多个目标中的第二目标的强第二预测；以及响应于确定所述第一目标不同于所述第二目标，生成所述不可推理的结果。3.根据权利要求2所述的计算机实现的方法，其中所述强第一预测基于第一平均值加上对应于所述第一模型的第一概率曲线上的两个标准差置信度阈值，并且其中所述强第二预测基于第二平均值加上对应于所述第二模型的第二概率曲线上的两个标准差置信度阈值。4.根据权利要求1所述的计算机实现的方法，还包括：基于训练数据集来构建所述多个模型；针对所述多个模型中的每个模型计算多个模型评估度量中的一个模型评估度量，所述多个模型评估度量测量所述多个模型中的一个模型的性能；以及基于所述多个模型的对应的模型评估度量，从所述多个模型中选择K个模型的子集，其中所述K个模型的子集包括重要特征集。5.根据权利要求4所述的计算机实现的方法，还包括：将对应于所述K个模型的子集的重要特征集进行排名；基于所述排名来标识独特特征集；针对所述独特特征集中的每个独特特征集：选择所述独...

【专利技术属性】
技术研发人员：林俊叡，许静，韩四儿，张雪英，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人