【技术实现步骤摘要】
【国外来华专利技术】用于机器学习模型评估的交互式界面
技术介绍
机器学习组合来自统计学和人工智能的技术以创建可从经验数据学习并推广到解决诸如自然语言处理、金融欺诈检测、恐怖主义威胁级别检测、人类健康诊断等各种领域中的问题的算法。近年来,正在从诸如各种传感器、web服务器日志、社交媒体服务、金融交易记录、安全摄像机等各种各种的来源收集可潜在用于机器学习模型的越来越多的原始数据。传统上,统计学和人工智能方面的专业知识是开发和使用机器学习模型的前提条件。对于许多业务分析师并甚至对于高资格的主题专家,获得这种专业知识的困难有时是太大的障碍,以至于不能充分利用潜在可用的大量数据来改进业务预测和决定。此外,许多机器学习技术可以是计算密集的,并且在至少一些情况下,可能难以精确地预测技术的各个阶段可能需要多少计算能力。鉴于这种不可预测性,对于商业组织来说建立他们自己的机器学习计算设施可能并不总是可取的或可行的。从机器学习算法获得的结果的质量可以取决于用于训练模型的经验数据有多好地捕获数据中表示的不同变量之间的关键关系以及可如何高效和有效地识别这些关系。取决于将使用机器学习解决的问题的性质,可能必须分析非常大的数据组以便能够进行准确预测,特别是相对不频繁但重要的事件的预测。例如,在金融欺诈检测应用中,其中欺诈交易的数量通常是交易总数的非常小的一小部分,识别可用于将交易标记为欺诈的因素可潜在需要分析数百万交易记录,每个表示几十个或甚至几百个变量。对原始输入数据组大小、净化或归一化大量潜在不完整或含有错误的记录和/或提取原始数据的代表性子集的能力的约束也表示对于机器学习技术的许多潜在受益者不容易克服的障 ...
【技术保护点】
一种系统,包括:一个或多个计算装置,其被配置来:在提供商网络的机器学习服务处训练机器学习模型以便生成对应于各自观察记录的一个或多个输出变量的值,其中所述一个或多个输出变量包括特定输出变量;对应于使用各自评估数据组执行的所述机器学习模型的一个或多个评估运行,生成将通过交互式图形界面显示的第一组数据,其中所述第一组数据至少包括(a)所述特定输出变量的统计分布以及(b)所述机器学习模型的第一预测质量度量,其中所述交互式图形界面包括第一图形控件以修改与所述机器学习模型相关联的第一预测解释阈值;至少部分地基于检测特定客户端使用所述第一图形控件,确定所述第一预测解释阈值的目标值;通过所述交互式图形界面发起由所述目标值的选择引起的对所述第一预测质量度量的改变的显示;响应于由客户端通过所述交互式图形界面传输的请求,将所述目标值保存在所述机器学习服务的持久性储存库中;以及利用所述所保存目标值来生成所述机器学习模型的随后运行的一个或多个结果。
【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:一个或多个计算装置,其被配置来:在提供商网络的机器学习服务处训练机器学习模型以便生成对应于各自观察记录的一个或多个输出变量的值,其中所述一个或多个输出变量包括特定输出变量;对应于使用各自评估数据组执行的所述机器学习模型的一个或多个评估运行,生成将通过交互式图形界面显示的第一组数据,其中所述第一组数据至少包括(a)所述特定输出变量的统计分布以及(b)所述机器学习模型的第一预测质量度量,其中所述交互式图形界面包括第一图形控件以修改与所述机器学习模型相关联的第一预测解释阈值;至少部分地基于检测特定客户端使用所述第一图形控件,确定所述第一预测解释阈值的目标值;通过所述交互式图形界面发起由所述目标值的选择引起的对所述第一预测质量度量的改变的显示;响应于由客户端通过所述交互式图形界面传输的请求,将所述目标值保存在所述机器学习服务的持久性储存库中;以及利用所述所保存目标值来生成所述机器学习模型的随后运行的一个或多个结果。2.如权利要求1所述的系统,其中所述机器学习模型是将用于将观察记录分类成第一类别和第二类别的二进制分类模型,并且其中所述第一预测解释阈值指示所述第一类别与所述第二类别之间的截止边界。3.如权利要求1-2中任一项所述的系统,其中所述第一预测质量度量包括以下各项中的一个或多个:准确度度量、召回度量、敏感度度量、真阳性率、特异性度量、真阴性率、精度度量、假阳性率、假阴性率、F1得分、覆盖度量、绝对百分比误差度量、平方误差度量或AUC(曲线下区域)度量。4.如权利要求1-3中任一项所述的系统,其中所述第一图形控件包括连续变化控制元件,使得所述特定客户端能够指示所述第一预测解释阈值的第一值与所述第一预测解释阈值的第二值之间的过渡,其中所述一个或多个计算装置进一步被配置来:在所述特定客户端指示从所述第一值到所述第二值的过渡时,实时地发起指示对所述第一预测质量度量的对应改变的所述交互式图形界面的一部分的更新。5.如权利要求1-4中任一项所述的系统,其中所述交互式图形界面包括用于指示包括所述第一预测质量度量和第二预测质量度量的多个预测质量度量的目标值的各自另外控件,其中所述一个或多个计算装置进一步被配置来:响应于使用第一另外控件指示的所述第一预测质量度量的目标值的改变,发起对应于所述第二预测质量度量的第二另外控件的显示的更新,指示所述第一预测质量度量的所述目标值的所述改变对所述第二预测质量度量的影响。6.一种方法,包括:通过一个或多个计算装置执行:训练机器学习模型以便生成对应于各自观察记录的一个或多个输出变量的各自值,其中所述一个或多个输出变量包括特定输出变量;对应于所述机器学习模型的一个或多个评估运行生成将通过交互式图形界面显示的第一组数据,其中所述第一组数据至少包括所述机器学习模型的第一预测质量度量,并且其中所述交互式图形界面包括第一图形控件以修改与所述机器学习模型相关联的第一预测解释阈值;至少部分地基于检测特定客户端与所述第一图形控件的交互,确定所述第一预测解释阈值的目标值;通过所述交互式图形界面发起由所述目标值的选择引起的对所述第一预测质量度量的改变的显示;以及使用所述目标值获得所述机器学习模型的随后运行的一个或多个结果。7.如权利要求6所述的方法,其中所述...
【专利技术属性】
技术研发人员:P·P·Y·李,N·M·科雷亚,L·P·迪拉克,A·M·英格曼,S·克里肖南,李瑾,S·R·普瓦蒂,S·赞拉蒂昂,C·E·达纳克尔,R·拉马克里肖南,郑天铭,卓东辉,T·阿加瓦尔,R·M·斯蒂勒,钱俊,M·布鲁克纳,R·赫布里奇,D·布里克,
申请(专利权)人:亚马逊科技公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。