当前位置: 首页 > 专利查询>辉达公司专利>正文

使用机器学习模型的自动标记和分割制造技术

技术编号:35126669 阅读:50 留言:0更新日期:2022-10-05 09:58
本发明专利技术涉及使用机器学习模型的自动标记和分割。在各种示例中,描述了用于生成对于各种环境特征鲁棒的经训练的神经网络的训练方法。在一个实施例中,训练包括修改数据集的图像,并且为用于训练神经网络的经修改的图像生成边界框和/或其他分割信息。成边界框和/或其他分割信息。成边界框和/或其他分割信息。

【技术实现步骤摘要】
使用机器学习模型的自动标记和分割

技术介绍

[0001]自动标记和分割工具的传统方法依赖于现有的数据集,由于缺乏不同域的数据,这些数据集可能无法为各种应用生成鲁棒的工具。例如,现有的训练数据集可能不包括特定环境、对象方向或特定自动标记或分割工具的部署环境的其他特征。此外,获取用于训练数据集的注释和掩模既耗时又容易出错。此外,用于对象检测和其他任务的卷积神经网络(CNN)通常在划分为矩形框时工作得最好,其中这些矩形框的边缘与提供给CNN的图像的边界平行,这可能会在各种实际应用中产生域间隙。现有的自动标记和分割工具受到现有训练数据集的限制,这些数据集成本高昂且难以生成。此外,这些工具在训练期间需要人工监督。
附图说明
[0002]下面参考附图详细描述了用于分割的旋转地鲁棒的自动标记工具的本系统和方法,其中:
[0003]图1是根据本公开的一些实施例用于生成预标记工具以在第二训练阶段期间执行图像分割的第一训练阶段的图示;
[0004]图2是根据本公开的一些实施例用于生成经训练的神经网络以执行图像分割的第二训练阶段的图示;
[0005]图3是根据本公开的一些实施例由神经网络生成的图像分割的图示;
[0006]图4是根据本专利技术的一些实施例由神经网络生成的图像分割的图示;
[0007]图5是根据本公开的一些实施例用于生成经训练的神经网络以执行图像分割的两阶段训练过程的图示;
[0008]图6是根据本公开的一些实施例由预标记工具和经训练的神经网络生成的图像分割的图示;
[0009]图7是示出了根据本公开的一些实施例用于生成预标记工具以在第二训练阶段期间执行图像分割的第一训练阶段的流程图;
[0010]图8是示出了根据本公开的一些实施例用于生成经训练的神经网络以执行图像分割的第二训练阶段的流程图;
[0011]图9是示出了根据本公开的一些实施例的应用于数据集的图像的一组变换的流程图;
[0012]图10A示出了根据至少一个实施例的推理和/或训练逻辑;
[0013]图10B示出了根据至少一个实施例的推理和/或训练逻辑;
[0014]图11示出了根据至少一个实施例的神经网络的训练和部署;
[0015]图12示出了根据至少一个实施例的示例数据中心系统;
[0016]图13A示出了根据至少一个实施例的自主车辆的示例;
[0017]图13B示出了根据至少一个实施例的图13A的自主车辆的相机位置和视野的示例;
[0018]图13C是根据至少一个实施例的示出图13A的自主车辆的示例系统架构的框图;
[0019]图13D是根据至少一个实施例的示出用于一个或更多个基于云的服务器与图13A的自主车辆之间进行通信的系统的图;
[0020]图14是根据至少一个实施例的示出计算机系统的框图;
[0021]图15是根据至少一个实施例的示出计算机系统的框图;
[0022]图16示出了根据至少一个实施例的计算机系统;
[0023]图17示出了根据至少一个实施例的计算机系统;
[0024]图18A示出了根据至少一个实施例的计算机系统;
[0025]图18B示出了根据至少一个实施例的计算机系统;
[0026]图18C示出了根据至少一个实施例的计算机系统;
[0027]图18D示出了根据至少一个实施例的计算机系统;
[0028]图18E和图18F示出了根据至少一个实施例的共享编程模型;
[0029]图19示出了根据至少一个实施例的示例性集成电路和相关的图形处理器;
[0030]图20A和图20B示出了根据至少一个实施例的示例性集成电路和相关联的图形处理器;
[0031]图21A和图21B示出了根据至少一个实施例的附加的示例性图形处理器逻辑;
[0032]图22示出了根据至少一个实施例的计算机系统;
[0033]图23A示出了根据至少一个实施例的并行处理器;
[0034]图23B示出了根据至少一个实施例的分区单元;
[0035]图23C示出了根据至少一个实施例的处理集群;
[0036]图23D示出了根据至少一个实施例的图形多处理器;
[0037]图24示出了根据至少一个实施例的多图形处理单元(GPU)系统;
[0038]图25示出了根据至少一个实施例的图形处理器;
[0039]图26是根据至少一个实施例的示出用于处理器的处理器微架构的框图;
[0040]图27示出了根据至少一个实施例的深度学习应用程序处理器;
[0041]图28是根据至少一个实施例的示出了示例神经形态处理器的框图;
[0042]图29示出了根据一个或更多个实施例的图形处理器的至少部分;
[0043]图30示出了根据一个或更多个实施例的图形处理器的至少部分;
[0044]图31示出了根据一个或更多个实施例的图形处理器的至少部分;
[0045]图32是根据至少一个实施例的图形处理器的图形处理引擎的框图;
[0046]图33是根据至少一个实施例的图形处理器核心的至少部分的框图;
[0047]图34A和图34B示出了根据至少一个实施例的线程执行逻辑,其包括图形处理器核心的处理元件的阵列。
[0048]图35示出了根据至少一个实施例的并行处理单元(“PPU”);
[0049]图36示出了根据至少一个实施例的通用处理集群(“GPC”);
[0050]图37示出了根据至少一个实施例的并行处理单元(“PPU”)的存储器分区单元;
[0051]图38示出了根据至少一个实施例的流式多处理器;
[0052]图39是根据至少一个实施例的高级计算管线的示例数据流图;
[0053]图40是根据至少一个实施例的用于在高级计算管线中训练、适应、实例化和部署机器学习模型的示例系统的系统图;
[0054]图41包括根据至少一个实施例的用于处理成像数据的高级计算管线4010A的示例图示;
[0055]图42A包括根据至少一个实施例的支持超声设备的虚拟仪器的示例数据流图;
[0056]图42B包括根据至少一个实施例的支持CT扫描仪的虚拟仪器的示例数据流图;
[0057]图43A示出了根据至少一个实施例的用于训练机器学习模型的过程的数据流图;以及
[0058]图43B是根据至少一个实施例的利用预训练的注释模型来增强注释工具的客户端

服务器架构的示例图示。
具体实施方式
[0059]本公开的实施例涉及用于分割的旋转地鲁棒的自动标记工具。公开了提供自训练方法以从由第一模型生成的边界框获得分割掩模(例如,用于行人检测任务)的系统和方法。随后第二模型可以使用获得的分割掩模在经旋转的图像中生成紧密的(更紧密的)边界框,该边界框可以用作附加增强,为图像中的对象生成面向地面实况的边界框(例如,非轴对齐的边界框),和/或为对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:获得图像,所述图像包括在所述图像中描绘的对象;对所述图像的区域执行标记,以区分描绘所述对象的各个部分的区域与描绘与所述对象不同的所述图像的各个部分的区域;对所述图像执行一组变换以生成一组经变换的图像;以及至少部分地基于所执行的标记,为所述一组经变换的图像生成所述对象的一组边界。2.根据权利要求1所述的方法,其中执行所述一组变换还包括将所述图像旋转一组值。3.根据权利要求1所述的方法,其中所述一组边界包括所述一组经变换的图像中的所述对象的边界框。4.根据权利要求1所述的方法,其中所述方法还包括至少部分地基于所述一组经变换的图像和所述对象的所述一组边界来训练神经网络。5.根据权利要求4所述的方法,其中训练所述神经网络以执行对象检测。6.根据权利要求1所述的方法,其中:所述图像具有所述对象的第一边界框;所述一组变换包括所述图像的旋转以产生经旋转的图像;以及所述一组边界包括所述对象的第二边界框,所述对象的所述第二边界框具有平行于所述对象的所述第一边界框的边并且具有小于最小周长的框的面积,所述最小周长的框在所述旋转被应用于所述第一边界框后将完全包围所述第一边界框。7.根据权利要求1所述的方法,其中执行所述一组变换还包括修改所述图像的比例值。8.根据权利要求1所述的方法,其中执行所述一组变换还包括修改第二数据集的一组图像的亮度值。9.根据权利要求1所述的方法,其中执行所述一组变换还包括修改第二数据集的一组图像的对比度值。10.根据权利要求1所述的方法,其中所述标记是由经训练以执行分割的神经网络生成的所述图像的分割。11.根据权利要求10所述的方法,其中所述神经网络包括基于掩模区域的卷积神经网络。12.根据权利要求1所述的方法,还包括将所述一组边界与训练数据集中的所述对象的标记相关联。13.根据权利要求1所述的方法,其中所述图像还包括一组帧中的帧,所述一组帧包括视频。14.根据权利要求1所述的方法,其中所述一组边界的第一边界还包括包围所述对象的矩形区域。15.一种系统,包括:一个或更多个处理器;以及存储器,其存储指令,作为由所述一个或更多个处理器执行所述指令的结果,使所述系统:获得描绘对象的图像;使用第一模型来获得所述图像的分割,以将所述对象的像素与其他像素区分开;
使用所述分割来确定所述图像的一组经修改的版本中的所述对象的边界;以及将所述对象与训练数据集中的边界相关联。16.根据权利要求15所述的系统,其中所述第一模型还包括至少部分地基于精选的数据集被训练的卷积神经网络。17.根据权利要求15所述的系统,其中所述存储器还包括如下指令,作为由所述一个或更多个处理器执行所述指令的结果,使所述系统使用所述训练数据集来训练第二模型以执行对象检测。18.根据权利要求17所述的系统,其中所述第二模型包括卷积神经网络。19.根据权利要求15所述的系统,其中所述边界包括所述对象...

【专利技术属性】
技术研发人员:S
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1