示例系统通过专家的神经元优化以提高的效率执行复杂优化任务。特别是,提供了一种机器学习框架,其中元优化神经网络可以学习融合专家集合以提供预测的解决方案。具体地,元优化神经网络可以学习预测复杂优化处理的输出,其优化专家集合的输出以产生优化输出。以这种方式,元优化神经网络可以在训练后被用于代替复杂优化处理,以从专家那里产生综合解决方案,从而实现更快的数量级和计算上更有效的预测或问题解决方案。测或问题解决方案。测或问题解决方案。
【技术实现步骤摘要】
通过专家的神经元优化以提高的效率执行复杂优化任务
[0001]优先权要求
[0002]本申请基于申请日为2021年7月21日的美国临时申请63/224,079并要求其优先权,该申请的全部内容通过引用并入本文。
[0003]本公开通常涉及机器学习。更具体地,本公开涉及通过专家的神经元优化以提高的效率执行复杂优化任务。
技术介绍
[0004]从计算机科学和工程到运筹学等许多学科都出现了优化问题。在最简单的情况下,优化问题包括通过从允许的集合中系统地选择输入值并计算函数的值来最大化或最小化实际函数。将优化理论和技术推广到其他公式构成了应用数学的一个大领域。更一般地,优化包括在给定定义域(或输入)的情况下找到某些目标函数的“最佳可用”值,包括各种不同类型的目标函数和不同类型的域。
[0005]在一些示例中,研究人员可以使用迭代优化技术来收敛到解决方案(在某些特定类别的问题上)或启发式优化技术,可以为某些问题提供近似解决方案(尽管它们的迭代不需要收敛)。在一些示例中,可以使用可以被称为“求解器”的某些程序或方法来执行或“求解”优化技术。
[0006]通常,任何非无关紧要问题的优化技术在计算上都非常复杂,需要在相当长的一段时间内使用大量的计算能力。这种计算复杂性将优化技术的应用限制在某些问题或计算资源有限和/或延迟是关键的某些设置中。这种性质的一个示例设置是在典型的移动或嵌入式设备上,这些设备具有有限的计算资源,诸如处理器能力和/或存储器,并且延迟通常是用户采用的驱动因素。
技术实现思路
<br/>[0007]本专利技术实施例的方面和优点将在下面的描述中部分阐述,或者可以从描述中获知,或者可以通过实施实施例的实践来获知。
[0008]本公开的一个示例方面涉及一种用于以提高的效率或准确性执行复杂优化任务的计算机实现的方法。所述方法包括:通过包括一个或多个计算设备的计算系统获得一组输入数据。所述方法包括通过计算系统利用一个或多个现有专家模型处理输入数据以生成一个或多个专家输出。所述方法包括通过计算系统利用元优化神经网络处理一个或多个专家输出以生成预测输出。所述方法包括通过计算系统对一个或多个专家输出执行优化技术以生成优化输出。所述方法包括通过计算系统至少部分地基于将预测输出与优化输出进行比较的损失函数来修改元优化神经网络的一个或多个可学习参数。
[0009]本公开的另一个示例方面涉及一种计算系统。所述计算系统包括一个或多个处理器;以及一个或多个非暂时性计算机可读介质,共同存储指令,当指令由一个或多个处理器
执行时,使计算系统执行操作。所述操作包括获取一组输入数据。所述操作包括利用一个或多个现有专家模型处理输入数据以生成一个或多个专家输出。所述操作包括利用元优化神经网络处理一个或多个专家输出以生成预测输出。元优化神经网络已经被训练为通过相对于优化输出执行监督学习方法来生成预测输出,优化输出是对由一个或多个现有专家模型生成的初始输入执行优化技术而生成的。
[0010]本公开的另一个示例方面涉及一个或多个非暂时性计算机可读介质,共同存储指令,当指令由一个或多个处理器执行时,使计算系统执行操作。所述操作包括通过计算系统获得描绘场景的多个图像。所述操作包括通过计算系统利用一个或多个现有专家模型处理多个图像,以生成在多个图像中检测到的多个特征。所述操作包括通过计算系统利用元优化神经网络处理多个图像以生成预测输出。预测输出包括多个图像相对于场景的预测几何形状。所述操作包括通过计算系统对多个特征执行捆绑调整技术以生成优化输出,其中优化输出包括多个图像相对于场景的优化几何形状。所述操作包括通过计算系统至少部分地基于将多个图像相对于场景的预测几何形状与多个图像相对于场景的优化几何形状进行比较的损失函数来修改元优化神经网络的一个或多个可学习参数。
[0011]本公开的其他方面针对各种系统、装置、非暂时性计算机可读介质、用户界面和电子设备。
[0012]参考以下描述和所附权利要求将更好地理解本公开的各种实施例的这些和其他特征、方面和优点。被并入并构成本说明书一部分的附图示出了本公开的示例实施例,并且与描述一起用于解释相关原理。
附图说明
[0013]在参考附图的说明书中阐述了针对本领域普通技术人员的实施例的详细讨论,其中:
[0014]图1描绘根据本公开的示例实施例的用于训练神经元优化器的示例训练处理的框图。
[0015]图2描绘根据本公开的示例实施例的利用训练的神经元优化器的示例推断处理的框图。
[0016]图3示出根据本公开的示例实施例如何训练可以聚合多个单视图方法的输出的神经网络。
[0017]图4示出根据本公开的示例实施例的具有在给定多视图观察的情况下回归等边三角形的3D顶点的简单2D示例的示例方法。
[0018]图5示出根据本公开的示例实施例的用于初始化的示例方法。
[0019]图6示出根据本公开的示例实施例的用于细化的示例方法。
[0020]图7示出根据本公开的示例实施例的示例模型架构。
[0021]图8A描绘根据本公开的示例实施例的示例计算系统的框图。
[0022]图8B描绘根据本公开的示例实施例的示例计算设备的框图。
[0023]图8C描绘根据本公开的示例实施例的示例计算设备的框图。
[0024]跨多个附图重复的附图标记旨在标识各种实现方式中的相同特征。
具体实施方式
[0025]概述
[0026]通常,本公开涉及通过专家的神经元优化以提高的效率执行复杂优化任务。特别地,本公开的示例方面提供了一种机器学习框架,其中元优化神经网络可以学习融合专家集合以提供预测的解决方案。具体地,元优化神经网络可以学习预测复杂优化处理的输出,其对专家集合的输出进行优化以产生优化输出。以这种方式,元优化神经网络可以在训练后用于代替复杂优化处理以从专家那里产生综合解决方案,从而得到数量级更快和计算更有效的预测或问题解决方案和/或更准确的解决方案。
[0027]具体地,在一些实现方式中,神经优化器可以学习数据先验以规范非基于学习的优化器可能无法利用的解决方案。此外,元优化器可以有效地结合专家输出中的不确定性,并使用数据中的先验纠正专家输出中的错误,这是优化器可能无法做到的。
[0028]为了提供一个示例用例(其中有很多),所提出的系统和方法可以被应用于执行人体姿态作为神经网络中的捆绑调整(也可以称为“神经捆绑调整”)。更具体地,给定描绘来自不同视点的多个3D点的图像的集合,捆绑调整可以被定义为同时细化描述场景和/或相机的3D坐标的问题。当如本文所述应用于人体姿态时,描述场景的3D坐标可以被参数化为在图像中描绘的人体上的关键点(例如,关节位置)。捆绑调整技术通常包括执行计算要求相对较高的优化处理,其中迭代地调整图像的3D坐标和/或视点以最大化一致性。
[0029]为了继续将所提出的元优化方法应用于此示例用例,可以首先将图像提供给现有专家模型的集合。例如,专家模型可以是现本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用于以提高的效率或准确性执行复杂优化任务的计算机实现的方法,所述方法包括:通过包括一个或多个计算设备的计算系统获得一组输入数据;通过计算系统利用一个或多个现有专家模型处理输入数据以生成一个或多个专家输出;通过计算系统利用元优化神经网络处理一个或多个专家输出以生成预测输出;通过计算系统对一个或多个专家输出执行优化技术以生成优化输出;以及通过计算系统至少部分地基于将预测输出与优化输出进行比较的损失函数来修改元优化神经网络的一个或多个可学习参数。2.根据任何前述权利要求所述的计算机实现的方法,其中,优化技术包括迭代最小化技术。3.根据任何前述权利要求所述的计算机实现的方法,其中,一个或多个现有专家模型包括一个或多个机器学习专家模型,所述一个或多个机器学习专家模型先前已被训练为生成一个或多个专家输出。4.根据任何前述权利要求所述的计算机实现的方法,其中,损失函数包括对优化输出的一个或多个先验进行编码的一个或多个损失项。5.根据任何前述权利要求所述的计算机实现的方法,其中:输入数据包括随时间的输入序列;并且一个或多个专家输出包括由一个或多个现有专家从随时间的输入序列分别随时间生成的专家输出序列。6.根据任何前述权利要求所述的计算机实现的方法,其中,一个或多个专家输出具有与优化输出和预测输出相同的数据结构。7.根据权利要求1
‑
5中的任一项所述的计算机实现的方法,其中,一个或多个专家输出包括一个或多个超先验。8.根据任何前述权利要求所述的计算机实现的方法,其中:输入数据包括描绘场景的多个图像;一个或多个专家输出包括在多个图像中检测到的多个特征;以及通过计算系统对一个或多个专家输出执行优化技术以生成优化输出包括通过计算系统对多个特征执行捆绑调整技术以生成优化输出,其中优化输出包括多个图像相对于场景的几何形状。9.根据权利要求8所述的计算机实现的方法,其中:多个图像描绘对象;一个或多个专家输出包括对象的初始预测姿态;预测输出包括对象的最终预测姿态;以及优化输出还包括对象的细化姿态。10.根据权利要求9所述的计算机实现的方法,其中:对象包括人体;以及使用关节位置参数化人体的初始预测姿态、最终预测姿态和细化姿态。11.根据权利要求8
‑
10中的任一项所述的计算机实现的方法,其中,多个图像包括多个
...
【专利技术属性】
技术研发人员:A萨德,B乌斯曼,A塔格利亚萨奇,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。