分批处理机器学习模型的输入制造技术

技术编号：34385920 阅读：75 留言：0更新日期：2022-08-03 21:08

用于分批处理机器学习模型的输入的方法、系统和装置，包括在计算机存储介质上编码的计算机程序。所述方法中的一种包括：接收请求流，每个请求识别相应的输入以供由第一机器学习模型处理；将来自每个请求的所述相应的输入添加到输入的第一队列以供由所述第一机器学习模型处理；在第一时间确定到所述第一时间时为止所述第一队列中的输入的计数等于或者超过最大批大小，并且作为响应：从到所述第一时间时为止所述队列中的所述输入生成第一成批输入，使得所述第一成批输入中的输入的计数等于所述最大批大小，并且提供所述第一成批输入以供由所述第一机器学习模型处理。供由所述第一机器学习模型处理。供由所述第一机器学习模型处理。

全部详细技术资料下载

【技术实现步骤摘要】
分批处理机器学习模型的输入
[0001]分案说明
[0002]本申请属于申请日为2016年12月21日的中国专利技术专利申请201680084418.2的分案申请。

[0003]本说明书涉及使用机器学习模型来处理输入。

技术介绍

[0004]机器学习模型接收输入并且基于所接收到的输入生成输出，例如预测的输出。一些机器学习模型是参数模型并且基于所接收到的输入且基于模型的参数值生成输出。
[0005]一些机器学习模型是采用模型的多个层来为所接收到的输入生成输出的深度模型。例如，深度神经网络包括输出层和一个或多个隐藏层，所述一个或多个隐藏层各自对所接收到的输入应用非线性变换以生成输出。

技术实现思路

[0006]一般而言，本说明书描述一种用于分批处理机器学习模型的输入的系统。
[0007]可借助于安装在系统上的软件、固件、硬件或其组合来如此配置一个或多个计算机的系统，所述软件、固件、硬件或其组合在操作中使系统执行动作。可借助于具有指令来如此配置一个或多个计算机程序，所述指令当由数据处理装置执行时，使该装置执行动作。
[0008]可实现本说明书中描述的主题的特定实施例以便实现以下优点中的一个或多个。通过像本说明书中所描述的那样分批处理机器学习模型的输入，可更有效地使用由系统使用来执行模型的操作的硬件资源，同时确保不超过最大可接受的等待时间。特别地，可优化高吞吐量硬件资源，例如图形处理单元(GPU)和其它硬件加速器，同时维持可接受的等待时间。在系统维护多个机器学习模型的情...

【技术保护点】

【技术特征摘要】
1.一种分批处理机器学习模型的输入的方法，包括：接收请求流，每个请求识别相应的输入以供由第一机器学习模型处理；将来自每个请求的所述相应的输入添加到输入的第一队列以供由所述第一机器学习模型处理；在第一时间确定到所述第一时间时为止所述第一队列中的输入的计数等于或者超过最大批大小，并且作为响应：从到所述第一时间时为止所述队列中的所述输入生成第一成批输入，使得所述第一成批输入中的输入的计数等于所述最大批大小，并且提供所述第一成批输入以供由所述第一机器学习模型处理，其中所述第一机器学习模型利用计算图系统来管理对输入的处理；以及在第二时间确定(i)到所述第二时间时为止所述队列中的输入的计数小于所述最大批大小但是(ii)所述队列中的最旧输入比等待时间参数旧，并且作为响应：从到所述第二时间时为止所述队列中的所述输入生成第二成批输入，使得所述第二成批输入中的输入的计数小于所述最大批大小，并且提供所述第二成批输入以供由所述第一机器学习模型处理；其中，所述计算图系统将所述第一机器学习模型在给定成批输入的处理期间的操作表示为计算图，所述计算图包括多个节点和有向边，每个节点表示相应的操作，每个有向边将相应的第一节点连接到相应的第二节点，所述相应的第二节点表示接收由所述相应的第一节点表示的操作的输出作为输入的操作；并且其中，所述方法进一步包括：维护包括所述第一队列的多个队列，其中，每个队列与来自多个机器学习模型的相应的机器学习模型对应；确定线程已变得可用于由所述多个机器学习模型中的一个机器学习模型处理成批输入；以及从所述多个机器学...

【专利技术属性】
技术研发人员：诺亚，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人