人工智能模型分布式处理系统及其操作方法技术方案

技术编号:37997831 阅读:11 留言:0更新日期:2023-06-30 10:11
提供了一种由第一电子装置对人工智能模型执行分布式处理的方法。该方法包括:获得将被用于执行人工智能模型分布式处理的第二电子装置的性能信息;获得从人工智能模型分割出的多个分割模型;基于所述性能信息来预测用于由第二电子装置处理所述多个分割模型中的每个分割模型所需的处理时间;基于所预测的处理时间,从所述多个分割模型中确定将请求利用第二电子装置进行处理的至少一个分割模型,并且请求第二电子装置处理所述至少一个分割模型。请求第二电子装置处理所述至少一个分割模型。请求第二电子装置处理所述至少一个分割模型。

【技术实现步骤摘要】
【国外来华专利技术】人工智能模型分布式处理系统及其操作方法


[0001]本公开涉及一种用于通过使用多个装置对人工智能模型执行分布式处理的系统及其操作方法。

技术介绍

[0002]根据设备上人工智能(AI)技术,可基于电子装置中提供的AI模型来处理各种数据,而无需与云服务器进行数据收发。例如,电子装置可通过使用包括在电子装置中的AI模型和电子装置的硬件配置来实时执行各种操作,而不需要使用云服务器。因此,根据设备上AI技术,在电子装置中收集的用户相关数据不被发送到外部,而是被电子装置本身操作,因此,在保护用户个人信息和数据处理速度方面存在优点。
[0003]然而,当根据设备上AI技术在电子装置内处理AI模型时,存在处理性能受电子装置中提供的硬件限制的缺点。
[0004]因此,需要一种处理AI模型的方法,其中可最小化由于电子装置的硬件引起的处理性能的限制,同时在保护用户个人信息和数据处理速度方面保持设备上AI技术的优点。

技术实现思路

[0005]技术问题
[0006]本公开旨在解决上述问题,并且提供一种用于对人工智能(AI)模型执行分布式处理的系统。
[0007]此外,本公开提供了一种计算机可读记录介质,其上记录有用于在计算机上执行该方法的程序。要实现的技术目的不限于上述技术目的,并且可存在其他技术目的。
[0008]技术方案
[0009]根据本公开的一个方面,提供了一种由第一电子装置对人工智能模型执行分布式处理的方法。该方法可包括:获得用于对所述人工智能模型执行分布式处理的第二电子装置的性能信息;通过对所述人工智能模型进行分割来获得多个分割模型;基于所述性能信息来估计关于将由所述第二电子装置处理的所述多个分割模型中的每个分割模型的处理时间;基于所估计的处理时间,从所述多个分割模型中确定所述第二电子装置被请求处理的至少一个分割模型;以及通过向所述第二电子装置请求处理所确定的至少一个分割模型,对所述人工智能模型执行分布式处理。
[0010]所述多个分割模型可通过基于所述性能信息对所述人工智能模型进行分割来获得。
[0011]获得所述多个分割模型的步骤可包括:将包括在所述人工智能模型中的多个层中的至少一个层识别为用于分割的层;以及获得所述多个分割模型,其中,每个分割模型包括所识别的层作为输出层。
[0012]可基于从每个层输出的数据的大小、所述第一电子装置与所述第二电子装置之间的数据速率、层是否可被第二电子装置以加速方式处理中的至少一个来识别用于对人工智
能模型进行分割的层。
[0013]用于由第一电子装置对人工智能模型执行分布式处理的所述方法还可包括:从所述第二电子装置接收所述至少一个分割模型的处理结果,以及基于所述处理结果中包括的关于所述第二电子装置处理所述至少一个分割模型的时间的信息来更新所述第二电子装置的性能信息。
[0014]所述第一电子装置可顺序地处理包括所述第二电子装置被请求处理的至少一个分割模型的多个分割模型。
[0015]当在所述第一电子装置处理所述多个分割模型的同时从所述第二电子装置接收到处理尚未完成的分割模型的处理结果时,可基于接收到的处理结果,从所述多个分割模型中的其所述处理结果被接收的分割模型开始顺序地执行处理。
[0016]根据本公开的一方面,提供了一种由第二电子装置对人工智能模型执行分布式处理的方法。所述方法可包括:当针对通过对所述人工智能模型进行分割获得的多个分割模型,基于所述第二电子装置的处理时间确定所述第二电子装置被请求处理的至少一个分割模型时,从第一电子装置接收针对所述至少一个分割模型的处理请求,其中,所述处理时间是基于所述第二电子装置的性能信息估计的;处理所述至少一个分割模型;以及将所述至少一个分割模型的处理结果发送到所述第一电子装置,使得对所述人工智能模型执行分布式处理。
[0017]除了所述第二电子装置处理所述多个分割模型所消耗的时间之外,所述第二电子装置的处理时间还可包括:所述第二电子装置从所述第一电子装置接收针对所述至少一个分割模型的处理请求所消耗的时间,以及针对所述第一电子装置从所述第二电子装置接收所述至少一个分割模型的处理结果所消耗的时间所估计的时间。
[0018]所述第二电子装置的性能信息可包括:在所述第二电子装置中提供的硬件信息和关于与所述第二电子装置的操作处理能力相关的所述第二电子装置的状态的信息中的至少一个。
[0019]当接收到所述处理请求时,所述第二电子装置可从所述至少一个分割模型开始顺序地处理所述人工智能模型的所述多个分割模型,所述多个分割模型包括以下分割模型:针对该分割模型的处理请求未从所述第一电子装置被接收到。
[0020]当在所述第二电子装置顺序地处理所述多个分割模型的同时从所述第一电子装置接收到针对处理尚未开始的分割模型的处理请求时,可基于所述处理请求从针对其的处理请求被接收到的分割模型开始顺序地执行处理。
[0021]当从所述第一电子装置接收到针对处理结果最近被提供给所述第一电子装置的分割模型或在该分割模型之前处理的分割模型的处理请求时,第二电子装置可向所述第一电子装置重新发送最近发送到所述第一电子装置的该分割模型的处理结果。
[0022]根据本公开的一方面,提供了一种被配置为通过使用多个电子装置对人工智能模型执行分布式处理的系统。该系统包括第一电子装置和第二电子装置,其中,所述第一电子装置被配置为:获得用于对所述人工智能模型执行分布式处理的第二电子装置的性能信息,通过对所述人工智能模型进行分割来获得多个分割模型,基于所述性能信息估计关于将由所述第二电子装置处理的所述多个分割模型中的每个分割模型的处理时间,基于所估计的处理时间从所述多个分割模型中确定所述第二电子装置被请求处理的至少一个分割
模型,并且向所述第二电子装置请求处理所确定的至少一个分割模型,使得对所述人工智能模型执行分布式处理;所述第二电子装置被配置为:当针对通过对所述人工智能模型进行分割获得的多个分割模型,基于所述第二电子装置的处理时间确定所述第二电子装置被请求处理的至少一个分割模型时,从所述第一电子装置接收对所述至少一个分割模型的处理请求,处理所述至少一个分割模型,并且将所述至少一个分割模型的处理结果发送到所述第一电子装置,使得对所述人工智能模型执行分布式处理,其中,所述处理时间是基于所述第二电子装置的性能信息估计的。
[0023]根据本公开的一方面,提供了一种计算机可读记录介质,其上记录有用于执行在第一电子装置上执行分布式处理的方法的程序。所述方法可包括:获得用于对所述人工智能模型执行分布式处理的第二电子装置的性能信息;通过对所述人工智能模型进行分割来获得多个分割模型;基于所述性能信息来估计关于将由所述第二电子装置处理的所述多个分割模型中的每个分割模型的处理时间;基于所估计的处理时间,从所述多个分割模型中确定所述第二电子装置被请求处理的至少一个分割模型;以及通过向所述第二电子装置请求处理所确定的至少一个分割模型,对所述人工智能模型执行分布式处理。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由第一电子装置对人工智能模型执行分布式处理的方法,所述方法包括:获得用于对所述人工智能模型执行分布式处理的第二电子装置的性能信息;通过对所述人工智能模型进行分割来获得多个分割模型;基于所述性能信息来估计关于将由所述第二电子装置处理的所述多个分割模型中的每个分割模型的处理时间;基于所估计的处理时间,从所述多个分割模型中确定所述第二电子装置被请求处理的至少一个分割模型;以及通过向所述第二电子装置请求处理所确定的至少一个分割模型,对所述人工智能模型执行分布式处理。2.根据权利要求1所述的方法,其中,所述多个分割模型是通过基于所述性能信息对所述人工智能模型进行分割而获得的。3.根据权利要求1所述的方法,其中,获得所述多个分割模型的步骤包括:将包括在所述人工智能模型中的多个层中的至少一个层识别为用于分割的层;以及获得所述多个分割模型,其中,每个分割模型包括所识别的层作为输出层。4.根据权利要求1所述的方法,其中,所述第一电子装置顺序地处理所述多个分割模型,其中,所述多个分割模型包括所述第二电子装置被请求处理的所述至少一个分割模型。5.根据权利要求4所述的方法,其中,当在所述第一电子装置处理所述多个分割模型的同时从所述第二电子装置接收到处理尚未被完成的分割模型的处理结果时,基于接收到的处理结果,从所述多个分割模型中的其所述处理结果被接收的分割模型开始顺序地执行处理。6.一种由第二电子装置对人工智能模型执行分布式处理的方法,所述方法包括:当针对通过对所述人工智能模型进行分割获得的多个分割模型,基于所述第二电子装置的处理时间确定所述第二电子装置被请求处理的至少一个分割模型时,从第一电子装置接收针对所述至少一个分割模型的处理请求,其中,所述处理时间是基于所述第二电子装置的性能信息估计的;处理所述至少一个分割模型;以及将所述至少一个分割模型的处理结果发送到所述第一电子装置,使得对所述人工智能模型执行分布式处理。7.根据权利要求6所述的方法,其中,当接收到所述处理请求时,所述第二电子装置从所述至少一个分割模型开始顺序地处理所述人工智能模型的所述多个分割模型,其中,所述多个分割模型包括以下分割模型:针对该分割模型的处理请求未从所述第一电子装置被接收到。8.根据权利要求7所述的方法,其中,当在所述第二电子装置顺序地处理所述多个分割模型的同时从所述第一电子装置接收到针对处理尚未开始的分割模型的处理请求时,基于该处理请求从针对其的处理请求被接收到的分割模型开始顺序地执行处理。9.根据权利要求6所述的方法,其中,当从所述第一电子装置接收到针对处理结果最近被提供给所述第一电子装置的分割模型或在该分割模型之前处理的分割模型的处理请求时,向所述第一电子装置重新发送最近发送到所述第一电子装置的该分割模型的处理结果。
10.一种被配置为通过使用多个电子装置对人工智能模型执行分布式处理的系统,所述系统包括:第一电子装置,被配置为获得用于对所述人工智能模型执行分布式处理的第二电...

【专利技术属性】
技术研发人员:朴圣济
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1