System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及一种用于机器学习系统的迁移学习方法,并且具体地涉及一种包括多个机器学习代理的系统,该多个机器学习代理各自包括用于对相应现有机器学习场景进行建模的经训练的机器学习模型。本专利技术的各方面涉及迁移学习方法、计算设备和非暂态计算机可读存储介质。
技术介绍
1、存在其中包括多个不同设备的系统可针对相应场景执行相应机器学习任务的各种上下文。在一个例示性示例中,多个房屋可各自包括用于监测房屋附近的区域的安全相机。具体地,此类相机可包括机器学习(ml)或人工智能(ai)模型,以执行由相机监测的图像的图像处理。此类ml模型可被训练以在各种不同情况下识别某些特征,例如从不同角度识别个体或者当他们的面部被部分覆盖时,例如当穿着连帽上衣时。
2、训练ml模型以表现出此类功能通常需要相对大量的训练数据来教导ml模型在许多不同情况下识别特征。此类训练数据可能不是容易或立即可用的,并且因此训练ml模型可能花费相对长的时间。此外,实现ml模型的设备的计算要求可能需要是相对大的以便以这种方式训练ml模型。
3、在包括多个设备的系统中,与这些设备中的一个设备相关联的经训练的模型可与这些设备中的另一个设备共享,以便增加训练过程的效率。然而,可能需要系统的不同设备来执行不同机器学习任务并且/或者其中一个设备要执行机器学习任务的上下文可能不同于系统的另一个设备的上下文,即,可能需要系统的每个设备借助于ml模型来对不同场景进行建模。
4、这意味着,虽然可能存在相似性,但是被训练以对与一个设备相关联的特定场景进行建模的该一个设
5、现有系统可能因此遭受以下缺点:用于由设备的网络实现的ml模型以及用于对不同场景进行建模的训练过程可能是低效和次优中的一者或两者。
6、本公开就是在这种背景下提出的。
技术实现思路
1、根据本公开的一个方面,提供了一种用于系统的迁移学习方法。该系统包括多个现有代理,该多个现有代理各自包括用于对相应现有机器学习场景进行建模的经训练的机器学习模型,并且包括不同于现有代理的新代理。该系统包括数据库,该数据库包括:多个可用机器学习模型,该多个可用机器学习模型用于对机器学习场景进行建模并且包括多个经训练的机器学习模型;现有场景元数据,该现有场景元数据指示该现有机器学习场景的一个或多个特征;和迁移学习数据,该迁移学习数据指示该经训练的机器学习模型的与该现有机器学习场景的相应特征相关联的部分。该方法由在一个或多个计算机处理器上实现的该新代理执行,并且包括:接收指示要由该新代理建模的新机器学习场景的一个或多个特征的新场景元数据;以及接收用于训练机器学习模型以对该新机器学习场景进行建模的新场景训练数据。该方法包括:查询该数据库以选择该可用机器学习模型中的一个可用机器学习模型以由该新代理用来对该新机器学习场景进行建模,该选择基于接收到的新场景元数据和该现有场景元数据;以及查询该数据库以选择该迁移学习数据中的至少一些以由该新代理用来训练选择的机器学习模型,该选择基于该接收到的新场景元数据和该现有场景元数据。该方法使用接收到的新场景训练数据和使用选择的迁移学习数据来训练该选择的机器学习模型。
2、在一些示例中,查询该数据库以选择该可用机器学习模型中的一个可用机器学习模型可包括:将该新场景元数据传输到该数据库,并且作为响应,从该数据库接收该选择的机器学习模型;以及/或者从该数据库接收该多个可用机器学习模型和现有场景元数据,并且将该新场景元数据与该现有场景元数据进行比较以选择该可用机器学习模型中的一个可用机器学习模型。
3、在一些示例中,查询该数据库以选择该迁移学习数据中的至少一些包括:将该新场景元数据传输到该数据库,并且作为响应,从该数据库接收该选择的迁移学习数据;以及/或者从该数据库接收该迁移学习数据和现有场景元数据,并且将该新场景元数据与该现有场景元数据进行比较以选择该迁移学习数据中的至少一些。
4、该数据库可包括将该现有场景元数据链接到该可用机器学习模型的图结构。可将该新场景元数据与该图结构进行比较,以选择该可用机器学习模型中的一个可用机器学习模型。
5、该图结构可包括:多个节点,该多个节点各自表示与现有场景相关联的实体;和多个边缘,该多个边缘链接实体对并且表示该现有场景的特征。可通过该新场景元数据的特征与由相应边缘表示的特征的比较来将该新场景元数据与该节点中的一个或多个节点相关联,以便选择该可用机器学习模型中的一个可用机器学习模型。
6、每个实体可以是以下中的至少一者:该可用机器学习模型中的一个可用机器学习模型;和与该现有场景中的一个现有场景相关联的数据源。
7、该迁移学习数据可包括数据子集,该数据子集各自与该现有场景的相应事件相关联。在一些示例中,选择该迁移学习数据中的至少一些可包括基于该现有场景的特征与该新场景的特征之间的比较来选择该数据子集中的一个或多个数据子集。
8、每个数据子集可包括以下中的至少一者:与该相应事件相关联的该经训练的机器学习模型的超参数;与该相应事件相关联的该经训练的机器学习模型的神经网络权重;和用于训练该经训练的机器学习模型并且与该相应事件相关联的训练数据。
9、该系统可在包括多个边缘计算设备和至少一个基于云的计算设备的通信网络中实现。该多个现有代理和该新代理中的每一者可在相应边缘计算设备中实现,并且该数据库可在该至少一个基于云的计算设备中实现。
10、根据本公开的另一个方面,提供了一种用于系统的迁移学习方法,该系统包括多个代理,该多个代理各自在一个或多个计算机处理器上实现,并且各自包括用于对相应机器学习场景进行建模的经训练的机器学习模型。该方法由该多个代理中的第一代理执行,并且包括接收不同于先前训练数据的新训练数据,该先前训练数据用于训练由该第一代理当前部署的该经训练的机器学习模型。该方法包括:使用至少接收到的新训练数据重新训练当前部署的机器学习模型;将经重新训练的机器学习模型与该当前部署的机器学习模型进行比较以确定是否部署该重新训练的机器学习模型。如果确定部署该经重新训练的机器学习模型,则该方法还包括:识别迁移学习数据,该迁移学习数据是与该经重新训练的机器学习模型相关联的数据,该经重新训练的机器学习模型不与该当前部署的机器学习模型相关联;以及将识别出的迁移学习数据传输到该系统的数据库。该数据库能够由该多个代理中的不同于该第一代理的第二代理访问,以检索传输的数据,用于重新训练该第二代理的相应经训练的机器学习模型。
11、在一些示例中,本文档来自技高网...
【技术保护点】
1.一种用于系统的迁移学习方法,
2.根据权利要求1所述的方法,其中查询所述数据库以选择所述可用机器学习模型中的一个可用机器学习模型包括:
3.根据权利要求1或权利要求2所述的方法,其中查询所述数据库以选择所述迁移学习数据中的至少一些包括:
4.根据任一前述权利要求所述的方法,其中所述数据库包括将所述现有场景元数据链接到所述可用机器学习模型的图结构,并且其中将所述新场景元数据与所述图结构进行比较以选择所述可用机器学习模型中的一个可用机器学习模型。
5.根据权利要求4所述的方法,其中所述图结构包括:
6.根据权利要求5所述的方法,其中每个实体是以下中的至少一者:
7.根据任一前述权利要求所述的方法,其中所述迁移学习数据包括数据子集,所述数据子集各自与所述现有场景的相应事件相关联,并且其中选择所述迁移学习数据中的至少一些包括基于所述现有场景的特征与所述新场景的特征之间的比较来选择所述数据子集中的一个或多个数据子集。
8.根据权利要求7所述的方法,其中每个数据子集包括以下中的至少一者:
9.
10.一种用于系统的迁移学习方法,所述系统包括多个代理,所述多个代理各自在一个或多个计算机处理器上实现并且各自包括用于对相应机器学习场景进行建模的经训练的机器学习模型,所述方法由所述多个代理中的第一代理执行并且包括以下步骤:
11.根据权利要求10所述的方法,其中比较所述经重新训练的机器学习模型和所述当前部署的机器学习模型包括确定指示所述经重新训练的模型的性能的一个或多个度量,并且与所述当前部署的模型的对应度量进行比较。
12.根据权利要求10或权利要求11所述的方法,其中识别迁移学习数据包括识别所接收的新训练数据中不同于所述先前训练数据的数据,并且其中如果识别出的不同数据与所述先前训练数据之间的差异大于规定阈值,则所述识别出的不同数据被识别为迁移学习数据。
13.根据权利要求10至12中任一项所述的方法,其中识别迁移学习数据包括识别所述经重新训练的机器学习模型的模型权重,所述模型权重不同于所述当前部署的机器学习模型的对应模型权重,并且其中如果由重新训练引起的所识别的模型权重的变化大于规定阈值,则所识别的模型权重被识别为迁移学习数据。
14.根据权利要求10至13中任一项所述的方法,所述方法包括将场景元数据连同所识别的迁移学习数据一起传输到所述数据库,所述场景元数据指示由与所识别的迁移学习数据相关联的所述第一代理建模的所述机器学习场景的特征。
15.根据权利要求10至14中任一项所述的方法,其中重新训练所述经训练的机器学习模型包括使用所述先前训练数据中的至少一些。
16.一种用于系统的迁移学习方法,所述系统包括多个代理,所述多个代理各自在一个或多个计算机处理器上实现,并且各自包括用于对相应机器学习场景进行建模的经训练的机器学习模型,所述方法由所述多个代理中的第一代理执行并且包括以下步骤:
17.根据权利要求16所述的方法,其中所获得的迁移学习数据是新训练数据,所述新训练数据不同于用于训练所述当前部署的机器学习模型的先前训练数据,并且其中更新所述经训练的机器学习模型包括重新训练所述经训练的机器学习模型以获得所述经更新的机器学习模型。
18.根据权利要求17所述的方法,其中重新训练所述经训练的机器学习模型包括使用用于训练所述当前部署的机器学习模型的所述先前训练数据中的至少一些。
19.根据权利要求16至18中任一项所述的方法,其中所述获得的迁移学习数据是所述机器学习模型的一个或多个经更新的参数,所述一个或多个经更新的参数不同于所述当前部署的机器学习模型的对应参数,并且其中更新所述经训练的机器学习模型包括用对应接收到的经更新的参数替换所述经训练的机器学习模型中的一个或多个参数。
20.根据权利要求16至19中任一项所述的方法,其中比较所述经更新的机器学习模型和所述当前部署的机器学习模型包括确定指示所述经更新的模型的性能的一个或多个度量,并且与所述当前部署的模型的对应度量进行比较。
21.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质在其上存储有指令,所述指令在由一个或多个计算机处理器执行时使得所述计算机处理器执行根据任一前述权利要求所述的方法。
22.一种计算设...
【技术特征摘要】
【国外来华专利技术】
1.一种用于系统的迁移学习方法,
2.根据权利要求1所述的方法,其中查询所述数据库以选择所述可用机器学习模型中的一个可用机器学习模型包括:
3.根据权利要求1或权利要求2所述的方法,其中查询所述数据库以选择所述迁移学习数据中的至少一些包括:
4.根据任一前述权利要求所述的方法,其中所述数据库包括将所述现有场景元数据链接到所述可用机器学习模型的图结构,并且其中将所述新场景元数据与所述图结构进行比较以选择所述可用机器学习模型中的一个可用机器学习模型。
5.根据权利要求4所述的方法,其中所述图结构包括:
6.根据权利要求5所述的方法,其中每个实体是以下中的至少一者:
7.根据任一前述权利要求所述的方法,其中所述迁移学习数据包括数据子集,所述数据子集各自与所述现有场景的相应事件相关联,并且其中选择所述迁移学习数据中的至少一些包括基于所述现有场景的特征与所述新场景的特征之间的比较来选择所述数据子集中的一个或多个数据子集。
8.根据权利要求7所述的方法,其中每个数据子集包括以下中的至少一者:
9.根据任一前述权利要求所述的方法,其中所述系统在包括多个边缘计算设备和至少一个基于云的计算设备的通信网络中实现,其中所述多个现有代理和所述新代理中的每一者在相应边缘计算设备中实现并且所述数据库在所述至少一个基于云的计算设备中实现。
10.一种用于系统的迁移学习方法,所述系统包括多个代理,所述多个代理各自在一个或多个计算机处理器上实现并且各自包括用于对相应机器学习场景进行建模的经训练的机器学习模型,所述方法由所述多个代理中的第一代理执行并且包括以下步骤:
11.根据权利要求10所述的方法,其中比较所述经重新训练的机器学习模型和所述当前部署的机器学习模型包括确定指示所述经重新训练的模型的性能的一个或多个度量,并且与所述当前部署的模型的对应度量进行比较。
12.根据权利要求10或权利要求11所述的方法,其中识别迁移学习数据包括识别所接收的新训练数据中不同于所述先前训练数据的数据,并且其中如果识别出的不同数据与所述先前训练数据之间的差异大于规定阈值,则所述识别出的不同数据被识别为迁移学习数据。
13.根据权利要求10至12中任一项所述的方法,其中识别迁移学习数据包括识别所述经重新训练的机器学习模...
【专利技术属性】
技术研发人员:T·马雷罗,C·克拉克,A·博泰亚,C·布希尼,S·曼达尔,
申请(专利权)人:伊顿智能动力有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。