一种权重数据处理方法、系统、设备及可读存储介质技术方案

技术编号：39138467 阅读：8 留言：0更新日期：2023-10-23 14:53

本申请提供了一种权重数据处理方法、系统、设备及可读存储介质，该方法应用于学习引擎，首先获取目标样本数据；响应于接收目标采样请求，根据目标采样策略对目标样本数据进行采样，获得已采样数据，利用已采样数据构成待训练数据组，待训练数据组中包括多个已采样数据，再基于待训练数据组中的多个已采样数据分别进行机器学习模型的多次权重更新迭代，获得每次权重更新迭代后的模型权重数据，在获得每次权重更新迭代后的模型权重数据之后，若接收到推送请求，通过权重订阅接口将模型权重数据推送至预测推断引擎。如此，可以对于每次更新迭代后的需要进行推送的数据，推送至预测推断引擎，提高了模型权重数据的更新效率和推送效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
一种权重数据处理方法、系统、设备及可读存储介质

[0001]本申请涉及机器学习
，尤其涉及一种权重数据处理方法、系统、设备及可读存储介质。

技术介绍

[0002]大规模分布式持续学习引擎(以下简称：持续学习引擎)主要负责采样经验回放以及迭代模型，并实时将新的模型权重推送到对应的预测推断引擎。持续学习引擎分为三个模块，分别是经验回放中转站模块Replay Buffer，模型迭代模块和和模型权重推送模块。
[0003]现有技术中，Replay Buffer是持续学习引擎存放经验回放数据的中转站，Replay Buffer没有独立的资源分配，需要和持续学习引擎的工作节点共享资源，而Replay Buffer中保存着大量的经验回放数据，并且在模型权重推送模块进行更新和推送时效率较低。

技术实现思路

[0004]有鉴于此，本申请提供了一种权重数据处理方法、系统、设备及可读存储介质，提高了模型权重推送模块进行权重更新并推送的效率。
[0005]第一方面，本申请提供了一种权重数据处理方法，所述方法应用于学习引擎，所述学习引擎和预测推断引擎之间配置有权重订阅接口，所述方法包括：
[0006]获取目标样本数据；
[0007]响应于接收目标采样请求，根据目标采样策略对所述目标样本数据进行采样，获得已采样数据；
[0008]利用所述已采样数据构成待训练数据组，所述待训练数据组中包括多个所述已采样数据；
[0009]基于所述待训练数据组中的多个所述已采样数据分别进行机器学...

【技术保护点】

【技术特征摘要】
1.一种权重数据处理方法，其特征在于，所述方法应用于学习引擎，所述学习引擎和预测推断引擎之间配置有权重订阅接口，所述方法包括：获取目标样本数据；响应于接收目标采样请求，根据目标采样策略对所述目标样本数据进行采样，获得已采样数据；利用所述已采样数据构成待训练数据组，所述待训练数据组中包括多个所述已采样数据；基于所述待训练数据组中的多个所述已采样数据分别进行机器学习模型的多次权重更新迭代，获得每次权重更新迭代后的模型权重数据；在所述获得每次权重更新迭代后的模型权重数据之后，若接收到推送请求，通过所述权重订阅接口将所述模型权重数据推送至所述预测推断引擎。2.根据权利要求1所述的方法，其特征在于，所述获取目标样本数据，包括：采集目标环境中的状态数据、目标环境中的动作数据和目标环境中的奖励点数据；基于所述目标环境中的状态数据、所述目标环境中的动作数据和所述目标环境中的奖励点数据生成待切分样本数据；按照预设的数据切分规则，将所述待切分样本数据切分为所述目标样本数据。3.根据权利要求1所述的方法，其特征在于，所述响应于接收目标采样请求，根据目标采样策略对所述目标样本数据进行采样，获得已采样数据，包括：获取所述目标样本的样本生成时间和所述目标采样请求的接收时间；计算所述目标样本的样本生成时间和所述目标采样请求的接收时间之间的时间差值；基于所述时间差值从小到大对所述目标样本进行采样排序；基于所述采样排序对所述目标样本进行采样。4.根据权利要求1所述的方法，其特征在于，所述权重更新迭代过程为：获取所述机器学习模型中的初始权重；利用模型迭代模块学习预设待训练数据组，获取所述预设待训练数据组对应的更新后的模型权重数据。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：基于连续内存存储机制将所述已采样数据存储至预设内存空间中。6.一种权重数据处理系统，其特征在于，所述系统应用于学习引擎，所述学习引擎和所述预测推断引擎之间配置有权重订阅接口，所述...

【专利技术属性】
技术研发人员：袁泉，龙海涛，黄安付，
申请(专利权)人：启元世界深圳科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人