下载一种提高强化学习系统吞吐量的方法的技术资料

文档序号:38210820

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种提高强化学习系统吞吐量的方法,包括以下步骤:启动RL训练任务,协调器根据任务配置和硬件信息推导出最佳全局配置,然后启动流水线采样器、量化器和训练器;采样器进行基于组的并行流水线采样并收集一定数量的轨迹;轨迹被消息代理收集并分...
该专利属于天津大学所有,仅供学习研究参考,未经过天津大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。