下载面向分层强化学习的多元子策略生成模型的训练方法的技术资料

文档序号:39719279

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供一种面向分层强化学习的多元子策略生成模型的训练方法,方法包括:确定初始分层强化学习模型;基于所述初始分层强化学习模型选择进行强化学习时的各子策略;基于所述各子策略之间的瓦式距离,确定所述各子策略之间的子策略策略网络的第一损失;基于...
该专利属于中国人民解放军军事科学院国防科技创新研究院所有,仅供学习研究参考,未经过中国人民解放军军事科学院国防科技创新研究院授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。