System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能体的动作空间确定方法、装置、设备及存储介质制造方法及图纸_技高网

一种智能体的动作空间确定方法、装置、设备及存储介质制造方法及图纸

技术编号:44637366 阅读:3 留言:0更新日期:2025-03-17 18:30
本申请公开了一种智能体的动作空间确定方法、装置、设备及存储介质,涉及人工智能和机器学习领域。该方法包括:基于高分辨率视觉模型,根据采集到的目标物体的时序图片,确定目标物体的目标高分辨率视觉特征;基于全局视觉模型,根据时序图片,确定目标物体的目标全局视觉特征;分别对初始噪声、初始扩散步长和目标智能体的历史时序动作序列进行预处理,得到目标噪声变量、目标扩散步长和目标时序动作序列;基于多模态扩散模型和决策扩散模型,根据目标高分辨率视觉特征、目标噪声变量、目标全局视觉特征、目标扩散步长和目标时序动作序列,确定目标智能体的目标动作空间。上述技术特征,有助于提高确定动作空间的准确性和可靠性。

【技术实现步骤摘要】

本申请实施例涉及计算机,尤其涉及人工智能和机器学习,具体涉及一种智能体的动作空间确定方法、装置、设备及存储介质


技术介绍

1、在自动驾驶、机器人导航和智能监控等领域,端到端的感知决策模型被广泛应用。这些模型通常包括视觉感知模块和动作空间生成模块,通过紧密的集成实现对环境的高效感知和智能决策。

2、对于视觉感知模块,目前主流方法使用简单的resnet(residual network,残差网络)架构来提取视觉感知信息,resnet虽然在图像分类任务中表现良好,但其缺乏对图像的空间感知,无法提供足够精细和丰富的视觉信息;对于感知和决策的融合,视觉感知模块未能有效地引导决策专家,导致决策专家的感知能力不足。这种不足使得系统无法对当前的视觉环境进行准确感知,从而无法做出准确的决策。


技术实现思路

1、本申请提供了一种智能体的动作空间确定方法、装置、设备及存储介质,以提高确定动作空间的准确性和可靠性。

2、根据本申请的一方面,提供了一种智能体的动作空间确定方法,该方法包括:

3、基于高分辨率视觉模型,根据采集到的目标物体的时序图片,确定所述目标物体的目标高分辨率视觉特征;

4、基于全局视觉模型,根据所述时序图片,确定所述目标物体的目标全局视觉特征;

5、分别对初始噪声、初始扩散步长和目标智能体的历史时序动作序列进行预处理,得到目标噪声变量、目标扩散步长和目标时序动作序列;

6、基于多模态扩散模型和决策扩散模型,根据所述目标高分辨率视觉特征、所述目标噪声变量、所述目标全局视觉特征、所述目标扩散步长和所述目标时序动作序列,确定所述目标智能体的目标动作空间。

7、根据本申请的另一方面,提供了一种智能体的动作空间确定装置,该装置包括:

8、第一特征确定模块,用于基于高分辨率视觉模型,根据采集到的目标物体的时序图片,确定所述目标物体的目标高分辨率视觉特征;

9、第二特征确定模块,用于基于全局视觉模型,根据所述时序图片,确定所述目标物体的目标全局视觉特征;

10、数据预处理模块,用于分别对初始噪声、初始扩散步长和目标智能体的历史时序动作序列进行预处理,得到目标噪声变量、目标扩散步长和目标时序动作序列;

11、动作空间确定模块,用于基于多模态扩散模型和决策扩散模型,根据所述目标高分辨率视觉特征、所述目标噪声变量、所述目标全局视觉特征、所述目标扩散步长和所述目标时序动作序列,确定所述目标智能体的目标动作空间。

12、根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:

13、一个或多个处理器;

14、存储器,用于存储一个或多个程序;

15、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请实施例所提供的任意一种智能体的动作空间确定方法。

16、根据本申请的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请实施例所提供的任意一种智能体的动作空间确定方法。

17、根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本申请实施例所提供的任意一种智能体的动作空间确定方法。

18、本申请通过基于高分辨率视觉模型,根据采集到的目标物体的时序图片,确定目标物体的目标高分辨率视觉特征;基于全局视觉模型,根据时序图片,确定目标物体的目标全局视觉特征;分别对初始噪声、初始扩散步长和目标智能体的历史时序动作序列进行预处理,得到目标噪声变量、目标扩散步长和目标时序动作序列;基于多模态扩散模型和决策扩散模型,根据目标高分辨率视觉特征、目标噪声变量、目标全局视觉特征、目标扩散步长和目标时序动作序列,确定目标智能体的目标动作空间。上述技术特征,通过引入高分辨率视觉模型,可以提供更高精度和细致的视觉信息,有助于提高确定动作空间的准确性和可靠性。

本文档来自技高网...

【技术保护点】

1.一种智能体的动作空间确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述高分辨率视觉模型包括目标检测模型、语义分割模型和图像分类模型;相应的,所述基于高分辨率视觉模型,根据采集到的目标物体的时序图片,确定所述目标物体的目标高分辨率视觉特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述位置视觉特征、所述像素视觉特征和所述类别视觉特征,确定所述目标物体的目标高分辨率视觉特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于全局视觉模型,根据所述时序图片,确定所述目标物体的目标全局视觉特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于多模态扩散模型和决策扩散模型,根据所述目标高分辨率视觉特征、所述目标噪声变量、所述目标全局视觉特征、所述目标扩散步长和所述目标时序动作序列,确定所述目标智能体的目标动作空间,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于多模态扩散模型和决策扩散模型,根据所述目标高分辨率视觉特征、所述目标噪声变量和所述条件特征,确定所述目标智能体的目标动作空间,包括:

7.一种智能体的动作空间确定装置,其特征在于,包括:

8.一种电子设备,其特征在于,包括:

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一项所述的智能体的动作空间确定方法。

10.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的智能体的动作空间确定方法。

...

【技术特征摘要】

1.一种智能体的动作空间确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述高分辨率视觉模型包括目标检测模型、语义分割模型和图像分类模型;相应的,所述基于高分辨率视觉模型,根据采集到的目标物体的时序图片,确定所述目标物体的目标高分辨率视觉特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述位置视觉特征、所述像素视觉特征和所述类别视觉特征,确定所述目标物体的目标高分辨率视觉特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于全局视觉模型,根据所述时序图片,确定所述目标物体的目标全局视觉特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于多模态扩散模型和决策扩散模型,根据所述目标高分辨率视觉特征、所述目标噪声...

【专利技术属性】
技术研发人员:王琛胡苇徐慧丽杨子煜
申请(专利权)人:上海智位机器人股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1