System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多智能体强化学习模型的银行网点选址方法、设备技术_技高网

基于多智能体强化学习模型的银行网点选址方法、设备技术

技术编号:44931682 阅读:7 留言:0更新日期:2025-04-08 19:13
本申请实施例提供一种基于多智能体强化学习模型的银行网点选址方法、设备,方法包括:获取目标区域内多个银行网点当前时刻的位置作为状态数据;将状态数据输入到预训练的多智能体强化学习模型以对状态数据进行推理,确定多个银行网点的动作数据;根据动作数据,确定多个银行网点的选址信息。本申请的方法提高了银行网点选址的效率。

【技术实现步骤摘要】

本申请涉及人工智能领域,尤其涉及一种基于多智能体强化学习模型的银行网点选址方法、设备


技术介绍

1、银行网点作为银行对外服务的窗口,其选址直接影响到银行的盈利和发展。

2、现有技术在区域内进行银行网点选址时,通过工作人员进行实地调研以获取到相关数据,并对获取到的相关数据进行处理分析,通过人工决策的方式确定出区域内多个银行网点各自的选址。

3、通过人工进行银行网点选址的方式选址周期长,投入的时间成本高,导致选址效率低。


技术实现思路

1、本申请提供一种基于多智能体强化学习模型的银行网点选址方法、设备,从而解决银行网点选址效率低的技术问题。

2、第一方面,本申请提供一种基于多智能体强化学习模型的银行网点选址方法,包括:

3、获取目标区域内多个银行网点当前时刻的位置作为状态数据;

4、将所述状态数据输入到预训练的多智能体强化学习模型以对所述状态数据进行推理,确定所述多个银行网点的动作数据;

5、根据所述动作数据,确定所述多个银行网点的选址信息。

6、第二方面,本申请提供一种基于多智能体强化学习模型的银行网点选址装置,包括:

7、获取模块,用于获取目标区域内多个银行网点当前时刻的位置作为状态数据;

8、第一确定模块,用于将所述状态数据输入到预训练的多智能体强化学习模型对所述状态数据进行推理,确定所述多个银行网点的动作数据;

9、第二确定模块,用于根据所述动作数据,确定所述多个银行网点的选址信息。

10、第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

11、所述存储器存储计算机执行指令;

12、所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如上第一方面和/或第一方面各种可能得实施方式。

13、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上第一方面和/或第一方面各种可能得实施方式。

14、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面和/或第一方面各种可能得实施方式。

15、本申请提供的基于多智能体强化学习模型的银行网点选址方法、设备,通过获取目标区域内多个银行网点当前时刻的位置作为状态数据,将状态数据输入到预训练的多智能体强化学习模型以对状态数据进行推理,确定出多个银行网点的动作数据,并根据动作数据,确定多个银行网点的选址信息。多智能体强化学习模型的应用,使得银行网点选址实现了自动化,减少了人工决策的过程,从而提高了银行网点选址的效率。

本文档来自技高网...

【技术保护点】

1.一种基于多智能体强化学习模型的银行网点选址方法,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述动作数据包括:多个银行网点各自移动至的目标位置;

3.根据权利要求2所述的方法,其特征在于,所述多智能体强化学习模型由以下训练过程训练得到:

4.根据权利要求3所述的方法,其特征在于,所述多智能体强化学习模型包括状态空间、动作空间、奖励函数;

5.根据权利要求4所述的方法,其特征在于,所述在所述多智能体强化学习模型中输入所述多个银行网点多个历史时刻分别对应的状态数据和动作数据,以所述目标函数的值最小化为目标进行模型训练,得到训练的多智能体强化学习模型,包括:

6.根据权利要求4-5中任意一项所述的方法,其特征在于,所述每一银行网点在选址过程中当前位置以及可移动至的位置的集合,包括:

7.根据权利要求3-5中任意一项所述的方法,其特征在于,所述至少一个影响因素包括以下因素中的至少一种:人流量信息、交通信息、人均收入信息、银行客户占比信息。

8.根据权利要求3-5中任意一项所述的方法,其特征在于,所述银行网点的覆盖区域的划分规则为:

9.根据权利要求3-5中任意一项所述的方法,其特征在于,所述多智能体强化学习模型使用深度Q网络进行模型训练。

10.根据权利要求9所述的方法,其特征在于,所述深度Q网络使用损失函数评估模型的预测值与真值之间的差异,以指导模型进行参数调优。

11.一种基于多智能体强化学习模型的银行网点选址装置,包括:

12.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至10任一项所述的方法。

14.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法。

...

【技术特征摘要】

1.一种基于多智能体强化学习模型的银行网点选址方法,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述动作数据包括:多个银行网点各自移动至的目标位置;

3.根据权利要求2所述的方法,其特征在于,所述多智能体强化学习模型由以下训练过程训练得到:

4.根据权利要求3所述的方法,其特征在于,所述多智能体强化学习模型包括状态空间、动作空间、奖励函数;

5.根据权利要求4所述的方法,其特征在于,所述在所述多智能体强化学习模型中输入所述多个银行网点多个历史时刻分别对应的状态数据和动作数据,以所述目标函数的值最小化为目标进行模型训练,得到训练的多智能体强化学习模型,包括:

6.根据权利要求4-5中任意一项所述的方法,其特征在于,所述每一银行网点在选址过程中当前位置以及可移动至的位置的集合,包括:

7.根据权利要求3-5中任意一项所述的方法,其特征在于,所述至少一个影响因素包括以下因素中的至少一种:人流量信息、交...

【专利技术属性】
技术研发人员:孟铎史思潮王晓昕张堂堂
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1