汽车冲压模具工艺优化方法、装置、存储介质及服务器制造方法及图纸

技术编号:33492707 阅读:15 留言:0更新日期:2022-05-19 01:04
本发明专利技术公开了一种基于SAC算法优化智能决策模型的汽车冲压模具工艺优化方法、装置、存储介质及服务器;其中,所述方法包括:获得待优化汽车冲压模具,并将所述待优化汽车冲压模具进行数字化,获得待优化汽车冲压模具的数字化结果;将所述待优化汽车冲压模具的数字化结果输入收敛的SAC算法优化智能决策模型中,获得输出的待优化汽车冲压模具的优化决策;基于所述待优化汽车冲压模具的优化决策对待优化汽车冲压模具进行优化处理,获得优化处理结果。在本发明专利技术实施例中,能快速有效智能化地得到汽车冲压模具的工艺方案并不断提升工艺智能化水平,极大提高工艺设计效率和减少设计出错。极大提高工艺设计效率和减少设计出错。极大提高工艺设计效率和减少设计出错。

【技术实现步骤摘要】
汽车冲压模具工艺优化方法、装置、存储介质及服务器


[0001]本专利技术涉及智能决策
,尤其涉及一种基于SAC算法优化智能决策模型的汽车冲压模具工艺优化方法、装置、存储介质及服务器。

技术介绍

[0002]汽车冲压模具工艺比较复杂,在现有技术中还没有可实用的智能化方法。另外,在现有的一些其它模具的智能工艺方法,如工艺专家系统等,都还比较简单,输入较繁杂、结果离应用还有一定距离,并且需要较高的应用成本。

技术实现思路

[0003]本专利技术的目的在于克服现有技术的不足,本专利技术提供了一种基于SAC 算法优化智能决策模型的汽车冲压模具工艺优化方法、装置、存储介质及服务器,能快速有效智能化地得到汽车冲压模具的工艺方案并不断提升工艺智能化水平,极大提高工艺设计效率和减少设计出错。
[0004]为了解决上述
,本专利技术提供了一种基于SAC算法优化智能决策模型的汽车冲压模具工艺优化方法,所述方法包括:
[0005]获得待优化汽车冲压模具,并将所述待优化汽车冲压模具进行数字化,获得待优化汽车冲压模具的数字化结果;
[0006]将所述待优化汽车冲压模具的数字化结果输入收敛的SAC算法优化智能决策模型中,获得输出的待优化汽车冲压模具的优化决策;
[0007]基于所述待优化汽车冲压模具的优化决策对待优化汽车冲压模具进行优化处理,获得优化处理结果。
[0008]可选的,所述收敛的SAC算法优化智能决策模型的获得,包括:
[0009]构建智能决策模型;
[0010]基于SAC算法对所述智能决策模型进行优化处理,获得SAC算法优化智能决策模型;
[0011]获得历史汽车冲压模具,并对历史汽车冲压模具进行数字化处理,形成训练数据集;
[0012]利用所述训练数据集对所述SAC算法优化智能决策模型进行训练,直至获得收敛的SAC算法优化智能决策模型为止;
[0013]其中,所述智能决策模型为具有3个全连接层的卷积神经网络模型。
[0014]可选的,所述基于SAC算法对所述智能决策模型进行优化处理,获得 SAC算法优化智能决策模型,包括:
[0015]根据SAC算法获得最大熵,并基于所述最大熵在确保最大随机性时,确定优化的方向;
[0016]获得所述智能决策模型的第一目标值函数、状态值函数和第二目标值函数;
[0017]基于所述最大熵对所述决策模型的目标值函数、状态值函数和目标值函数进行优化处理,获得SAC算法优化智能决策模型。
[0018]可选的,所述根据SAC算法获得最大熵公式如下:
[0019][0020]H(π(
·
|S
t
))=

log(π(
·
|S
t
));
[0021]其中,π表示SAC算法的策略;π
*
表示SAC算法的最优策略;T表示时间步长;S
t
表示当时间为t时的状态;a
t
表示时间t时的选定操作;ρ
π
表示在策略下的轨迹分布π;R表示奖励函数;γ表示0到1范围内的贴现系数;α表示相对重要的信息熵系数或温度系数;H表示信息熵策略。
[0022]可选的,所述智能决策模型的目标值函数公式如下:
[0023][0024]所述智能决策模型的第一状态值函数公式如下:
[0025][0026]所述智能决策模型的第二目标值函数公式如下:
[0027][0028]其中,E表示期望函数;Q
θ
(S
t
,a
t
)表示确定其S
t
和a
t
的智能决策模型的值函数;f
φ
表示状态S
t
中动作的分布函数;π表示SAC算法的策略;S
t
表示当时间为t时的状态;a
t
表示时间t时的选定操作;ρ
π
表示在策略下的轨迹分布π;R表示奖励函数;γ表示0到1范围内的贴现系数;φ表示在输出均值和协方差的参数。
[0029]可选的,所述SAC算法优化智能决策模型的第一目标值函数公式如下:
[0030][0031]所述SAC算法优化智能决策模型的状态值函数公式如下:
[0032][0033]所述SAC算法优化智能决策模型的第二目标值函数公式如下:
[0034][0035]其中,E表示期望函数;Q
θ
(S
t
,a
t
)表示确定其S
t
和a
t
的智能决策模型的值函数,θ表示给定的参数集;f
φ
表示状态S
t
中动作的分布函数;π表示SAC 算法的策略;S
t
表示当时间为t时的状态;a
t
表示时间t时的选定操作,网络对动作进行随机采样,a~N(m,σ),m表示均值,σ表示均方差,a=m+ σε,其中∈~N(0,1),N表示高斯分布;ρ
π
表示在策略下的轨迹分布π;R表示奖励函数;γ表示0到1范围内的贴现系数;x
t
表示时间t时的动作的概率值; D表示过去经验的回放缓存。
[0036]可选的,所述利用所述训练数据集对所述SAC算法优化智能决策模型进行训练,直至获得收敛的SAC算法优化智能决策模型为止,包括:
[0037]初始化所述SAC算法优化智能决策模型中的信息熵系数或温度系数、贴现系数并
清空缓存空间;
[0038]获得所述训练数据集,将所述训练数据集输入到所述SAC算法优化智能决策模型进行训练,输出训练数据值;
[0039]将当前训练数据从环境中计算获得新的观察值、奖励值和完成信号并存储在缓存空间中;
[0040]判断所述完成信号是否为真,若否,则返回获得所述训练数据集进行重新训练;
[0041]若为真,则基于SAC算法优化智能决策模型中的第一目标值函数公式、状态值函数公式和第二目标值函数联合计算,并基于计算结果判断是否达到最大计算次数;
[0042]若达到最大计算次数,则所述SAC算法优化智能决策模型收敛,否则返回获得所述训练数据集进行重新训练。
[0043]另外,本专利技术实施例还提供了一种基于SAC算法优化智能决策模型的汽车冲压模具工艺优化装置,所述装置包括:
[0044]数字化模块:用于获得待优化汽车冲压模具,并将所述待优化汽车冲压模具进行数字化,获得待优化汽车冲压模具的数字化结果;
[0045]优化决策模块:用于将所述待优化汽车冲压模具的数字化结果输入收敛的SAC算法优化智能决策模型中,获得输出的待优化汽车冲压模具的优化决策;
[0046]优化处理模块:用于基于所述待优化汽车冲压模具的优化决策对待优化汽车冲压模具进行优化处理,获得优化处理结果。
[0047]另本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于SAC算法优化智能决策模型的汽车冲压模具工艺优化方法,其特征在于,所述方法包括:获得待优化汽车冲压模具,并将所述待优化汽车冲压模具进行数字化,获得待优化汽车冲压模具的数字化结果;将所述待优化汽车冲压模具的数字化结果输入收敛的SAC算法优化智能决策模型中,获得输出的待优化汽车冲压模具的优化决策;基于所述待优化汽车冲压模具的优化决策对待优化汽车冲压模具进行优化处理,获得优化处理结果。2.根据权利要求1所述的汽车冲压模具工艺优化方法,其特征在于,所述收敛的SAC算法优化智能决策模型的获得,包括:构建智能决策模型;基于SAC算法对所述智能决策模型进行优化处理,获得SAC算法优化智能决策模型;获得历史汽车冲压模具,并对历史汽车冲压模具进行数字化处理,形成训练数据集;利用所述训练数据集对所述SAC算法优化智能决策模型进行训练,直至获得收敛的SAC算法优化智能决策模型为止;其中,所述智能决策模型为具有3个全连接层的卷积神经网络模型。3.根据权利要求2所述的汽车冲压模具工艺优化方法,其特征在于,所述基于SAC算法对所述智能决策模型进行优化处理,获得SAC算法优化智能决策模型,包括:根据SAC算法获得最大熵,并基于所述最大熵在确保最大随机性时,确定优化的方向;获得所述智能决策模型的第一目标值函数、状态值函数和第二目标值函数;基于所述最大熵对所述决策模型的目标值函数、状态值函数和目标值函数进行优化处理,获得SAC算法优化智能决策模型。4.根据权利要求3所述的汽车冲压模具工艺优化方法,其特征在于,所述根据SAC算法获得最大熵公式如下:H(π(
·
|S
t
))=

log(π(
·
|S
t
));其中,π表示SAC算法的策略;π
*
表示SAC算法的最优策略;T表示时间步长;S
t
表示当时间为t时的状态;a
t
表示时间t时的选定操作;ρ
π
表示在策略下的轨迹分布π;R表示奖励函数;γ表示0到1范围内的贴现系数;α表示相对重要的信息熵系数或温度系数;H表示信息熵策略。5.根据权利要求3所述的汽车冲压模具工艺优化方法,其特征在于,所述智能决策模型的目标值函数公式如下:所述智能决策模型的第一状态值函数公式如下:所述智能决策模型的第二目标值函数公式如下:
其中,E表示期望函数;Q
θ
(S
t
,a
t
)表示确定其S
t
和a
t
的智能决策模型的值函数;f
φ
表示状态S
t
中动作的分布函数;π表示SAC算法的策略;S
t
表示当时间为t时的状态;a
t
表示时间t时的选定操作;ρ
π
表示在策略下的轨迹分布π;R表示奖励函数;γ表示0到1范围内的贴现系数;φ表...

【专利技术属性】
技术研发人员:高晖
申请(专利权)人:大捷智能科技广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1