一种基于强化学习的飞机机翼梁截面多目标优化设计方法技术

技术编号：43819039 阅读：25 留言：0更新日期：2024-12-27 13:31

本发明专利技术公开了一种基于强化学习的飞机机翼梁截面多目标优化设计方法，包括空间定义、梁结构虚拟环境搭建和智能优化设计，具体包括步骤S1确定状态空间、步骤S2确定动作空间、步骤S3设定设计评价值函数、步骤S4搭建梁结构虚拟环境、步骤S5建立梁结构智能设计体、步骤S6训练梁结构智能设计体、步骤S7用梁结构智能设计体进行优化设计以及步骤S8检验设计方案是否合理可行；通过采用强化学习的飞机机翼梁结构多目标优化设计方法，可以实现多目标优化，并且可以储存设计经验，今后可在此基础上进一步拓宽设计空间，提高设计效率。此外，本发明专利技术通过简单改进可以用于其他类型梁结构的设计，具有广泛的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于飞机结构领域，具体而言，涉及一种基于强化学习的飞机机翼梁截面多目标优化设计方法。

技术介绍

1、飞机结构设计是航空领域的核心技术之一，而梁是飞机的主承力结构，其中悬臂梁结构广泛应用于飞机机翼上，其设计质量关系到飞机的性能、安全和经济效益等诸多方面。在梁结构设计中，梁截面的设计十分关键，它关系到梁的力学性能和重量。

2、传统的飞机结构设计方法主要基于经验和试错的方法，这种方法耗时且费力，设计效率低下，很难保证设计结果最优。传统优化算法也存在迁移性差、对不同设计需求需要重新迭代优化的缺点。而飞机设计是一个需要综合各学科多种需求并反复迭代优化的过程，这将使得传统优化所需的时间达到项目难以接受的程度，因此亟须一种结构快速设计方法。

3、近年来，强化学习作为一种新的智能算法，因其可以在不确定性的环境中自主学习和优化，在机器学习领域得到了广泛的应用，强化学习通过试错学习和反馈机制，不断改进设计，可以有效提高设计效率和设计质量。

技术实现思路

1、针对以上缺陷，本专利技术提供了一种基于强化学习的飞机机翼梁截面多目标优化设计方法，包括空间定义、梁结构虚拟环境搭建和智能优化设计，具体包括以下步骤：

2、s1、根据梁截面的参数构成一个状态向量，完成状态空间的定义；

3、s2、根据状态空间中的构成参数定义具体动作，完成动作空间的定义；

4、s3、根据设定的梁截面评价指标来设定设计评价值函数；

5、s4、基于状态空间的定

6、s5、创建一个理解状态和动作之间关系的梁结构智能设计体，用于在虚拟环境中学习和优化；

7、s6、对梁结构智能设计体进行训练，用于预测不同状态和动作结果；

8、s7、使用训练后的梁结构智能设计体在虚拟环境中进行优化设计，生成新的设计方案；

9、s8、对步骤s7生成的设计方案根据实际情况进行评估，检验是否可行。

10、进一步地，所述步骤s1中的参数包括但不限于梁截面的宽度、高度、缘条厚度、腹板厚度、形状和长度。

11、进一步地，所述步骤s3中的设计评价值函数如下：

12、；

13、上述式中， r为设计评价值函数， σ为结构最大应力， σ s为材料屈服强度，c为一个固定的惩罚值， a为截面面积，k为大于0的固定系数，当设计值超越了设计边界值，便不对设计进行评价，直接给予一个固定的惩罚值c即可。

14、进一步地，根据所述步骤s3中设计评价值函数分别计算出设计更改前后的评价值 r和 r_，并计算当前动作的奖励值 reward：

15、；

16、将更新后的状态 s_和奖励值 reward反馈给梁结构智能设计体。

17、进一步地，所述步骤s5具体包括以下步骤：

18、s5.1、建立所有状态 s下每个设计动作 a的设计动作评价值表；

19、s5.2、建立动作选择函数：

20、通过随机方法选择评价值最高的设计动作或一个随机设计动作；

21、s5.3、建立根据当前设计状态 s、设计动作 a、新设计状态 s_及奖励值 reward的设计动作评价值表更新方法：

22、；

23、上述式中，为减缩因子， lr为学习率。

24、进一步地，所述步骤s6具体包括以下步骤：

25、s6.1、设定步骤s1中梁截面的最大宽度、最大高度、最大缘条厚度、最大腹板厚度以及梁长度、材料屈服强度以及加载条件，并设置训练次数和单次训练步数；

26、s6.2、在每次训练开始时，随机生成初始的设计状态；

27、s6.3、使用梁结构智能设计体生成当前设计状态下的设计动作；

28、s6.4、将当前设计状态以及做出的设计动作传递到步骤s4中搭建的梁虚拟环境，获得更新后的新设计状态以及对新设计状态的评价值；

29、s6.5、根据步骤s5.3中的设计动作评价值表更新方法更新设计动作评价值表；

30、s6.6、将更新后的设计状态设为当前设计状态；

31、s6.7、重复步骤s6.3-步骤s6.6步骤直至达到设定的单次训练步数；

32、s6.8、重复步骤s6.2-步骤s6.7步骤进行训练，直至达到设定的训练次数；

33、s6.9、保存设计动作评价值表。

34、进一步地，所述步骤s7具体包括以下步骤：

35、s7.1、载入步骤s6.9中训练完成后的设计动作评价值表，设定设计尝试次数和每次设计尝试中的设计步数；

36、s7.2、随机生成初始设计状态；

37、s7.3、使用梁结构智能设计体生成设计更改动作；

38、s7.4、将当前设计状态以及做出的设计动作传递到梁虚拟环境，获得更新后的设计状态以及对新设计状态的评价值；

39、s7.5、将更新后的状态设为当前状态；

40、s7.6、重复步骤s7.3-步骤s7.5直到达到单次设计步数；

41、s7.7、重复步骤s7.2-步骤s7.6进行训练，直至达到设定的设计尝试次数；

42、s7.8、输出评价值最高的设计。

43、本专利技术与现有技术相比具有以下有益效果：

44、通过采用强化学习的飞机机翼梁结构多目标优化设计方法，可以实现多目标优化，并且可以储存设计经验，今后可在此基础上进一步拓宽设计空间，提高设计效率。此外，本专利技术通过简单改进可以用于其他类型梁结构的设计，具有广泛的应用价值。

本文档来自技高网...

【技术保护点】

1.一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：包括空间定义、梁结构虚拟环境搭建和智能优化设计，具体包括以下步骤：

2.如权利要求1所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：所述步骤S1中的参数包括但不限于梁截面的宽度、高度、缘条厚度、腹板厚度、形状和长度。

3.如权利要求1所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：所述步骤S3中的设计评价值函数如下：

4.如权利要求3所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：根据所述步骤S3中设计评价值函数分别计算出设计更改前后的评价值r和r_，并计算当前动作的奖励值reward：

5.如权利要求1所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：所述步骤S5具体包括以下步骤：

6.如权利要求5所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：所述步骤S6具体包括以下步骤：

7.如权利要求1所述的一种基于强化学习的飞机机翼梁截面多目

...

【技术特征摘要】

1.一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：包括空间定义、梁结构虚拟环境搭建和智能优化设计，具体包括以下步骤：

2.如权利要求1所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：所述步骤s1中的参数包括但不限于梁截面的宽度、高度、缘条厚度、腹板厚度、形状和长度。

3.如权利要求1所述的一种基于强化学习的飞机机翼梁截面多目标优化设计方法，其特征在于：所述步骤s3中的设计评价值函数如下：

4.如权利要求3所述的一种基于强化学习的飞机机翼梁截面多目...

【专利技术属性】
技术研发人员：丁梦龙，孟莉，冯传宴，宣金婷，汪雯，李海，任子杰，李道春，周尧明，屠展，
申请(专利权)人：天目山实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人