当前位置: 首页 > 专利查询>国网安徽省电力有限公司滁州市城郊供电公司专利>正文

一种基于拓扑变换的元强化学习模型迁移训练方法及装置制造方法及图纸

技术编号：43627683 阅读：26 留言：0更新日期：2024-12-11 15:07

本发明专利技术公开了一种基于拓扑变换的元强化学习模型迁移训练方法及装置，涉及机器学习技术领域；获取多个区域的电力数据，构建区域数据集；将区域数据集与预设训练模型的模型数据集进行数据特征对比，根据数据特征确定预设训练模型的更新策略；将区域数据集中的数据迁移至模型数据集中，根据更新策略执行更新操作得到目标模型。通过收集多区域电力数据构建区域数据集，并与预设训练模型的模型数据集进行数据特征对比，以确定模型更新策略，迁移训练方法有效的应用在模型更新上。此方法不仅加速了训练过程，提高了模型性能，还降低了计算资源需求，从而实现了高效且经济的模型更新方式，增强了模型在电力故障定位中的适应性和准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于机器学习，具体涉及一种基于拓扑变换的元强化学习模型迁移训练方法及装置。

技术介绍

1、元强化学习模型的迁移训练方法在当前数据驱动和智能化背景下具有显著作用，通过从多个任务中学习和迁移知识，使得模型能够迅速适应新环境，优化决策过程，并在科研、工业、医疗和金融等领域可以高效的解决问题和策略优化。这种技术为模型的开发和应用提供了有力的技术支持。

2、专利cn115800272a，本专利技术提供了公开的基于拓扑识别的电网故障分析方法、系统、终端及介质；构建电网拓扑模型后，基于异常电气量的权重分析预测风险值，提取关联拓扑节点并计算其关联风险值。叠加关联风险值与预测风险值得到累积风险值，选取累积风险值与阈值差最大的节点为预测故障节点，并持续筛选直至累积风险值低于阈值。现有技术中构建的模型往往针对特定区域，模型建立后不具备适应能力，导致每个场景都需要重新构建对应的模型，使得消耗的资源增加。

技术实现思路

1、本专利技术的目的就在于解决模型建立后不具备适应能力，导致每个场景都需要重新构建对应模型的问题，而提出一种基于拓扑变换的元强化学习模型迁移训练方法及装置。

2、在本专利技术实施的第一方面，首先提出一种基于拓扑变换的元强化学习模型迁移训练方法，所述方法包括:

3、获取多个区域的电力数据，构建区域数据集；所述区域数据集包括：训练数据集，验证数据集，测试数据集；所述电力数据包括：电网拓扑结构和各种设备的电力数据；

4、将所述区域数据集与所

5、将所述区域数据集中的数据迁移至所述模型数据集中，根据所述更新策略执行更新操作得到目标模型。

6、可选的，将所述区域数据集与所述预设训练模型的模型数据集进行数据特征对比包括：

7、提取所述区域数据集与所述模型数据集的关键特征；所述关键特征包括：电网拓扑结构中的关键节点特征和设备的电力数据特征；

8、计算所述区域数据集与所述预设训练模型关键特征的绝对差值，若所述绝对差值小于预设阈值，则判定所述区域数据集与所述预设训练模型的相似度高；

9、将所述区域数据集的数据量与数据量阈值进行比对，若所述区域数据集的数据量小于数据量阈值，则判定所述区域数据集的数据量小。

10、可选的，根据所述数据特征确定所述预设训练模型的更新策略包括：

11、若所述区域数据集的数据量小并且相似度高，则确定所述预设训练模型的更新策略为第一更新模式；

12、冻结所述预设训练模型卷积层和池化层的模型参数，解冻所述预设训练模型全连接层和分类层的模型参数，将所述区域数据集的数据输入至所述预设训练模型中进行模型训练，并针对所述全连接层和所述分类层进行参数更新，得到目标模型。

13、可选的，根据所述数据特征确定所述预设训练模型的更新策略包括：

14、若所述区域数据集的数据量小并且相似度低，则确定所述预设训练模型的更新策略为第二更新模式；

15、解冻所述预设模型全连接层的模型参数，将所述区域数据集输入至所述预设训练模型中进行模型训练，并针对所述全连接层进行参数更新，得到目标模型。

16、可选的，根据所述数据特征确定所述预设训练模型的更新策略包括：

17、若所述区域数据集的数据量大并且相似度高，则确定所述预设训练模型的更新策略为第三更新模式；

18、通过逐级递增的模式解冻所述预设训练模型中各个层的模型参数，将所述区域数据集的数据输入至所述预设训练模型进行递增训练，直至所述预设训练模型中各个层的参数完成参数更新，得到目标模型。

19、可选的，根据所述数据特征确定所述预设训练模型的更新策略包括：

20、若所述区域数据集的数据量大并且相似度低，则确定所述预设训练模型的更新策略为第四更新模式；

21、针对所述预设训练模型的参数进行初始化，将所述区域数据集中的数据添加至所述预设训练模型的模型数据集中进行模型训练，更新所述预设训练模型的模型参数得到目标模型。

22、在本专利技术实施的第二方面，提出一种基于拓扑变换的元强化学习模型迁移训练装置，包括：所述装置包括：数据集构建模块、相似度对比模块和模型更新模块：

23、所述数据集构建模块，用于获取多个区域的电力数据，构建区域数据集；所述区域数据集包括：训练数据集，验证数据集，测试数据集；所述电力数据包括：电网拓扑结构和各种设备的电力数据；

24、所述相似度对比模块，用于将所述区域数据集与所述预设训练模型的模型数据集进行数据特征对比，根据所述数据特征确定所述预设训练模型的更新策略；

25、所述模型更新模块，用于将所述区域数据集中的数据迁移至所述模型数据集中，根据所述更新策略执行更新操作得到目标模型。

26、本专利技术的有益效果：

27、本专利技术提出了一种基于拓扑变换的元强化学习模型迁移训练方法，通过获取多个区域的电力数据，构建区域数据集；将区域数据集与预设训练模型的模型数据集进行数据特征对比，根据数据特征确定预设训练模型的更新策略；将区域数据集中的数据迁移至模型数据集中，根据更新策略执行更新操作得到目标模型。通过收集多区域电力数据构建区域数据集，并与预设训练模型的模型数据集进行数据特征对比，以确定模型更新策略，迁移训练方法有效的应用在模型更新上。此方法不仅加速了训练过程，提高了模型性能，还降低了计算资源需求，从而实现了高效且经济的模型更新方式，增强了模型在电力故障定位中的适应性和准确性。

本文档来自技高网...

【技术保护点】

1.一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，获取预设训练模型，所述预设训练模型用于识别目标区域的电网故障，所述方法包括:

2.根据权利要求1所述的一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，将所述区域数据集与所述预设训练模型的模型数据集进行数据特征对比包括：

3.根据权利要求2所述的一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，根据所述数据特征确定所述预设训练模型的更新策略包括：

4.根据权利要求2所述的一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，根据所述数据特征确定所述预设训练模型的更新策略包括：

5.根据权利要求2所述的一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，根据所述数据特征确定所述预设训练模型的更新策略包括：

6.根据权利要求2所述的一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，根据所述数据特征确定所述预设训练模型的更新策略包括：

7.一种基于拓扑变换的元强化学习模型迁移训练装置，其特征在于，所述装置包括：数据集构建

...

【技术特征摘要】

1.一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，获取预设训练模型，所述预设训练模型用于识别目标区域的电网故障，所述方法包括:

3.根据权利要求2所述的一种基于拓扑变换的元强化学习模型迁移训练方法，其特征在于，根据所述数据特征确定所述预设训练模型的更新策略包括：

4.根据权利要求2所述的一种基于拓扑变换的元强化学习...

【专利技术属性】
技术研发人员：胡康生，张西童，武华茂，董彩棚，丁烨，倪旭东，梁华尘，王倩倩，周智博，
申请(专利权)人：国网安徽省电力有限公司滁州市城郊供电公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人