System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于检索增强的电力标准问答模型训练方法及系统技术方案_技高网

基于检索增强的电力标准问答模型训练方法及系统技术方案

技术编号:42909931 阅读:5 留言:0更新日期:2024-10-11 15:41
本申请涉及机器学习技术领域,提供基于检索增强的电力标准问答模型训练方法及系统。所述方法包括:基于大数据采集电力领域数据,构建电力标准文档;构建问答数据库;训练检索模型;训练答复模型;联合优化检索与答复模型,生成联合优化结果;构建初始问答模型,回溯训练并输出电力标准问答模型。本申请解决了现有电力标准问答模型采用基于规则或模板的方法,导致缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性,进而在理解和解析文档时容易出现偏差或误解,使得回答不准确的技术问题,实现了基于输入文本的语义相似度,利用的问答模型,对电力标准知识的精准高效匹配,提高电力标准问答模型的准确性、专业性和可靠性的效果。

【技术实现步骤摘要】

本申请涉及人工智能,具体涉及机器学习,尤其涉及基于检索增强的电力标准问答模型训练方法及系统


技术介绍

1、随着电力行业的快速发展和智能化转型,电力标准问答系统在电力生产、运维和管理中发挥着越来越重要的作用。然而,现有的电力标准问答模型往往采用基于规则或模板的方法,这种方法缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性。电力标准文档通常包含大量的专业术语和复杂的技术要求,其结构和内容各异。传统的问答模型在理解和解析这些文档时,往往容易出现偏差或误解,导致回答不准确或不完整。这无法满足高效、准确获取电力标准知识的需求,影响电力系统的正常运行和维护。


技术实现思路

1、本申请通过提供了基于检索增强的电力标准问答模型训练方法及系统,旨在解决现有电力标准问答模型采用基于规则或模板的方法,导致缺乏灵活性和泛化能力,难以应对电力标准文档的复杂性和多样性,进而在理解和解析文档时容易出现偏差或误解,使得回答不准确的技术问题。

2、鉴于上述问题,本申请提供了基于检索增强的电力标准问答模型训练方法及系统。

3、本申请公开的第一个方面,提供了基于检索增强的电力标准问答模型训练方法,所述方法包括:基于大数据进行数据采集,获得电力标准文档,所述电力标准文档包含电力问题信息集、电力答案信息集、电力标准条款信息集;构建电力标准问答数据库,所述电力标准问答数据库是基于所述电力问题信息集与所述电力答案信息集进行匹配训练所获;基于所述电力标准问答数据库进行编码,训练构建电力数据答复模型;基于所述电力问题信息集、所述电力标准条款信息集进行特征提取,训练构建电力数据检索模型;对所述电力数据检索模型与所述电力数据答复模型进行联合训练优化,生成联合优化结果;构建电力标准问答初始模型,基于所述联合优化结果对所述电力标准问答初始模型进行回溯训练,基于回溯结果输出电力标准问答模型。

4、进一步,基于所述电力问题信息集与所述电力答案信息集进行匹配训练,方法包括:基于文本语句结构分别提取所述电力问题信息集的问题关键词,提取所述电力答案信息集的答案关键词;对所述问题关键词与所述答案关键词进行词义提取,根据词义提取结果进行关键词匹配,生成匹配结果;按照所述匹配结果将所述电力问题信息集与所述电力答案信息集进行匹配,获取多个问题-答案对;基于所述多个问题-答案对构建所述电力标准问答数据库。

5、进一步,基于所述电力问题信息集、所述电力标准条款信息集进行特征提取,训练构建电力数据检索模型,包括:基于所述电力标准条款信息集对所述电力问题信息集进行分词,根据分词结果将所述电力问题信息集与所述电力标准条款信息集进行匹配,生成多个问题-条款对;将所述多个问题-条款对进行特征提取,对特征提取结果进行维度转换,获取第一维度向量;基于所述电力标准条款信息提取所述电力问题信息集的上下文特征作为额外特征;利用所述多个问题-条款对作为监督信号,训练所述第一维度向量与所述额外特征的相关性,基于相关系数捕捉所述电力问题信息集与所述电力标准条款信息集的复杂语义信息;基于所述复杂语义信息,对初始检索结果进行检索增强训练,直至训练结果收敛,输出所述电力数据检索模型。

6、进一步,基于所述复杂语义信息,对初始检索结果进行检索增强训练,直至训练结果收敛,包括:基于所述复杂语义信息对所述初始检索结果进行自动扩展查询,获取扩展词汇;通过损失函数计算所述扩展词汇的检索损失数据;按照所述检索损失数据对所述初始检索结果进行重排序,确定重排序列;根据所述重排序列对所述初始检索结果进行检索反馈,生成检索反馈评分,判断所述检索反馈评分是否满足预设评分阈值;当所述检索反馈评分不满足所述预设评分阈值,则通过随机搜索对所述初始检索结果进行随机检索调优,直至满足预设随机检索次数停止;当所述检索反馈评分满足所述预设评分阈值,则视为所述初始检索结果为收敛。

7、进一步,基于所述电力标准问答数据库进行编码,训练构建电力数据答复模型,包括:基于所述电力数据检索模型对目标问题进行检索,构建候选答案集;遍历所述电力标准问答数据库,将所述多个问题-答案对作为监督信号,训练所述电力数据答复模型;基于所述候选答案集进行随机提取生成第k答案数据,所述第k答案数据具有第k适应度;判断所述第k答案的所述第k适应度是否大于第k-1答案的第k-1适应度;若是,则将所述第k答案的优先级进行数值增加,若否,则将所述第k-1答案的优先级进行数值增加,生成答案选择序列;基于所述答案选择序列更新所述候选答案集的排序,提取答案选择序列的第一位序,确定最优答案数据;基于所述目标问题对所述最优答案数据进行评估,根据评估结果调整模型答复结构,按照模型调整结构输出所述电力数据答复模型。

8、进一步,对所述电力数据检索模型与所述电力数据答复模型进行联合训练优化,生成联合优化结果,包括:映射所述电力数据检索模型与所述电力数据答复模型的交互关联因子;计算所述电力数据检索模型与所述电力数据答复模型的联合损失函数,基于所述交互关联因子设定联合训练目标;将所述目标问题输入所述电力数据检索模型,获取电力标准条款的候选列表;基于所述候选列表依次将所述目标问题按照电力标准条款输入所述电力数据答复模型,输出初始答复结果;按照所述联合训练目标计算所述初始答复结果的答复损失数据;通过反向传播算法计算所述答复损失数据的损失梯度,获取最小化联合损失函数,基于所述最小化联合损失函数分别更新所述电力数据检索模型与所述电力数据答复模型,生成所述联合优化结果。

9、进一步,构建电力标准问答初始模型,基于所述联合优化结果对所述电力标准问答初始模型进行回溯训练,基于回溯结果输出电力标准问答模型,包括:根据更新后的所述电力数据检索模型与所述电力数据答复模型构建所述电力标准问答初始模型;分解所述联合优化结果获取所述电力数据检索模型的条款排序信息、所述电力数据答复模型的答复排序信息;利用所述条款排序信息、所述答复排序信息将检索结果与原始问题进行匹配,构建回溯数据集;基于所述回溯数据集进行特征的重新提取,对所述电力标准问答初始模型进行回溯训练,生成回溯结果;对所述回溯结果进行验证测试,输出所述电力标准问答模型。

10、本申请公开的另一个方面,提供了基于检索增强的电力标准问答模型训练系统,所述系统包括:数据采集模块,所述数据采集模块用于基于大数据进行数据采集,获得电力标准文档,所述电力标准文档包含电力问题信息集、电力答案信息集、电力标准条款信息集;数据库构建模块,所述数据库构建模块用于构建电力标准问答数据库,所述电力标准问答数据库是基于所述电力问题信息集与所述电力答案信息集进行匹配训练所获;答复模型训练模块,所述答复模型训练模块用于基于所述电力标准问答数据库进行编码,训练构建电力数据答复模型;检索模型训练模块,所述检索模型训练模块用于基于所述电力问题信息集、所述电力标准条款信息集进行特征提取,训练构建电力数据检索模型;联合训练优化模块,所述联合训练优化模块用于对所述电力数据检索模型与所述电力数据答复模型进行本文档来自技高网...

【技术保护点】

1.基于检索增强的电力标准问答模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述电力问题信息集与所述电力答案信息集进行匹配训练,方法包括:

3.如权利要求1所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述电力问题信息集、所述电力标准条款信息集进行特征提取,训练构建电力数据检索模型,方法包括:

4.如权利要求3所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述复杂语义信息,对初始检索结果进行检索增强训练,直至训练结果收敛,方法包括:

5.如权利要求2所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述电力标准问答数据库进行编码,训练构建电力数据答复模型,方法包括:

6.如权利要求5所述的基于检索增强的电力标准问答模型训练方法,其特征在于,对所述电力数据检索模型与所述电力数据答复模型进行联合训练优化,生成联合优化结果,方法包括:

7.如权利要求1所述的基于检索增强的电力标准问答模型训练方法,其特征在于,构建电力标准问答初始模型,基于所述联合优化结果对所述电力标准问答初始模型进行回溯训练,基于回溯结果输出电力标准问答模型,方法包括:

8.基于检索增强的电力标准问答模型训练系统,其特征在于,用于实施所述基于检索增强的电力标准问答模型训练方法1-7中任意一项,包括:

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于检索增强的电力标准问答模型训练方法。

...

【技术特征摘要】

1.基于检索增强的电力标准问答模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述电力问题信息集与所述电力答案信息集进行匹配训练,方法包括:

3.如权利要求1所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述电力问题信息集、所述电力标准条款信息集进行特征提取,训练构建电力数据检索模型,方法包括:

4.如权利要求3所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述复杂语义信息,对初始检索结果进行检索增强训练,直至训练结果收敛,方法包括:

5.如权利要求2所述的基于检索增强的电力标准问答模型训练方法,其特征在于,基于所述电力标准问答数据库进行编码,训练构建电力数据答复模...

【专利技术属性】
技术研发人员:张赛范晓宣宋博川梁潇张强王志皓赵海翔沈超费彬
申请(专利权)人:国网智能电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1