System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于人工智能和问答系统领域,特别涉及一种基于大语言模型的知识问答系统。
技术介绍
1、智能电网的快速发展对电力系统的安全稳定运行提出了更高要求,电力运维工作面临着诸多挑战。电力运维涉及的数据量庞大且类型繁多,包括设备手册、运行规程、检修记录、故障报告等,这些数据分散在各个部门和系统中,难以整合利用。电力系统运维场景复杂多变,需要运维人员具备丰富的经验和专业的知识才能应对各种突发事件。传统知识获取方式使运维人员在遇到问题时,往往需要查阅大量资料,咨询专家,耗费大量时间和精力,影响故障处理效率,甚至可能延误最佳抢修时机,造成更大的损失。
2、问答系统能够为不同需求的运维人员提供多种运维功能。task场景是问答系统的核心功能,支持运维人员通过一轮或多轮对话的方式完成具体的运维操作,如“系统健康度分析”、“创建故障群组”、“执行xx系统作业”等。
3、例如,当发生设备故障时,运维人员需要快速查询故障现象、原因分析、处理方法等信息,以便快速定位故障点并进行处理。在日常巡检维护过程中,运维人员需要查阅设备参数、操作规程、安全规范等信息,以确保操作的规范性和安全性。运维人员需要不断学习新的电力运维知识和技能,知识问答系统可以为其提供个性化的学习资料和答疑解惑服务。
4、如何高效地获取和利用电力运维知识,已成为电力行业数字化、智能化转型亟待解决的关键问题。
技术实现思路
1、为了解决现有技术中存在的不足,本专利技术提供了一种基于大语言模型的知识问答系统
2、为解决上述技术问题,本专利技术采用如下的技术方案。
3、本专利技术首先公开了一种基于大语言模型的知识问答系统,该方法包括以下步骤:
4、电力运维知识库模块,用于从预定义数据源获取数据并进行预处理,构建电力运维领域的知识图谱,并将文本内容转换为语义向量,采用向量数据库存储所述语义向量和所述知识图谱,整合形成电力运维知识库;
5、问题理解模块,用于进行问题识别分析,识别用户的意图,并将用户问题转换为语义向量;
6、检索与重排序模块,用于在所述电力运维知识库中进行语义检索,召回与问题语义相关的知识信息,然后基于语义相关性、知识置信度和信息重要度对检索结果进行排序;
7、答案生成模块,用于将最相关的知识信息与用户问题整合为大语言模型的输入,生成适合大语言模型处理的提示信息,采用基于电力运维领域数据微调的大语言模型,根据所述提示信息生成自然语言形式的答案。
8、本专利技术进一步包括以下优选方案:
9、所述预定义数据源包括企业内部资料和外部专业知识,其中所述企业内部资料包括电力企业内部文档,电力企业内部文档包括设备手册、运行规程、检修记录、故障案例库、作业票、技术标准、事故报告;所述外部专业知识包括国家电网专业知识库、电力行业标准化文档及学术文献。
10、所述电力运维知识库模块,进一步用于,将多种格式的文件转换为可处理的文本,采用自然语言处理技术对文本进行信息抽取,提取关键实体及其关系。
11、所述语义相关性为问题与答案在语义层面的匹配程度;所述知识置信度为答案来源的可靠性和可信度;所述信息重要度为答案对解决问题的重要程度。
12、所述问题理解模块,进一步用于:
13、对用户输入的问题进行分词和词性标注,识别问题中的关键词。识别问题中与电力运维相关的实体,并抽取实体之间的关系,根据问题分析的结果,识别用户的意图,根据电力运维领域的术语规范,对用户输入的问题进行改写,将口语化表达转换为专业术语,最终将处理后的问题转换为语义向量,以便在知识库中进行检索。
14、所述系统进一步包括系统管理模块,进一步用于实现会话管理、提示词管理、插件管理和日志管理;
15、其中,所述会话管理进一步包括,保存用户的历史问答记录,以基于历史问答记录进行多轮对话和上下文理解;
16、所述提示词管理进一步包括,针对不同的问答场景和用户需求配置不同的提示词信息,引导模型生成答案;
17、所述插件管理进一步包括,集成外部插件,包括故障诊断工具、专家系统、知识图谱,增强系统功能;
18、所述日志管理进一步包括,记录系统运行日志,用于性能监控、模型优化和案例分析。
19、所述大模型为预训练大模型chatglm3,基于llama-factory微调基础框架,采用lora微调方案对所述chatglm3大模型进行指令监督微调;微调流程进一步包括:
20、在构造数据集过程中,收集行业数据、数据分割、基于分割的数据块建立问答对,然后配置微调参数,执行微调,在配置微调参数之后,执行微调后模型的评估;在合并lora权重过程中,生成新模型,部署所述新模型,在项目中应用新模型执行推理。
21、所述答案生成模块,进一步用于根据任务的复杂度,将检索和生成过程动态重复多次,使模型能够不断提炼其输出。
22、相应地,本申请还公开了一种终端,包括处理器及存储介质;
23、所述存储介质用于存储指令;
24、所述处理器用于根据所述指令进行操作以执行根据前述基于大语言模型的知识问答系统。
25、相应地,本申请还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述基于大语言模型的知识问答系统。
26、本专利技术的有益效果在于,与现有技术相比,本专利技术提供了一种基于大语言模型的知识问答系统,通过构建全面的电力运维知识库,利用深度学习技术理解用户问题的语义,并在知识库中进行精准检索,快速定位相关信息;支持自然语言问答、多轮对话、意图识别等功能,为用户提供友好、高效的智能化交互体验;根据用户提供的故障信息,结合知识库和专家经验,辅助运维人员进行故障原因分析、解决方案推荐等;有效降低运维人员的知识获取成本,提高故障诊断和处理效率,为构建更加安全、可靠、高效的电力系统提供有力支撑。
本文档来自技高网...【技术保护点】
1.一种基于大语言模型的知识问答系统,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的知识问答系统,其特征在于,所述预定义数据源包括企业内部资料和外部专业知识,其中所述企业内部资料包括电力企业内部文档,电力企业内部文档包括设备手册、运行规程、检修记录、故障案例库、作业票、技术标准、事故报告;所述外部专业知识包括国家电网专业知识库、电力行业标准化文档及学术文献。
3.根据权利要求2所述的基于大语言模型的知识问答系统,其特征在于,所述电力运维知识库模块,进一步用于,将多种格式的文件转换为可处理的文本,采用自然语言处理技术对文本进行信息抽取,提取关键实体及其关系。
4.根据权利要求3所述的基于大语言模型的知识问答系统,其特征在于,所述语义相关性为问题与答案在语义层面的匹配程度;所述知识置信度为答案来源的可靠性和可信度;所述信息重要度为答案对解决问题的重要程度。
5.根据权利要求4所述的基于大语言模型的知识问答系统,其特征在于,所述问题理解模块,进一步用于:
6.根据权利要求5所述的基于大语言模型的知识问答系统,其特
7.根据权利要求6所述的基于大语言模型的知识问答系统,其特征在于,所述大模型为预训练大模型ChatGLM3,基于LLaMA-Factory微调基础框架,采用LoRA微调方案对所述ChatGLM3大模型进行指令监督微调;微调流程进一步包括:
8.根据权利要求7所述的基于大语言模型的知识问答系统,其特征在于,所述答案生成模块,进一步用于根据任务的复杂度,将检索和生成过程动态重复多次,使模型能够不断提炼其输出。
9.一种终端,包括处理器及存储介质;其特征在于:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8任一项所述的基于大语言模型的知识问答系统。
...【技术特征摘要】
1.一种基于大语言模型的知识问答系统,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的知识问答系统,其特征在于,所述预定义数据源包括企业内部资料和外部专业知识,其中所述企业内部资料包括电力企业内部文档,电力企业内部文档包括设备手册、运行规程、检修记录、故障案例库、作业票、技术标准、事故报告;所述外部专业知识包括国家电网专业知识库、电力行业标准化文档及学术文献。
3.根据权利要求2所述的基于大语言模型的知识问答系统,其特征在于,所述电力运维知识库模块,进一步用于,将多种格式的文件转换为可处理的文本,采用自然语言处理技术对文本进行信息抽取,提取关键实体及其关系。
4.根据权利要求3所述的基于大语言模型的知识问答系统,其特征在于,所述语义相关性为问题与答案在语义层面的匹配程度;所述知识置信度为答案来源的可靠性和可信度;所述信息重要度为答案对解决问题的重要程度。
5.根据...
【专利技术属性】
技术研发人员:颜肃,沈彪,乔梦竹,周晓光,
申请(专利权)人:南京苏逸实业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。