System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及自然语言处理与故障诊断领域。尤其涉及基于graphrag大模型的工业泵故障智能诊断方法。
技术介绍
1、在现代工业生产中,泵作为流体输送的关键设备,其运行状态直接影响到生产线的稳定性和安全性。然而,由于长时间运行或维护不当,工业泵容易出现各种故障,如机械磨损、密封失效、电机过热等,这些故障不仅会导致生产中断,还可能引发安全事故,造成经济损失。因此,对工业泵进行有效的故障诊断与预测,对于保障生产安全、降低维修成本具有重要意义。
2、传统的工业泵故障诊断方法主要依赖于人工经验判断,或使用单一的数据分析手段(如振动分析等)。然而,这些方法往往存在准确率不高、实时性差等问题,难以满足现代工业对故障诊断的高要求。近年来,随着大数据、人工智能技术与自然语言处理技术的发展。这些方法工业泵故障分析和检索提供了新的解决方案。
3、大模型(large model)是人工智能领域中的一种重要模型,通常指的是参数量非常大、数据量也非常大的深度学习模型。大模型通常由数百万到数十亿的参数组成,需要大量的数据和计算资源进行训练和推理。由于其巨大的规模,大模型具有非常强大的表示能力和泛化能力,可以在各种任务中表现出色,如语音识别、自然语言处理、计算机视觉等。其中大语言模型(large language model,llm)是专门针对自然语言处理任务设计的大规模深度学习模型,这类模型专注于理解和生成人类语言,主要处理文本数据,用于翻译、问答、文本摘要、对话生成等任务。另外,graphrag(graphs retrievala
4、本专利技术提出了一种基于graphrag大模型的工业泵故障智能诊断方法。该方法旨在通过构建工业泵知识图谱来捕获设备、故障类型、维修措施等实体之间的复杂关系,并利用graphrag技术实现对这些知识的有效检索和利用。此外,通过整合llm大模型的强大生成能力,该系统能够在理解用户查询的基础上,从已有的故障分析案例中检索出最相关的信息片段,并生成高质量的故障诊断报告和维修建议。
技术实现思路
1、本专利技术的目的在于提高工业泵故障诊断的准确性和效率,为设备维护提供科学依据,提供了基于graphrag大模型的工业泵故障智能诊断方法。
2、为实现上述目的,本专利技术采取以下技术方案:
3、基于graphrag大模型的工业泵故障智能诊断方法,包括以下步骤:
4、步骤1、收集数据资料并建立知识图谱。收集工业泵的基本信息、故障分析记录,提取工业泵的实体及其实体之间的关系来构建故障图谱,其中实体包括组成部件、故障类型、故障现象、故障原因与故障处理;采集振动信号,提取出特征参数来构建特征图谱。
5、步骤2、融合知识图谱。将特征参数输入到卷积神经网络中进行故障分类得到故障类型,然后利用word2vec模型生成词向量,并进行余弦相似度计算得到故障图谱与特征图谱的相似节点对,进而得到融合后的知识图谱。
6、步骤3、优化prompt模板。将融合知识图谱的数据输入到llm大模型模块中,利用graphrag中prompt_tune函数对prompt模板进行自动适配优化;
7、步骤4、利用graphrag索引构建模块提取节点信息。利用llm将数据文本分割成文本块;借助优化后的prompt模板来识别和提取文本块中的图节点和边的实例;利用llm为每个实体和关系提供简短的摘要描述,使每个元素都有统一且描述性的文本;通过分层莱顿算法对所述实体进行社区划分,并据此生成实体、关系和社区摘要信息;使用node2vec算法生成图的向量表示,最终汇总得到所有的节点信息,其中包括文本块、实体、社区、摘要和协变量。
8、步骤5、用户请求的输入与解析。当用户选择振动信号输入时,提取出信号的特征参数,利用卷积神经网络进行故障分类,通过余弦相似度将特征参数与特征图谱部分中的节点进行匹配,作为数据引擎进行分类,将分类结果与故障图谱部分中的节点进行匹配,作为知识引擎进行定位,得到相关节点信息;另外,当用户选择问题咨询时,利用llm提取出问题中的相关实体,通过余弦相似度将特征图谱部分中的节点进行匹配,同样得到相关节点信息。
9、步骤6、利用graphrag检索生成模块对索引进行检索并输出诊断报告。将相关节点信息映射到索引数据,然后利用检索生成模块中的本地搜索与全局搜索,进行整合得到最终的故障诊断报告,输出给用户。
10、其中,步骤1的具体步骤包括:通过搜集文献资料得到工业泵的基本信息文件,主要描述工业泵的主要组成部件及故障类型;具体工业泵故障维修的相关资料为,清水泵与渣浆泵的部分常见故障及处理方法资料,主要涉及设备现象,故障原因和处理方法三方面;特征参数选择的是频域特征参数,包括重心频率,平均频率,均方根频率,频率标准差。
11、步骤2的具体步骤包括:将特征参数输入到卷积神经网络中进行故障分类得到故障类型,然后利用word2vec模型生成词向量,其中模型重要参数包括向量维度、窗口大小、最小词频、线程数、初始学习率、训练模型以及优化目标函数;进行余弦相似度计算,得到故障图谱与特征图谱的相似节点对,进而得到融合后的知识图谱。
12、步骤3的具体步骤包括:其中llm大模型选择的是通义千问大模型,其中聊天模型选择的是qwen-turbo模型,嵌入模型选择的是text-embedding-v1模型。对于prompt_tune函数,需要设置的参数主要包括,选择文档的方法method,加载文本单位的限制limit,输入的语言language,生成提示符的最大token数max-tokens以及生成文本单元时使用的标记大小chunk-size。
13、步骤4的具体步骤包括:分层莱顿算法的流程包括:应用标准莱顿算法在初始网络上进行社区检测,通过优化模块度或其他质量函数找到最佳社区划分;接着,将每个检测到的社区凝聚成超级节点,构建新的凝聚图;对新图递归应用上述社区检测和凝聚过程,形成更高级别的社区结构;此过程持续进行,直到达到预设的停止条件;输出多层次的社区结构,揭示网络中的多尺度社区特征。
14、另外,node2vec算法的流程包括:在给定的图中设定返回参数和进出参数两个超参数,来控制随机游走的行为,从每个节点出发生成多条带偏置的随机游走序列;这些序列被用作训练数据,输入到word2vec模型中,以学习每个节点的低维稠密向量表示;经过多轮迭代优化,模型收敛后输出能够反映图结构特征的节点嵌入向量。
15、步骤5的具体步骤包括:当用户本文档来自技高网...
【技术保护点】
1.基于GraphRAG大模型的工业泵故障智能诊断方法,其特征在于:
2.根据权利要求1中所叙述的工业泵基本信息、故障分析记录和特征参数,其特征在于:通过搜集资料得到工业泵的基本信息文件,主要描述了工业泵的主要组成部件及故障类型;工业泵故障维修的相关资料为,清水泵与渣浆泵的部分常见故障及处理方法资料,主要涉及设备现象,故障原因和处理方法三方面。特征参数主要包括重心频率,平均频率,均方根频率,频率标准差四个频域特征参数。
3.根据权利要求1中所叙述的利用Word2Vec模型生成词向量,其特征在于:Word2Vec模型需要设置的主要参数,包括向量维度、窗口大小、最小词频、线程数、初始学习率、训练模型以及优化目标函数。
4.根据权利要求1中所叙述的将融合知识图谱的数据输入到LLM模块中,并利用prompt_tune函数对prompt模板进行自动适配优化,其特征在于:LLM大模型选择通义千问大模型,其中聊天模型选择qwen-turbo模型,嵌入模型选择text-embedding-v1模型。对于prompt_tune函数,需要设置的参数主要包括,选择文
5.根据权利要求1所述的通过分层莱顿算法对所述实体进行社区划分,其特征在于:分层莱顿算法的流程包括:利用标准莱顿算法在初始网络上进行社区检测,通过优化模块度找到最佳社区划分;将每个检测到的社区凝聚成超级节点,构建新的凝聚图;对新图递归应用社区检测和凝聚过程,形成更高级别的社区结构;此过程持续进行,直到达到预设的停止条件;最终输出多层次的社区结构,揭示网络中的多尺度社区特征。
6.根据权利要求1所述的使用Node2Vec算法生成图的向量表示,其特征在于:Node2Vec算法的流程包括:在给定的图中,设定返回参数和进出参数两个超参数,来控制随机游走的行为,从每个节点出发生成多条带偏置的随机游走序列;这些序列被用作训练数据,输入到Word2Vec模型中,以学习每个节点的低维稠密向量表示;经过多轮迭代优化,模型收敛后输出能够反映图结构特征的节点嵌入向量。
7.根据权利要求1所述的利用检索生成模块中的本地搜索与全局搜索进行整合,得到最终的故障诊断报告,其特征在于:其中本地搜索的基本流程包括:用户输入请求后,系统从中提取实体及其描述和嵌入信息,生成候选文本单元、候选社区报告、候选实体等;这些候选单元经过排序和过滤,输出优先级结果;最终将所有优先级结果汇总,生成响应并返回给用户。
...【技术特征摘要】
1.基于graphrag大模型的工业泵故障智能诊断方法,其特征在于:
2.根据权利要求1中所叙述的工业泵基本信息、故障分析记录和特征参数,其特征在于:通过搜集资料得到工业泵的基本信息文件,主要描述了工业泵的主要组成部件及故障类型;工业泵故障维修的相关资料为,清水泵与渣浆泵的部分常见故障及处理方法资料,主要涉及设备现象,故障原因和处理方法三方面。特征参数主要包括重心频率,平均频率,均方根频率,频率标准差四个频域特征参数。
3.根据权利要求1中所叙述的利用word2vec模型生成词向量,其特征在于:word2vec模型需要设置的主要参数,包括向量维度、窗口大小、最小词频、线程数、初始学习率、训练模型以及优化目标函数。
4.根据权利要求1中所叙述的将融合知识图谱的数据输入到llm模块中,并利用prompt_tune函数对prompt模板进行自动适配优化,其特征在于:llm大模型选择通义千问大模型,其中聊天模型选择qwen-turbo模型,嵌入模型选择text-embedding-v1模型。对于prompt_tune函数,需要设置的参数主要包括,选择文档的方法method,加载文本单位的限制limit,输入的语言language,生成提示符的最大token数max-tokens以及生成文本单元时使用的标...
【专利技术属性】
技术研发人员:秦志英,杨伊悦,赵月静,杜国,蒋磊,才进,
申请(专利权)人:河北科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。