System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法技术_技高网

多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法技术

技术编号:43462672 阅读:1 留言:0更新日期:2024-11-27 13:00
本发明专利技术公开了一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,采用两次对比学习训练编码器,第一个编码器用于处理不同轴承之间的时序数据关系,通过学习多轴承时序数据的共性和差异,增强了模型对多特征时序数据复杂关系的理解能力和变化的感知能力;第二个编码器则将时序数据与相应时间段内的文本描述对齐,以提升模型对时序数据预测结果的文本解释能力。预训练后,将编码后的时序数据输入到chatglm‑6B大模型中,从而实现了对汽轮机轴承振动异常的有效诊断及结果的文本解释。

【技术实现步骤摘要】

本专利技术涉及异常检测和大模型,具体涉及一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,能够实现对火电厂汽轮机多轴承振动异常的诊断与相应的检测结果文本解释。


技术介绍

1、汽轮机在电力和工业领域中得到广泛应用,但在运行过程中,其高负荷运行易受温度、压力、材料老化等因素影响,可能导致轴承振动异常工况甚至故障。目前,汽轮机振动异常检测主要依赖经验和人工检查,传感器数据分析以及机器学习算法尽管取得一定成效,但面临耗费大量人力物力、机器学习结果缺乏解释、故障模式区分、实时性和模型泛化能力等挑战。

2、大型语言模型(llm)在自然语言处理和计算机视觉等领域有着重要应用。大模型的优势主要体现在其强大的自然语言理解和生成能力上。通过对大规模语料库的预训练,大模型能够捕捉语义、上下文和复杂语言结构,从而生成连贯且有意义的文本解释。它可以自动提取和整合信息,提供精准、详尽的解释,减少人工干预。其自适应学习能力使其能够处理多样化的语言输入,提高解释的准确性和一致性,满足不同场景下的文本理解需求。但是大模型在处理数字数据时存在不足,通常表现出不敏感性,难以有效捕捉数字变化的关系,同时大模型难以支持多变量数据输入,无法学习多特征之间的关键信息,也很难学习时序数据代表的文本信息,这主要是因为大模型通常设计为擅长处理自然语言中的上下文语义,而非数值之间的精确关系。这种设计导致在数值相关任务中,大模型往往难以学习和理解数字间的细微差异和复杂关系。


技术实现思路

1、针对目前现有技术中存在的不足,本专利技术的目的在于提出了一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法。利用对比学习,构建了两个编码器,第一个为时序数据编码器,不同轴承属于同一汽轮机,在发生异常时,所有轴承时序数据都会发生改变,同时又因为轴承所处位置不同,每个轴承时序数据又存在差别,因此通过对比学习,让编码器学习多轴承时序数据之间的关系,同时学习不同轴承时序数据变化的共同特性。第二个编码器为相似度编码器,强加约束条件,通过对比学习,让编码器学习时序特征与对应时间段轴承振动进行对齐,通过这种方式期望大模型对时序数据输入和振动数据文本描述建立联系。

2、为了达到上述目的,本专利技术采用如下技术方案:

3、一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,包括如下步骤:

4、步骤1:首先,按一定频率采样热电厂汽轮机的轴承振动时序数据,然后对数据进行时间对齐处理,确保各数据在同一时间基准上对应;对于对齐后的数据,使用平均值对缺失值进行填补,从而获得经过处理的完整时序数据集xd,有d个轴承振动数据;

5、步骤2:将完整时序数据集xd进行切割,切分为相同时间间隔的不同批次数据b1,b2,…,bn,每批次再划分为n个时间段的数据s1,s2,…,sn,然后针对每个时间段时序数据进行人工标注,对这段时间段内振动数据变化情况进行文本描述t1,t2,…,tn。

6、步骤3:不同轴承时序数据对比学习:定义一个嵌入函数,其中,t表示每个时间段含有的样本数目,d表示轴承振动数据个数,uk为时序数据经过函数变换到m维空间后的向量表示,首先将所有轴承振动数据每个子序列即每个时间段时序数据通过嵌入函数嵌入到向量空间中,得到嵌入表示为u1,u2,…,uk,在得到不同子序列的嵌入表示后,构建一个神经网络作为时序数据编码器其中,ea为时序数据经过编码器之后的编码表示,维度不变,a为数据时间段序号表示,以第a个时间段的第j个轴承振动数据为基准,j表示列数,不同特征列代表不同轴承振动数据,汽轮机有d个轴承振动数据,进行对比学习增强数据,取第a个时间段内其余轴承振动数据作为对比学习的正样本,小批量内其他时间段内轴承振动数据作为负样本使用损失函数来训练编码器,损失函数定义为:

7、

8、式中:l为时序数据编码器的训练定义损失函数,k为批量大小,表示两个列向量之间的欧几里得距离,和分别表示和的第k个分量,为小批次内其他时间段的时序数据向量表示,r为轴承序号,在计算损失函数时,超参数σ1大小为0.04,用于减少对数据分布的敏感性,提高损失函数鲁棒性。

9、步骤4:时序数据与文本数据对比学习:构建另一个神经网络作为相似度编码器其中,ea为经过时序编码器后的时序数据编码表示,再通过相似度编码器得时序数据非线性投影xa,文本数据经过大模型词嵌入得到这样文本数据和时序数据维度都转换到了同一维度,维度大小为q;大模型无法认识时序数据代表的含义,为了让大模型能够学习到时序特征内部含有的信息,用相似度来衡量时序数据和对应文本嵌入信息的关系,通过对比学习,将时序数据xa所在时间段对应解释文本ta作为正样本,小批量内其余时间段对应的时序数据解释文本tk(k≠a)作为负样本,通过训练,让时序数据与时序数据对应解释文本有最大相似度来期望大模型理解时序数据内部信息,同时尽量增大与其余时间段对应的时序数据解释文本的相似度,让大模型学习到不同时间段时序数据差异与代表的含义,相似度编码器的训练损失函数为:

10、

11、r(xa,ta)=(xa)τta

12、式中:σ2大小为0.07,用于减少对数据分布的敏感性,提高损失函数鲁棒性。

13、步骤5:将选定基准时序数据即第a个时间段的第j个轴承振动数据输入步骤3经过预训练好的时序数据编码器和步骤4经过预训练好的相似度编码器得到输出,然后输入到冻结参数的chatglm-6b大模型中,利用大模型的文本生成能力,最终获得时序数据异常诊断结果以及相应的结果文本解释。

14、有益效果:

15、本专利技术提供一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法具有以下有益效果:

16、(1)文本数据通常是单元的,而时序数据常为多元的,因此传统大模型难以输入多变量时序数据,学习到时序数据多变量之间的复杂关系,本专利技术采用对比学习,因为同机组轴承数据存在共性,创新的以其他轴承时序数据用于对比学习,使模型可以学习到不同轴承之间的复杂关系,进而让大模型可以学习到多变量时序数据。

17、(2)大模型难以有效捕捉时序数据数字变化的关系,表现出不敏感型,为了增强大模型对时序数据的感知,设计编码器,采用对比学习,让时序数据与文本描述对齐,并能区分不同时间段的时序数据差别,增强了大模型对数据的理解能力,进而实现大模型的有效异常判断与结果解释。

本文档来自技高网...

【技术保护点】

1.一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,其特征在于:超参数σ1大小为0.04,超参数σ2大小为0.07。

3.根据权利要求1所述的一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,其特征在于:步骤5中所述的大模型为chatglm-6B大模型。

【技术特征摘要】

1.一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的一种多轴承时序数据输入的可解释火电厂汽轮机振动异常大模型诊断方法,其特征在于:超参...

【专利技术属性】
技术研发人员:曹晖朱文浩梁源贤郑晓东石天卓庞东峻刘懋源
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1