一种基于无监督贡献建模的三维荧光光谱分析方法技术

技术编号：44291284 阅读：5 留言：0更新日期：2025-02-14 22:25

本发明专利技术提出一种基于无监督贡献建模的三维荧光光谱分析方法，方法包括：获取样本的原始三维荧光光谱；对三维荧光光谱进行独立成分分析，利用分析结果对光谱进行重建；使用多元曲线分辨率‑交替最小二乘算法对重建后的光谱进行建模，得到分析报告。本发明专利技术通过两种二维无监督建模算法的组合，自动化去除原始三维荧光光谱中的散射等干扰信号，然后对重建光谱进行建模，降低了三维荧光光谱分析对数据、工具、平台和人员的依赖，在提高灵活性的同时，保证了良好的容错性和准确性，为水质监测提供了可靠的技术支持。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及三维荧光光谱的定性分析，具体涉及一种基于无监督贡献建模的三维荧光光谱分析方法。

技术介绍

1、水质监测对于预防污染和保护环境具有重要意义。现有的水质监测技术，尤其是荧光光谱技术，由于其高灵敏度、非破坏性、快速检测和低成本，被广泛用于溶解性有机物(dom)和其他荧光化合物的检测。其中，由于特定的荧光物质具有与之相对应的唯一的eem特征(称为荧光指纹)，三维荧光法具有较高的选择性，适合作为常规的水质监测手段。然而，这些技术在实际应用中仍面临着一些挑战。尤其是在处理复杂的环境样品时，荧光信号常常因为多种污染物的混合而变得复杂，导致信号源难以解析，并且散射光的干扰也使得正确识别和量化污染物变得困难。

2、传统的方法主要依赖于简单的多元分析方法或图形化分析，从三维荧光数据中提取污染物的特征信号和浓度分布，如公开号cn115236048a，名称为：一种基于三维荧光光谱监测水中氨氮浓度的方法、公开号cn111198165a，名称为：一种基于光谱数据标准化进行水质参数的测定方法。其中，平行因子分析(parafac)方法由于能够直接提取具有化学意义的信息，被认为是处理eems数据的标准算法。然而，这些方法对噪声和信号的混合程度较为敏感，在处理强散射光干扰时，效果不佳。在这种情况下，通常需要根据数据特征人工进行散射切除等预处理，对分析者的化学计量学知识、编程技能和实际操作经验要求较高，对matlab等分析软件的依赖较为严重，限制了三维荧光技术的广泛应用。

3、随着人工智能的兴起，机器学习算法在分析化学的各种定性

4、独立成分分析(ica)是一种数值迭代方法，它起源于神经网络，基于盲源分离算法，通过最大化混合信号各自的独立性来反卷积混合信号。由于该算法使用正交负熵近似来最大化独立分量的贡献，我们将基于该算法的数据分析方法称为贡献分析，用于将荧光信号分解为独立成分。然而，由于ica不受任何限制，在将ica的解转换为化学信息之前必须仔细评估。

技术实现思路

1、针对上述问题，本专利技术的目的在于提供一种基于无监督贡献建模的三维荧光光谱分析方法。

2、本专利技术的技术方案如下：

3、一种基于无监督贡献建模的三维荧光光谱分析方法，包括如下步骤：

4、s1：获取样本的原始三维荧光光谱；具体过程如下：

5、s1.1：从测量仪器或现有工作中获取数据，并整理为多个eem(eems)文件和元数据文件，作为数据集；eem文件为样本的eem数据，元数据文件包括激发波长、发射波长等信息。

6、s1.2：在yml文件中记录数据集信息，包括名称、nex、nem、样本数。

7、s2：对三维荧光光谱进行独立成分分析(ica)，利用分析结果对光谱进行重建；具体过程如下：

8、s2.1：选择合适的独立贡献数量，将eems输入ica算法进行建模，输出信号源矩阵与浓度分布矩阵。

9、进一步地，独立贡献数量的选择可使用以下方法：逐渐增加独立贡献数量，直到算法能够分离出干扰信号作为独立成分为止，将此时的独立贡献数量作为最佳值。

10、进一步地，所述ica算法的数学原理为x＝s·a+v，其中x为二维矩阵(样本×eem展开得到的向量)，s为信号源矩阵，a为浓度分布矩阵，v为残差。

11、s2.2：将信号源矩阵折叠为信号源eems。

12、进一步地，每个信号源eem其实对应ica算法结果中的一个独立成分。

13、s2.3：在信号源eems中，分离干扰信号，留下荧光指纹。

14、进一步地，所述干扰信号包括散射和噪声，其中散射包括瑞利散射和拉曼散射。

15、s2.4：合并峰值位置相近的荧光指纹。

16、进一步地，所述峰值位置是一个坐标，可表示为(激发波长，发射波长)。

17、进一步地，所述峰值位置相近的含义为激发波长相近或发射波长相近。

18、进一步地，对于峰值位置相近的判断标准是：如果两个荧光峰所在的激发波长区间相似度达到80％以上，或者这两个荧光峰所在的发射波长区间相似度达到80％以上，则认为这两个荧光峰的峰值位置相近；除此之外，两个荧光峰在合并之后不能重叠。

19、进一步地，合并荧光指纹的具体方法为：选定一个主指纹和一个副指纹，将副指纹叠加到主指纹之上，或者将副指纹取反(乘以负一)后叠加到主指纹之上，然后将副指纹标记为干扰信号。由于ica算法没有非负限制，且在实现时会将数据以0为中心进行中心化，所以结果有正有负，相应地会有正指纹和负指纹，叠加时需酌情考虑是否取反，以保证主指纹与副指纹的正负一致性。

20、s2.5：对浓度分布矩阵进行裁剪，删除干扰信号对应的行或列。

21、s2.6：将荧光指纹展开为荧光信号源矩阵，将其与浓度分布矩阵相乘，得到重建光谱。

22、s3：使用mcr-als(多元曲线分辨率-交替最小二乘)算法对重建后的光谱进行建模，得到分析报告；具体过程如下：

23、s3.1：选择合适的组分数，将重建光谱输入mcr-als算法进行建模，输出信号源矩阵与浓度分布矩阵。

24、进一步地，所述mcr-als算法的数学原理为d＝c·st，其中d为二维矩阵(样本×eem展开得到的向量)，s为信号源矩阵，c为浓度分布矩阵。结果的默认约束为非负。

25、s3.2：将信号源矩阵折叠为样本荧光指纹。

26、s3.3：利用基准库，识别样本荧光指纹对应的分析物；在识别时需要依据已知分析物的荧光指纹，已知分析物的荧光指纹通常来自内部或外部数据库，称为基准库；由于每种分析物的荧光指纹都具有特异性，通过比对来确定给定三维荧光光谱对应的样本中含有的分析物，从而实现识别。

27、进一步地，所述分析物是化学分析程序中感兴趣的物质或化学成分。分析物可以是特定的纯净物(无机物、有机物)，也可以是一类物质(如dom分析中的类腐殖质、类富里酸)。

28、本专利技术的有益效果如下：

29、1)与其他方法相比，本专利技术支持直接输入原始三维荧光光谱进行分析，操作方便，对数据质量要求低。

30、2)与常规的预处理方法相比，本专利技术使用ica算法自动化去除光谱中的散射和噪声，摆脱了对特定编程平台和预处理工具的依赖，从而有效降低了因人员经验不足、操作失误等人为因素而导致分析失败的风险。

31、3)与本文档来自技高网...

【技术保护点】

1.一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤S1中三维荧光光谱包含多个激发发射矩阵EEM和相应的元数据，其中，多个激发发射矩阵EEM记为EEMs；元数据是测量仪器输出的除EEMs以外的数据，包括激发波长、发射波长、日期时间及其他扫描预设参数；三维荧光光谱来自实际测量或来自人工模拟。

3.根据权利要求1所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤S2包括如下步骤：

4.根据权利要求3所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤S2.4对于峰值位置相近的判断标准是：如果两个荧光峰所在的激发波长区间相似度达到80％以上，或者这两个荧光峰所在的发射波长区间相似度达到80％以上，则认为这两个荧光峰的峰值位置相近；除此之外，两个荧光峰在合并之后不能重叠。

5.根据权利要求3所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤S3包括如下步骤：

6.根据权利要求5所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤S3.3在识别时需要依据已知分析物的荧光指纹；已知分析物的荧光指纹通常来自内部或外部数据库，称为基准库；由于每种分析物的荧光指纹都具有特异性，通过比对来确定给定三维荧光光谱对应的样本中含有的分析物，从而实现识别。

...

【技术特征摘要】

1.一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤s1中三维荧光光谱包含多个激发发射矩阵eem和相应的元数据，其中，多个激发发射矩阵eem记为eems；元数据是测量仪器输出的除eems以外的数据，包括激发波长、发射波长、日期时间及其他扫描预设参数；三维荧光光谱来自实际测量或来自人工模拟。

3.根据权利要求1所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤s2包括如下步骤：

4.根据权利要求3所述的一种基于无监督贡献建模的三维荧光光谱分析方法，其特征在于，所述步骤s2....

【专利技术属性】
技术研发人员：肖刚，陆海宇，程振波，李军，周昀，陈锋，胡建坤，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人