System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及光谱分析,具体涉及一种混合物光谱定性分析方法、系统及设备。
技术介绍
1、拉曼光谱技术具有快速、灵敏、非接触式操作以及仪器便携化的优点,非常适合现场的即时检测分析。作为一种光散射检测技术,拉曼光谱可以穿过透明或半透明包装材料,非接触、无损地直接检测分析样品,特别是由于水的拉曼散射光谱极弱,对其它物质的散射影响也甚微,拉曼光谱的这种性质使其不仅能直接测试固体、液体以及气体,而且能透过透明的玻璃、石英以及塑料等对物质进行测试。
2、在许多现实场景中,样品并非由单一纯物质组成,而是由不同化合物组成的混合物。混合物拉曼光谱的定性分析对于确定混合物中组分的组成和特性至关重要。混合物通常会产生复杂的拉曼光谱,每个组分的光谱峰与其他组分重叠。
3、目前基于化学计量学的谱峰对比算法一般是通过提前建库,将各种纯净物的拉曼谱峰位移作为定性分析的标准,一但未知物检测样的拉曼谱峰出现与库中纯净物谱峰有对应的情况,就会为该纯净物增加权重,这种方法对未知样品为纯净物时有较准确的识别精度,但当未知物为多种物质的混合时,由于存在光谱的混叠与湮灭,识别难度大大增加,简单的特征峰匹配算法已经无法满足实际应用中的需要,存在较高的误识别或漏识别情况。而使用深度学习技术可以帮助从光谱中提取有意义的信息,transformer是nlp(naturallanguage processing,自然语言处理)领域中一种用于文本翻译的网络架构,是一个完全基于自注意力机制的深度学习模型,由于文本翻译领域的数据与拉曼光谱数据类似,都是一维的序列数据,
4、然而,现有混合物识别方法存在以下缺陷:
5、若采用化学计量学算法中的遍历寻峰算法,则需要一一比对数据库中的拉曼光谱谱峰,计算复杂度会很高并且计算所需时间很长,不利于大数据库的部署。
6、若采用普通的卷积神经网络(cnn)来进行混合物识别,对于二维的图片数据,cnn本质上具有空间不变性,这使得它们能够捕获图像中的模式和结构,无论其位置如何、有没有翻转。但在拉曼光谱数据上,由于使用的是一维卷积的cnn,没有二维的空间特性,它只会根据在训练数据中看到的模式和特征将输入分类为预定义的类别,混合物的定性分析需要对拉曼峰有更高的关注度,如果对拉曼光谱进行整体分析,遇到数据库中没有的物质时,模型会按默认的参数,将这些物质的拉曼光谱峰进行拆解,转换成与数据库中类似拉曼光谱的形状,导致误识别;而如果进行分段的分析,由于没有位置信息,模型基本上无法区别两个峰形相似但拉曼频移不同的峰。
7、鉴于此,本申请提出了一种基于transformer的混合物光谱定性分析方法、系统及设备,能够只通过训练纯净物数据,即可实现准确的对5种以内化合物混合后的光谱的定性分析。
技术实现思路
1、本专利技术提供了一种基于transformer的混合物光谱定性分析方法、系统及设备,目的在于仅需要将纯净物拉曼光谱数据作为训练数据,即可训练得到能够识别5种以内混合物的定性分析模型,并且每次调用模型进行定性分析的时间控制在毫秒量级,同时将数据的最低检测限拉低到10%。
2、根据本专利技术的一个方面提出了一种混合物光谱定性分析方法,包括以下步骤:
3、s1、对数据库中的纯净物光谱数据进行预处理后,截取所述纯净物光谱数据中预设拉曼频移的拉曼光谱片段,利用线性分割将所述拉曼光谱片段拆分成多组数据点,获得一维的拉曼频移数据和拉曼强度数据,并且将所述拉曼频移数据和拉曼强度数据合并成双通道数据;
4、s2、对双通道数据进行随机线性叠加,获得混合物类似物拉曼光谱数据,并将混合物类似物拉曼光谱数据和步骤s1获得的双通道数据分别生成对应的标签;
5、s3、将混合物类似物拉曼光谱数据输入至改进的卷积神经网络中进行多次卷积操作,获得多维光谱特征图;
6、s4、将多维光谱特征图输入至transformer模型中进行多层transformer块的编码,获得编码数据,并且将编码数据输入至全连接层中,获得混合物组成成分概率输出。
7、通过上述技术方案,本申请对纯净物进行数据前处理的过程,无需混合物光谱数据即可对网络进行训练并且准确识别。而且与一般数据预处理后的拉曼光谱不同,本申请中的拉曼光谱是包含拉曼频移数据的双通道数据,可以为步骤s3和步骤s4中的卷积和transformer操作提供位置信息,增加混合物定性分析准确度。
8、在具体的实施例中,执行步骤s1-s4获得光谱定性分析模型后,将待测混合物输入至光谱定性分析模型中,输出待测混合物的组成成分预测结果。
9、在具体的实施例中,步骤s3中,将混合物类似物拉曼光谱数据输入至改进的卷积神经网络中进行多次卷积操作,具体包括以下子步骤:
10、s301、对混合物类似物拉曼光谱数据进行卷积,获得双通道下采样后的第一特征图;
11、s302、通过设置通道数为1的卷积核对第一特征图进行卷积,将拉曼频移和拉曼强度进行特征融合提取,获得通道数为1的第二特征图;
12、s303、对第二特征图进行下采样并扩展卷积,获得扩展维度后的第三特征图;
13、s304、对第三特征图进行进一步的下采样卷积,最终获得多维光谱特征图。
14、上述技术方案,通过设计卷积神经网络(cnn)的网络架构,使其输出的多维光谱特征图能顺利输入到transformer模型中。并且通过将双通道的数据降维成单通道的数据,完成了拉曼频移和拉曼强度数据特征的融合提取,在后续的transformer的训练中无需再引入位置信息。
15、在具体的实施例中,将多维光谱特征图输入至transformer模型中进行多层transformer块的编码,获得编码数据,具体包括以下子步骤:
16、s411、将多维光谱特征图输入至transformer块中的第一归一化层中进行归一化操作后,输入至多头注意力模块中,获得注意力特征图;
17、s412、将注意力特征图与多维光谱特征图累加后,输入至第二归一化层中进行归一化操作后,获得归一化特征图;
18、s413、将归一化特征图输入至多层感知机中,获得感知特征图;
19、s414、将步骤s413获得的感知特征图和步骤s412获得的归一化特征图进行累加,最终获得编码数据。
20、在具体的实施例中,在步骤s1中,对数据库中的纯净物光谱数据进行预处理后,截取所述纯净物光谱数据中预设拉曼频移的拉曼光谱片段,具体包括以下子步骤:
21、s101、对数据库中的纯净物光谱数据进行去噪和去基线的预处理操作;
22、s102、将每个纯净物光谱数据选取为波数为200-2200本文档来自技高网...
【技术保护点】
1.一种混合物光谱定性分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,执行步骤S1-S4获得光谱定性分析模型后,将待测混合物输入至所述光谱定性分析模型中,输出所述待测混合物的组成成分预测结果。
3.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,步骤S3中,将所述混合物类似物拉曼光谱数据输入至改进的卷积神经网络中进行多次卷积操作,具体包括以下子步骤:
4.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,在步骤S4中,将所述多维光谱特征图输入至Transformer模型中进行多层Transformer块的编码,获得编码数据,具体包括以下子步骤:
5.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,在步骤S1中,对数据库中的纯净物光谱数据进行预处理后,截取所述纯净物光谱数据中预设拉曼频移的拉曼光谱片段,具体包括以下子步骤:
6.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,在步骤S2中,对所述双通道数据进行随机线性叠加,具体为:将每种纯净物光
7.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,在步骤S4中,将所述编码数据输入至全连接层中,获得混合物组成成分概率输出,具体包括以下子步骤:
8.一种混合物光谱定性分析系统,其特征在于,包括:
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述混合物光谱定性分析方法。
...【技术特征摘要】
1.一种混合物光谱定性分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,执行步骤s1-s4获得光谱定性分析模型后,将待测混合物输入至所述光谱定性分析模型中,输出所述待测混合物的组成成分预测结果。
3.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,步骤s3中,将所述混合物类似物拉曼光谱数据输入至改进的卷积神经网络中进行多次卷积操作,具体包括以下子步骤:
4.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,在步骤s4中,将所述多维光谱特征图输入至transformer模型中进行多层transformer块的编码,获得编码数据,具体包括以下子步骤:
5.根据权利要求1所述的混合物光谱定性分析方法,其特征在于,在步骤s1中,对数据库中的纯净物光谱数据进行预处理后,截取所述纯净...
【专利技术属性】
技术研发人员:唐河山,梁培,
申请(专利权)人:厦门市帕兰提尔科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。