一种呼气分子分析气相色谱数据的自动化分析方法与系统技术方案

技术编号:37845832 阅读:15 留言:0更新日期:2023-06-14 22:30
本发明专利技术涉及一种呼气分子分析气相色谱数据的自动化分析方法与系统,所述方法包括:导入色谱图;质控处理,对数据集的数据进行预处理,去除谱图存在的噪音以及基线漂移,输出质控处理后的色谱图;峰位置的识别,对质控处理后的色谱图的数据进行峰位置的识别,并输出每个峰的峰位置信息进行定位;分峰拟合,对峰位置的识别获得的峰进行峰形态的拟合,校正峰位置并输出峰形态信息;峰定量与定性,基于校正峰位置与峰形态信息,计算峰下面积获得对应呼气分子的定量,确定当前峰对应的呼气分子。提高了呼气分子气相色谱分析的精度和可靠性,分析方法具备独特性,并能通过最佳峰拟合结果自动判定采用的分峰拟合函数,实现自动判断最优的拟合方式。的拟合方式。的拟合方式。

【技术实现步骤摘要】
一种呼气分子分析气相色谱数据的自动化分析方法与系统


[0001]本专利技术涉及呼气分子的分析和检测领域,尤其是一种呼气分子分析气相色谱数据的自动化分析方法与系统。

技术介绍

[0002]气相色谱是一种分离和检测物质的方法,它利用气相色谱柱将样品中的不同组分分离,然后对不同组分的气相色谱进行数据分析,通过检测器检测每个组分的峰面积等参数,以确定样品中是否存在特定的成分或呼气分子。气相色谱的数据分析通常涉及气相色谱图和色谱峰数据,气相色谱图显示了气相色谱系统中样品在色谱柱中的流动情况和分离情况,气相色谱图通常由多个峰组成,每个峰表示一个特定的呼气分子,色谱峰数据包括每个峰的峰面积、峰高、峰宽、保留时间等信息,通过这些信息可以确定呼气分子的类型、含量和分离效果。
[0003]通过气相色谱的数据分析可以确定样品中不同组分的含量和纯度,也可以对色谱仪的运行状态进行评估和调试,但现有的气相色谱的数据分析仍存在一些问题,具体为,气相色谱谱图数据量巨大,通常包含数千个数据点,并且,气相色谱谱图非常复杂,通常包含多个色谱峰,每个色谱峰对应不同的组分,不同组分的移动速度和保留时间不同,因此在谱图中可能出现色谱峰重叠的情况,还可能出现色谱柱老化或损坏,导致色谱峰变形,可见处理数据存在数据量大、谱图解析困难、色谱峰重叠和色谱峰变形等问题,导致气相色谱分析的精度和可靠性不高。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种呼气分子分析气相色谱数据自动化分析方法,达到提高呼气分子气相色谱分析的精度和可靠性的目的。具体为一种呼气分子分析气相色谱数据的自动化分析方法与系统,所述方法包括:导入色谱图,获取导入色谱图的数据集;质控处理,对数据集的数据进行预处理,去除色谱图存在的噪音以及基线漂移,输出质控处理后的色谱图;峰位置的识别,对质控处理后的色谱图的数据进行峰位置的识别,并输出每个峰的峰位置信息进行定位,所述峰位置信息包括峰的起点、顶点与终点位置信息;分峰拟合,对峰位置的识别获得的峰进行峰形态的拟合,校正峰位置信息,并输出峰形态信息;峰定量与定性,基于校正峰位置信息,计算峰下面积获得对应呼气分子的定量,与呼气分子对照表比对确定当前峰对应的呼气分子。
[0005]进一步地,所述质控处理包括基线校准和降噪;基线校准区分候选峰与噪音,基于谱图漂移右上方向的特性将候选峰的边界点设为锚点,将锚点进行连线,所述连线的组合为基线,根据基线找出候选峰和噪音;
基线校准后降噪,对色谱图进行高斯滤波,去除波动的噪音,完成降噪,输出质控处理后的色谱图。
[0006]进一步地,所述基线校准区分候选峰与噪音基于局部极值确定,包括:对于导入的色谱图曲线上的每个数据点,检查所述每个数据点是否在一定范围中心点周围的局部点中是最大值或最小值,如果该数据点是最大值或最小值,则该数据点被标记为候选峰的顶点;对于被标记为候选峰的顶点的数据点,检查该数据点是否符合候选峰值过滤选项中指定的约束条件,过滤选项中指定的约束条件设置为围绕当前顶点一定区间的标准差,阈值设置为当前顶点的切线斜率变化率;若候选峰的顶点一定区间标准差小于此阈值,该数据点将被过滤掉;若候选峰的区间标准差大于等于此阈值,该数据点将被保留,则该候选峰的顶点被设为锚点。
[0007]进一步地,所述峰位置的识别采用一阶导数法,基于一阶导数法自动找到序列中一连串交替的峰顶点与峰谷,再通过遍历该序列,拆分出每个独立的峰,并输出每个独立的峰位置信息,其中一阶导数法具体为,若一个正峰值位于一个位置i,所述正峰值处为峰顶点,则位置i

1处的一阶导数是正值,而位置i+1处的一阶导数是负值;若一个负峰值位于一个位置i,所述负峰值处为峰谷或峰起终点,则位置 i

1 处的导数是负值,而位置i+1 处的导数是正值。
[0008]进一步地,所述峰位置的识别采用二阶导数法,基于二阶导数法自动找到序列中一连串交替的峰顶点与峰谷,再通过遍历该序列,拆分出每个独立的峰,并输出每个独立的峰位置信息,其中二阶导数法具体为,若一个正峰值位于一个位置i,所述正峰值处为峰顶点,则位置i处的二阶导数为局部最小值;若一个负峰值位于一个位置i,所述负峰值处为峰谷或峰起终点,则位置i处的二阶导数为局部最大值。
[0009]进一步地,所述分峰拟合的过程采用非线性最小二乘法拟合算法,将一个非线性函数拟合到一个峰上获得拟合峰的拟合函数;针对每个峰,对比多个不同的拟合函数,找到最小拟合误差,确定误差最小的拟合峰,输出拟合后的新的峰位置信息,新的峰位置信息为校正峰位置信息。
[0010]进一步地,所述非线性函数为二次函数或多项式函数,所述非线性最小二乘法拟合算法为:S1设置初始参数,初始参数包括超参数和非线性函数的系数,通过手动设置或者通过自动寻优算法来设置初始参数;S2遍历数据点,遍历数据集中的所有数据点,对于每个数据点,计算出非线性函数在该点处的切线斜率;S3确定非线性函数的零点,所述非线性函数的零点为拟合函数在该数据点处的切线与水平直线相交的点,所述零点通过二分法或搜索算法确定;S4确定非线性函数的截距,所述非线性函数的截距为拟合函数在该数据点处的切线与水平直线的交点,所述截距通过二分法或搜索算法确定;
S5确定非线性函数的系数,根据所述零点和所述截距计算得到非线性函数的系数;S6更新参数,根据步骤S5确定的系数更新该数据点处非线性函数的参数。
[0011]S7重复上述步骤,重复上述步骤S2

S6,直到更新参数后不再对拟合结果产生显著影响,所述显著影响为拟合误差的连续三次变化未超过3%;S8输出拟合结果,将拟合结果输出,所述拟合结果包括非线性函数的系数、截距和零点。
[0012]进一步地,所述峰下面积基于梯形法则计算积分得到RT值,获得该峰对应呼气分子的定性RT。
[0013]进一步地,所述呼气分子对照表为系统自带或用户提供,将该峰对应呼气分子的定性RT与呼气分子对照表中呼气分子的RT区间比较,若当前峰的RT仅被一个呼气分子区间包含,即当前峰的RT仅被呼气分子的RT区间包含,则此峰为呼气分子;若当前峰的RT被两个呼气分子区间包含,即当前峰被呼气分子之间的RT区间包含,则计算当前峰的峰起点至终点区间与呼气分子之间的RT区间重合度,重合度高的呼气分子则判定为当前峰所对应的呼气分子;若当前峰的RT被两个以上呼气分子区间包含,判定方法与当前峰被两个呼气分子区间包含相同。
[0014]还涉及一种基于上述的呼气分子分析气相色谱数据自动化分析方法的系统,所述系统包括:色谱图导入模块,导入色谱图,获取导入色谱图的数据集;质控处理模块,对数据集的数据进行预处理,去除谱图存在的噪音以及基线漂移,输出质控处理后的色谱图;峰位置的识别模块,对质控处理后的色谱图的数据进行峰位置的识别,并输出每个峰的峰位置信息进行定位,所述峰位置信息包括峰的起点、顶点与终点位置信息;分峰拟合模块,对峰位置的识别获得的峰进行峰形态的拟合,校正峰位置信息;峰定量与定性模块,基于校正本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种呼气分子分析气相色谱数据的自动化分析方法,其特征在于,所述方法包括:导入色谱图,获取导入色谱图的数据集;质控处理,对数据集的数据进行预处理,去除色谱图存在的噪音以及基线漂移,输出质控处理后的色谱图;峰位置的识别,对质控处理后的色谱图的数据进行峰位置的识别,并输出每个峰的峰位置信息进行定位,所述峰位置信息包括峰的起点、顶点与终点位置信息;分峰拟合,对峰位置的识别获得的峰进行峰形态的拟合,校正峰位置信息,并输出峰形态信息;峰定量与定性,基于校正峰位置信息,计算峰下面积获得对应呼气分子的定量,与呼气分子对照表比对确定当前峰对应的呼气分子。2.根据权利要求1所述的一种呼气分子分析气相色谱数据的自动化分析方法,其特征在于,所述质控处理包括基线校准和降噪;基线校准区分候选峰与噪音,基于谱图漂移右上方向的特性将候选峰的边界点设为锚点,将锚点进行连线,所述连线的组合为基线,根据基线找出候选峰和噪音;基线校准后降噪,对色谱图进行高斯滤波,去除波动的噪音,完成降噪,输出质控处理后的色谱图。3.根据权利要求2所述的一种呼气分子分析气相色谱数据的自动化分析方法,其特征在于,所述基线校准区分候选峰与噪音基于局部极值确定,包括:对于导入的色谱图曲线上的每个数据点,检查所述每个数据点是否在一定范围中心点周围的局部点中是最大值或最小值,如果该数据点是最大值或最小值,则该数据点被标记为候选峰的顶点;对于被标记为候选峰的顶点的数据点,检查该数据点是否符合候选峰值过滤选项中指定的约束条件,过滤选项中指定的约束条件设置为围绕当前顶点一定区间的标准差,阈值设置为当前顶点的切线斜率变化率;若候选峰的顶点一定区间标准差小于此阈值,该数据点将被过滤掉;若候选峰的区间标准差大于等于此阈值,该数据点将被保留,则该候选峰的顶点被设为锚点。4.根据权利要求1所述的一种呼气分子分析气相色谱数据的自动化分析方法,其特征在于,所述峰位置的识别采用一阶导数法,基于一阶导数法自动找到序列中一连串交替的峰顶点与峰谷,再通过遍历该序列,拆分出每个独立的峰,并输出每个独立的峰位置信息,其中一阶导数法具体为,若一个正峰值位于一个位置i,所述正峰值处为峰顶点,则位置i

1处的一阶导数是正值,而位置i+1处的一阶导数是负值;若一个负峰值位于一个位置i,所述负峰值处为峰谷或峰起终点,则位置 i

1 处的导数是负值,而位置i+1 处的导数是正值。5.根据权利要求1所述的一种呼气分子分析气相色谱数据的自动化分析方法,其特征在于,
所述峰位置的识别采用二阶导数法,基于二阶导数法自动找到序列中一连串交替的峰顶点与峰谷,再通过遍历该序列,拆分出每个独立的峰,并输出每个独立的峰位置信息,其中二阶导数法具体为,若一个正峰值位于一个位置i,所述正峰值处为峰顶点,则位置i处的二阶导数为局部最小值;若一个负峰值位于一个位置i,所述负峰值处为峰谷或峰起终点,则位置i处的二阶导数为局部最大值。6.根据权利要求1所述的一种呼气分子分析气相色谱数据的自...

【专利技术属性】
技术研发人员:陈思彤王俊奇樊鹏南林雨航邓月喜
申请(专利权)人:精智未来广州智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1