System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物医学,具体涉及一种基于代谢物的自发性早产风险预测模型及其构建方法和应用。
技术介绍
1、早产(ptb)是全世界的一个重大公共卫生问题。它是导致小于5岁婴儿死亡的直接原因,与存活婴儿的严重并发症具有极大的相关性。每年全世界约有15万新生儿早产,占全球活产儿总数的11%,早产率从几个欧洲国家的约5%到非洲的18%不等。在过去的20年里,早产率一直在稳步上升。在全球65个国家中,超90%国家的早产率在过去1年内都有所上升。2010年全球早产率约为6.14%,相当于约8万活产儿,其中约81.1%发生在亚洲和撒哈拉以南非洲。超过75%的围生儿死亡率以及50%的围产期和远期疾病与早产相关联。早产是全球儿科人群死亡的主要原因。随着过去几十年新生儿护理技术的重大进步,早产儿(妊娠37周<)的存活率有所提高,特别是极早产儿(妊娠28周<)的存活率有所提高。尽管技术进步提高了这些脆弱人群的生存率,但早产仍与严重的并发症相关,包括ivh、nec、bpd和感觉障碍。
2、目前,发达国家中约有占所有分娩的12.5%的早产案例,并且与死亡率和发病率的显着增加有关。who将早产定义为妊娠37周前或自女性末次月经第一天起少于259日的所有分娩。早产可根据胎龄进一步细分:极早产(<28周)、早产(28-<32周)和中度早产(妊娠32-<37周)。且导致长期并发症,不良结局的机率和严重程度随着胎龄的降低和护理质量的降低而增加。早产有两种类型——自发性和医源性。在受自发性早产影响的病例中,宫缩在第37周之前开始,
3、此外,因机器学习的发展对生物学产生的新见解,即在理解从现代高通量实验中收集或生成的大量数据的结果或趋势方面提供了诸多可能性。机器学习常用的的工具包括随机森林、支持向量机、人工神经网络和遗传算法。在处理代谢组学步骤中,监督机器学习方法有助于峰值选取、归一化和缺失数据插补。对于知识驱动的分析,机器学习有助于生物标志物检测、分类和回归、生化途径识别等。因而,更好地了解潜在变量并使用机器学习方法来开发更好地预测sptb的新方法至关重要。
技术实现思路
1、本专利技术的目的是提供一种基于代谢物的自发性早产风险预测模型及其构建方法,通过3-丙酸、povpc、亚油酸肉碱和磷脂酰肌醇4种代谢物进行构建,能可靠地反映胎儿缺陷或产前异常的风险。
2、为实现上述目的,本专利技术提供了如下方案:
3、本专利技术提供一种基于代谢物的自发性早产风险预测模型,所述基于代谢物的自发性早产风险预测模型基于4种代谢物进行构建,所述4种代谢物为3-丙酸、povpc、亚油酸肉碱和磷脂酰肌醇。
4、本专利技术还提供一种基于代谢物的自发性早产风险预测模型的构建方法,包括以下步骤:
5、(1)样本的收集:选择自发性早产病例作为早产组,选择分娩胎龄不小于37周的参与者作为对照组,分别收集早产组和对照组的血浆;
6、(2)质谱前样本的处理:将步骤(1)中收集的血浆进行代谢物提取,进行代谢组学样本前处理;
7、(3)质谱检测:将步骤(2)中进行血浆样本前处理后的血浆样本进行色谱检测和高分辨质谱检测;
8、(4)质谱的数据处理:将经步骤(3)检测后的数据进行代谢物鉴定、数据归一化、缺失值填充、数据转换;
9、(5)代谢物风险预测模型的构建:将经步骤(4)处理后的数据经生信分析后通过机器学习建立基于3-丙酸、povpc、亚油酸肉碱和磷脂酰肌醇4种代谢物的代谢物风险预测模型。
10、进一步的,在步骤(2)中,所述代谢物提取的具体步骤为:4℃环境下解冻所述步骤(1)中收集的血浆样本,精确取100μl样本,加入4倍体积的提取试剂进行代谢物提取,至于摇床上1500rpm,20min振荡混合,混匀后,将96孔板置于离心机中,2200g,4℃条件下离心10min;离心结束后,将全部上清进行冻干;当进行检测时,取冻干样本加入200μl的复溶剂(0.1%fa水,含混合同位素内标溶液)进行复溶,质谱上机5μl用于定量分析。
11、进一步的,在步骤(3)中,所述色谱检测的条件为:将所述步骤(2)中处理的样品在vanquish超高效液相色谱仪上通过反相色谱柱和亲水色谱柱对其中的代谢物进行分离,然后再分别进行高分辨质谱检测;流动相为水/甲醇,溶剂均加入0.1%fa和2mm甲酸铵缓冲盐,代谢物在acquitytm beh c18(waters co.,usa,1.7μm,2.1×100mm)柱子上分离,洗脱梯度如下:12min内有机相从2%升高到100%,多余的6min用于冲洗和平衡柱子;流速和柱温分别为0.3ml/min和40℃,分别采用正离子或负离子模式进行检测。
12、进一步的,在步骤(3)中,所述高分辨质谱检测的条件为:代谢物检测在质谱仪qexactive plus质谱仪上完成,数据依赖型采集方式采集数据;质谱采用加热电喷雾离子源,正离子检测模式离子化电压为4kv,负离子检测模式为3.5kv,鞘气流速为45arb,辅助气体流速为10arb,加热器温度为355℃,毛细管温度为320℃,离子传输透镜rf水平为50%;全扫分辨率为70,000@m/z200,agc为1e6,最大离子进样时间为100ms,扫描质核比范围为70~1050m/z,二级扫描分辨率为17,500@m/z 200,agc为1e5,最大离子进样时间为50ms扫描质核比范围为70~1050m/z,标准化碰撞能量为40%,使用超纯氮气作为碎裂气体。
13、进一步的,在步骤(4)中,所述代谢物鉴定使用compound discoverer软件处理全扫描和数据依赖性ms2代谢谱数据,以进行全面的组分提取;采用xcalibur quan browser提取总离子流图曲线下面积值作为代谢物的定量信息提取;代谢物结构鉴定通过比对检测获得的一级、二级质谱图与本平台自建标准品ms/ms数据库,hmdb数据库,nist数据库和mzcloud数据库进行匹配打分,对于代谢物鉴定或结构注释,先决条件为母离子质量准确性介于±5ppm范围内,保留时间偏差介于±0.2min范围内,同位素信息和相对同位素丰度模式拟合分数70%用于确认化学式;所述同位素信息为10ppm范围内至少包本文档来自技高网...
【技术保护点】
1.一种基于代谢物的自发性早产风险预测模型,其特征在于,所述基于代谢物的自发性早产风险预测模型基于4种代谢物进行构建,所述4种代谢物为3-丙酸、Povpc、亚油酸肉碱和磷脂酰肌醇。
2.一种基于代谢物的自发性早产风险预测模型的构建方法,其特征在于,包括以下步骤:
3.根据权利要求2所述的构建方法,其特征在于,在步骤(2)中,所述代谢物提取的具体步骤为:4 ℃环境下解冻所述步骤(1)中收集的血浆样本,精确取100 µL样本,加入4倍体积的提取试剂进行代谢物提取,至于摇床上1500 rpm,20 min振荡混合,混匀后,将96孔板置于离心机中,2200 g,4℃条件下离心10 min;离心结束后,将全部上清进行冻干;当进行检测时,取冻干样本加入200 µL的复溶剂(0.1%FA水,含混合同位素内标溶液)进行复溶,质谱上机5 µL用于定量分析。
4.根据权利要求2所述的构建方法,其特征在于,在步骤(3)中,所述色谱检测的条件为:将所述步骤(2)中处理的样品在Vanquish超高效液相色谱仪上通过反相色谱柱和亲水色谱柱对其中的代谢物进行分离,然后再分别
5.根据权利要求2所述的构建方法,其特征在于,在步骤(3)中,所述高分辨质谱检测的条件为:代谢物检测在质谱仪Q Exactive Plus质谱仪上完成,数据依赖型采集方式采集数据;质谱采用加热电喷雾离子源,正离子检测模式离子化电压为4K V,负离子检测模式为3.5K V,鞘气流速为45 arb,辅助气体流速为10 arb,加热器温度为355 ℃,毛细管温度为320 ℃,离子传输透镜RF水平为50%;全扫分辨率为70,000 @ m/z 200,AGC为1E6,最大离子进样时间为100 ms,扫描质核比范围为70~1050 m/z,二级扫描分辨率为17,500 @ m/z200,AGC为1E5,最大离子进样时间为50 ms扫描质核比范围为70~1050 m/z,标准化碰撞能量为40%,使用超纯氮气作为碎裂气体。
6.根据权利要求2所述的构建方法,其特征在于,在步骤(4)中,所述代谢物鉴定使用Compound Discoverer软件处理全扫描和数据依赖性MS2代谢谱数据,以进行全面的组分提取;采用XCalibur Quan Browser提取总离子流图曲线下面积值作为代谢物的定量信息提取;代谢物结构鉴定通过比对检测获得的一级、二级质谱图与本平台自建标准品MS/MS数据库,HMDB数据库,NIST数据库和mzCloud数据库进行匹配打分,对于代谢物鉴定或结构注释,先决条件为母离子质量准确性介于± 5 ppm范围内,保留时间偏差介于± 0.2 min范围内,同位素信息和相对同位素丰度模式拟合分数70%用于确认化学式;所述同位素信息为10ppm范围内至少包含一个同位素;最终鉴定打分score值大于80的代谢物注释结果再次经过专业技术人员人工审核后,将来自多种检测方法的代谢物定量原始信息合并在一起,合并过程中,将重复检测到的代谢物定量信息排除,以保证代谢物定量信息的独特性,数据合并后再进行数据预处理过程;
7.根据权利要求2所述的构建方法,其特征在于,在步骤(5)中,所述生信分析包括代谢组学质控分析、差异代谢组学分析。
8.根据权利要求2所述的构建方法,其特征在于,在步骤(5)中,所述机器学习的具体步骤为:
9.根据权利要求8所述的构建方法,其特征在于,在步骤S3中,所述顺序特征选择方法需要复位的参数有两个:n_features_to_select,范围为1到10,间隔为1;还分别进行正向选择和反向选择的方向。
10.如权利要求1所述的基于代谢物的自发性早产风险预测模型在预测自发性早产风险中的应用。
...【技术特征摘要】
1.一种基于代谢物的自发性早产风险预测模型,其特征在于,所述基于代谢物的自发性早产风险预测模型基于4种代谢物进行构建,所述4种代谢物为3-丙酸、povpc、亚油酸肉碱和磷脂酰肌醇。
2.一种基于代谢物的自发性早产风险预测模型的构建方法,其特征在于,包括以下步骤:
3.根据权利要求2所述的构建方法,其特征在于,在步骤(2)中,所述代谢物提取的具体步骤为:4 ℃环境下解冻所述步骤(1)中收集的血浆样本,精确取100 µl样本,加入4倍体积的提取试剂进行代谢物提取,至于摇床上1500 rpm,20 min振荡混合,混匀后,将96孔板置于离心机中,2200 g,4℃条件下离心10 min;离心结束后,将全部上清进行冻干;当进行检测时,取冻干样本加入200 µl的复溶剂(0.1%fa水,含混合同位素内标溶液)进行复溶,质谱上机5 µl用于定量分析。
4.根据权利要求2所述的构建方法,其特征在于,在步骤(3)中,所述色谱检测的条件为:将所述步骤(2)中处理的样品在vanquish超高效液相色谱仪上通过反相色谱柱和亲水色谱柱对其中的代谢物进行分离,然后再分别进行高分辨质谱检测;流动相为水/甲醇,溶剂均加入0.1% fa和2 mm甲酸铵缓冲盐,代谢物在acquitytm beh c18(waters co., usa,1.7 μm, 2.1 × 100 mm)柱子上分离,洗脱梯度如下:12 min内有机相从2%升高到100%,多余的6 min用于冲洗和平衡柱子;流速和柱温分别为0.3 ml/min和40 ℃,分别采用正离子或负离子模式进行检测。
5.根据权利要求2所述的构建方法,其特征在于,在步骤(3)中,所述高分辨质谱检测的条件为:代谢物检测在质谱仪q exactive plus质谱仪上完成,数据依赖型采集方式采集数据;质谱采用加热电喷雾离子源,正离子检测模式离子化电压为4k v,负离子检测模式为3.5k v,鞘气流速为45 arb,辅助气体流速为10 arb,加热器温度为355 ℃,毛细管温度为320 ℃,离子传输透镜rf水平为...
【专利技术属性】
技术研发人员:朱怡冰,王心睿,曹华,缪崇,潘勉,周岳,张伟,
申请(专利权)人:福建省妇幼保健院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。