System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于肠道菌群生物标志物筛选,特别涉及一种挖掘自闭症肠道菌群生物标志物的方法。
技术介绍
1、自闭症谱系障碍(asd)是一种严重的广泛性发育障碍,其特征是社交和沟通困难、重复行为和兴趣受限等心理发育障碍,严重影响患儿的社会功能和生活质量。2023年3月24日美国疾控中心发布消息,公布了最新自闭症患病率的筛查数据。每36名8岁儿童中就有1名患有自闭症症谱系障碍(asd),据中国残疾人普查报告数据显示,目前我国孤独症患者已超1300万人,以每年近20万的速度增长,自闭症发病率已占各类精神残疾首位。
2、目前已经通过动物和临床实验证实,自闭症谱系障碍(asd)与肠道菌群的紊乱密切相关,并且通过干预肠道菌群可能会影响asd症状的改变。如专利申请202010183758.9所公开的与自闭症相关的肠道菌群生物标志物及其应用。该申请发现肠道菌群可以辅助肠道毒物的降解,减少线粒体因毒物积累带来的损伤以及由此诱发的asd的发生。本专利技术提供的与asd相关的肠道菌群生物标志物包括5条代谢通路,涉及31种酶类,利用该生物标志物进行asd的诊断和患病风险评估具有较高的准确性、敏感性和特异性,且样本采集便捷、不会造成机体损伤、检测方便快速、可进行定期检测,及早发现肠道毒物降解能力的变化,辅助asd的早期诊断和筛查,为指导治疗及康复方案的及时调整提供依据。
3、目前,菌群移植(fmt)是一种最具代表性的肠道菌群干预方法。fmt是一种治疗技术,通过将从健康人体粪便中提取的菌群移植到相应患者的肠道内,以重建肠道菌群的结构。fm
4、对于fmt能否更有效地治疗asd患者,其关键在于选择的供体是否含有丰富的与自闭症相关的肠道菌群生物标志物。根据研究报道来看,菌群移植对于asd有治疗作用,但目前对菌群移植治疗所采用的菌群并无法有确切的定量数据或定植量化指标,并且不同菌群移植供体所提供的样本差异性也较大,因此对于肠道菌群生物标志物的挑选十分重要,这能给后续fmt治疗选择供体给予有利帮助。
技术实现思路
1、本专利技术的首要目地是提供一种挖掘自闭症肠道菌群生物标志物的方法,该方法结合现有数据库和不同人群的信息,使用荟萃分析等多种特征选择方法挑选具有代表性的菌属分类单元,有利于区分自闭症患者与健康人群。同时,通过评估模型性能进一步判断菌属特征的富集情况。
2、本专利技术的另一目的在于提供一种挖掘自闭症肠道菌群生物标志物的方法得到的肠菌标志物组合,所述标志物组合为:自闭症患者中富集的菌属为butyricimonas、enterocloster、bacteroides、eubacterium、parabacteroides、bilophila、ruminococcus、veillonella;自闭症患者中缺失的菌属为collinsella、gemella、klebsiella、prevotella、bifidobacterium、lactobacillus、gemmiger、coprococcus、comamonas。
3、为实现上述目的,本专利技术的技术方案为:
4、一种挖掘自闭症肠道菌群生物标志物的方法,该方法包含以下步骤:
5、步骤1,收集自闭症患者和健康人群的肠道菌群数据和临床数据,建立对应的数据库;
6、步骤2,针对不同的研究数据,基于相同的处理流程和参数进行16s分析;
7、步骤3,使用多种机器学习分类器,对比不同分类器下的模型性能,进而选择较优的分类器;
8、步骤4,采用特征选择方法,挑选与自闭症相关的肠道菌群生物标志物;
9、步骤5,评估不同方法挑选的生物标志物的合理性,选择具有代表性的与自闭症相关的肠道菌群生物标志物。
10、本专利技术通过收集自闭症患者及健康人群的临床信息,并在后续分析步骤中结合全面的信息,获取肠道菌群多元化信息,进而分析出在自闭症患者中富集和缺失的菌属分类单元。
11、进一步,所述步骤1为收集临床自闭症患者和健康人群的肠道菌群数据,建立对应的数据库;数据库包括测序下机数据、测序引物、测序区域、建库方式、测序平台、样本临床数据等。
12、上述的菌群数据,可以是基于相关研究文献收集的临床自闭症患者和健康人群的肠道菌群数据,也可以是用户自行收集的自闭症患者和健康人群的肠道菌群数据,通过这些菌群数据的收集建立对应的数据库。
13、进一步,所述步骤2为针对不同的研究数据,基于相同的生物信息分析参数进行16s测序分析,通过16s测序分析,对自闭症患者以及健康人群的肠道菌群进行高通量测序,通过分析序列了解在不同个体中肠道菌群的构成情况,研究不同个体样本中菌群的物种分类、物种丰度,通过zotus分析,探究样本中菌群的多样性和不同菌群的丰度。16s测序分析中的数据首先要进行预处理,所述预处理是根据不同研究的参数对数据进行预处理,这其中包含测序区域、测序平台、引物、单端或双端等参数;同时,在该步骤中事先对收集的文献数据进行分类,基于相同的生物信息分析参数进行16s分析,得到对应的zotus表及其对应的注释结果。基于相同分析参数所得的结果在荟萃分析中能保证一致性,进而得到可信的菌属特征。
14、进一步,所述步骤3为使用多种机器学习分类器,选择性能较优的分类器。机器学习分类器对所有菌属特征进行建模,用roc曲线来评估分类器的性能,使用的分类器包括:knn,naive bayes,decision tree,rf,svm,logistic regression,gradient boosting,adaboost,lightgbm,catboost和xgboost。
15、对比不同分类器的性能,选择十折交叉验证auc最高的分类器用于后续特征选择。
16、进一步,所述步骤4为通过多种特征选择程序挑选自闭症患者与健康人群之间的菌属特征,采用的特征选择包括:荟萃分析差异菌属,powershap,borutashap,borutashap-gini,shapicant,forward feature selection,chi-square,f test,random forest。
17、其中荟萃分析采用二分类变量法对研究数据进行分析计算,得到风险比rr、比值比or以及风险差rd,以or值来分析自闭症患者与健康人群肠道菌群中富集的菌属;根据or值来判断在不同个体中肠道菌群中的富集菌属,or>1时,认为该菌属在健康人群中富集,有利于治疗自闭症;相反,or<本文档来自技高网...
【技术保护点】
1.一种挖掘自闭症肠道菌群生物标志物的方法,其特征在于包含以下步骤:
2.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤1中,所述步骤1为收集临床自闭症患者和健康人群的肠道菌群数据,建立对应的数据库;数据库包括测序下机数据、测序引物、测序区域、建库方式、测序平台、样本临床数据。
3.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤2中,16S测序分析中的数据首先要进行预处理,所述预处理是根据不同研究的建库和测序方法对数据进行预处理,这其中包含测序区域、测序平台、引物、单端或双端测序等参数;同时,在该步骤中事先对收集的文献数据进行分类,基于相同的参数进行16S分析,得到对应的zOTUs表及其对应的注释结果。
4.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤3中,选择机器学习分类器对所有菌属特征进行建模,用ROC曲线来评估分类器的性能,使用的分类器包括:KNN,Naive Bayes,Decision Tree,RF,SVM,Logistic Regression,Gra
5.如权利要求4所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤3中,对比不同分类器的性能,选择十折交叉验证AUC最高的分类器用于后续特征选择。
6.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤4中,使用特征选择程序挑选自闭症患者与健康人群之间的菌属特征,采用的特征选择包括:荟萃分析差异菌属,Powershap,Borutashap,Borutashap-Gini,Shapicant,ForwardFeature Selection,chi-square,F test,Random Forest。
7.如权利要求6所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于荟萃分析中通过计算比值比OR,比较自闭症患者组以及健康人群组中菌群的富集;采用二分类变量法对研究数据进行分析计算,得到风险比RR、比值比OR以及风险差RD,以OR值来分析自闭症患者与健康人群肠道菌群中富集的菌属;荟萃分析根据OR值来判断在不同个体中肠道菌群中的富集菌属,OR>1时,认为该菌属在健康人群中富集,有利于治疗自闭症;相反,OR<1时,则认为该菌属在自闭症患者中富集,能够促进自闭症的进展。同时能通过模型特征重要性解释器判断菌属富集情况,进行重要性排序后SHAP值越大表示特征丰度水平高的人群中该特征越具有代表性。
8.如权利要求6所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于Powershap,Borutashap,Borutashap-Gini,Shapicant来源于三个python软件包;ForwardFeature Selection为前向特征选择的迭代过程;chi-square,F test都是差异检验方法筛选分类变量间有显著性差异的菌属;Random Forest重要性排名前30、20、15的菌属和所有菌属都使用feature_importances_函数进行重要性排序,feature_importances_是scikit-learn机器学习库中许多模型对象的属性,在训练模型之后调用该属性可以输出各个特征在模型中的重要性;进行重要性排序后SHAP值越大表示特征丰度水平高的人群中该特征越具有代表性。
9.一种如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法及生物标志物,其特征在于所述与自闭症相关的肠道菌群生物标志物包括自闭症患者中富集的菌属和自闭症患者中缺失的菌属组合;
...【技术特征摘要】
1.一种挖掘自闭症肠道菌群生物标志物的方法,其特征在于包含以下步骤:
2.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤1中,所述步骤1为收集临床自闭症患者和健康人群的肠道菌群数据,建立对应的数据库;数据库包括测序下机数据、测序引物、测序区域、建库方式、测序平台、样本临床数据。
3.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤2中,16s测序分析中的数据首先要进行预处理,所述预处理是根据不同研究的建库和测序方法对数据进行预处理,这其中包含测序区域、测序平台、引物、单端或双端测序等参数;同时,在该步骤中事先对收集的文献数据进行分类,基于相同的参数进行16s分析,得到对应的zotus表及其对应的注释结果。
4.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤3中,选择机器学习分类器对所有菌属特征进行建模,用roc曲线来评估分类器的性能,使用的分类器包括:knn,naive bayes,decision tree,rf,svm,logistic regression,gradient boosting,adaboost,lightgbm,catboost和xgboost。
5.如权利要求4所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤3中,对比不同分类器的性能,选择十折交叉验证auc最高的分类器用于后续特征选择。
6.如权利要求1所述的挖掘自闭症肠道菌群生物标志物的方法,其特征在于所述步骤4中,使用特征选择程序挑选自闭症患者与健康人群之间的菌属特征,采用的特征选择包括:荟萃分析差异菌属,powershap,borutashap,borutashap-gini,shapicant,forwardfeature selection,c...
【专利技术属性】
技术研发人员:曹曼,张帮周,许佳颖,兰彬源,罗联根,肖传兴,何剑全,
申请(专利权)人:上海承葛生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。