System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种病原体宏基因组测序数据的分析方法、装置及其应用制造方法及图纸_技高网

一种病原体宏基因组测序数据的分析方法、装置及其应用制造方法及图纸

技术编号:40343602 阅读:6 留言:0更新日期:2024-02-09 14:30
本发明专利技术属于病原体感染检测领域,具体地,涉及一种病原体宏基因组测序数据的分析方法、装置及其应用,更具体地,涉及一种病原体宏基因组测序数据的疑似病原体判定分析方法、装置及其应用。本发明专利技术提供了一种病原体宏基因组测序数据的分析方法,包括如下步骤:S1、获取病原体宏基因组测序报阳数据步骤;S2、对报阳数据进行特定病原体的疑似病原体判定;以及S3、输出最终报阳和疑似病原体结果。

【技术实现步骤摘要】

本专利技术属于病原体感染检测领域,具体地,涉及一种病原体宏基因组测序数据的分析方法、装置及其应用,更具体地,涉及一种病原体宏基因组测序数据的疑似病原体判定分析方法、装置及其应用。


技术介绍

1、病原学的精准诊断对于感染性疾病的诊断和治疗具有重要意义。传统的病原学诊断高度依赖于临床医师的经验,通常根据患者的临床表现做出病原体的鉴别诊断,针对可疑的病原体进行检测,逐一排查;因传统检测方法的局限性往往无法兼顾罕见致病病原体和混合感染等情况,而宏基因组第二代测序(metagenomics next generationsequencing,简称mngs)技术可以快速、无偏倚地同时检测多种病原体。典型的mngs生物信息学流程由来自原始输入fastq文件的一系列分析步骤组成,包括质量和低复杂性过滤、接头过滤、人类宿主去除、通过与参考数据库比对进行微生物鉴定、可选的序列组装以及在科、属和种的水平上对单个读数和/或连续序列(重叠群)进行分类。

2、病原体宏基因组测序目前需花费大量时间、专业解读人员,并对报告进行审核,输出报阳结果。但是输出的报阳结果会对某些特定检出丰度过低的胞内菌、厚壁菌,检出丰度最高的条件致病菌及其他干扰菌等产生遗漏,而往往这些病原体在临床上也是导致感染的原因之一,因此,本领域需求一种分析方法,能够对报阳结果进行疑似病原体判定,避免出现漏报的情况,为临床诊断提供更为准确的支持。


技术实现思路

1、有鉴于此,第一方面,本专利技术提供一种病原体宏基因组测序数据的分析方法,包括如下步骤:

2、s1、获取病原体宏基因组测序报阳数据,所述报阳数据包括病原体宏基因组测序的阳性数据、原始数据;

3、s2、对报阳数据进行疑似病原体判定;以及

4、s3、输出最终报阳和疑似病原体结果步骤。

5、进一步地,所述分析方法还包括构建解读库的步骤。所述解读库可以包括阳性库;

6、更进一步地,所述阳性库构建包括以下步骤:

7、获取已知阳性样本的报告结果,以及与其对应的已知阳性样本的测序数据,将报告结果和测序数据一一对应并标注,从而构建解读库;以及

8、获取所述病原体在解读库中的报阳次数和总检出次数的比值,将所述比值与第一阈值进行比较,当所述比值大于第一阈值时,将所述病原体标注为疑似病原体。

9、进一步地,所述第一阈值为80%。当第一阈值为80%时,其判断疑似病原体的准确度更高。

10、所述构建解读库的步骤可以在s1步骤之前,也可以在s1步骤之后,也可以在s2步骤之前。

11、进一步地,所述报告结果包括阳性病原体、疑似病原体及检出的耐药基因;所述测序数据包括特异性reads数、样本编号、对应拉丁文名、基因组覆盖度、相对丰度、类别、对应属名、rpm、致病信息等测序数据常规所具有的数据。

12、进一步地,阳性样本的数量不小于200例,优选不小于1000例,更优选不小于3000例。

13、进一步地,阴性样本的数量不小于50例,优选不小于100例,更优选不小于300例。

14、在一些具体的实施方案中,所述s2步骤进一步包括如下步骤:

15、基于所述病原体在解读库中检出次数,设定解读库中该病原体的reads数的第二阈值;以及

16、将报阳数据中所述病原体的reads数与解读库中该病原体的reads数的第二阈值进行比较,进行疑似病原体判定。

17、在一些具体的实施方案中,所述s2步骤进一步包括如下疑似病原体判定条件:

18、进一步包括当所述样本为血液样本和呼吸道样本时,包括如下任一项或多项的疑似病原体判定条件:

19、当所述病原体在解读库中疑似结果占总检出次数的比值大于10%时,报阳数据中所述病原体的reads数大于等于解读库中该病原体read数由低到高排序排在第50%的病原体的reads数,报阳数据中所述病原体直接判定为疑似病原体;或者

20、当所述病原体在解读库中疑似结果占总检出次数的比值大于15%时,报阳数据中所述病原体的reads数大于等于解读库中该病原体read数由低到高排序排在第25%的病原体的reads数,报阳数据中所述病原体直接判定为疑似病原体;或者

21、当所述病原体在解读库中疑似结果占总检出次数的比值大于20%时,报阳数据中所述病原体的reads数大于等于解读库中该病原体read数由低到高排序排在第10%的病原体的reads数,报阳数据中所述病原体直接判定为疑似病原体。

22、具体地,例如,当所述病原体在解读库中疑似结果占总检出次数的比值大于20%时,其第二阈值就为解读库中该病原体read数由低到高排序排在第10%的病原体的reads数,如果该reads数为5,则第二阈值为5。

23、优选地,上述疑似病原体判定条件可以全部进行判定,即首先判定其比值是否大于10%,再与在第50%的病原体的reads数进行比较,然后再判定其比值是否大于15%,再与在第25%的病原体的reads数进行比较,最后再判定其比值是否大于20%,再与在第10%的病原体的reads数进行比较,只要再判定过程中满足任意一项判定条件,即可终止判定,并将病原体判定为疑似病原体。通过这种判定方式,使得疑似病原体的判定精度更高。

24、在一些具体的实施方案中,所述s2步骤进一步包括如下疑似病原体判定条件:

25、当所述样本为脑脊液样本时,包括如下任一项或多项的疑似病原体判定条件:

26、当所述病原体在解读库中疑似结果占总检出次数的比值大于5%时,报阳数据中所述病原体的reads数大于等于解读库中该病原体read数由低到高排序排在第50%的病原体的reads数,报阳数据中所述病原体直接判定为疑似病原体;或者

27、当所述病原体在解读库中疑似结果占总检出次数的比值大于10%时,报阳数据中所述病原体的reads数大于等于解读库中该病原体read数由低到高排序排在第25%的病原体的reads数,报阳数据中所述病原体直接判定为疑似病原体。

28、优选地,上述疑似病原体判定条件可以全部进行判定,即首先判定其比值是否大于5%,再与在第50%的病原体的reads数进行比较,然后再判定其比值是否大于10%,再与在第25%的病原体的reads数进行比较,只要再判定过程中满足任意一项判定条件,即可终止判定,并将病原体判定为疑似病原体。通过这种判定方式,使得疑似病原体的判定精度更高。

29、在一些具体的实施方案中,所述s2步骤进一步包括:

30、当报阳数据中所述病原体为解读库中标注的疑似病原体时,报阳数据中所述病原体直接判定为疑似病原体。

31、在一些具体的实施方案中,当报阳数据中所述病原体为细菌时,如果该病原体在解读库中的reads数在top40,则进行上述疑似病原体判定。通过设定前置条件,使得检出复杂度较高的细菌种类,获得更好的疑似病本文档来自技高网...

【技术保护点】

1.一种病原体宏基因组测序数据的分析方法,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,所述分析方法还包括构建解读库的步骤。

3.根据权利要求2所述的方法,其特征在于,所述解读库包括阳性库,所述阳性库构建包括以下步骤:

4.根据权利要求1所述的方法,其特征在于,所述第一阈值为80%。

5.根据权利要求1所述的方法,其特征在于,所述S2步骤进一步包括如下步骤:

6.根据权利要求5所述的方法,其特征在于,所述S2步骤进一步包括如下疑似病原体判定条件:

7.根据权利要求5所述的方法,其特征在于,所述S2步骤进一步包括如下疑似病原体判定条件:

8.根据权利要求3所述的方法,其特征在于,所述S2步骤进一步包括:

9.一种如权利要求1~8中任一项所述的病原体宏基因组测序数据的分析方法在制备病原体宏基因组测序数据的装置中的应用。

10.一种病原体宏基因组测序数据分析的装置,包括:

11.根据权利要求10所述的装置,其特征在于,所述装置进一步包括构建解读库模块。p>

12.一种病原体宏基因组测序数据分析的设备,包括:

13.一种存储介质,所述存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现如权利要求1~8中任一项所述的病原体宏基因组测序数据的分析方法。

...

【技术特征摘要】

1.一种病原体宏基因组测序数据的分析方法,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,所述分析方法还包括构建解读库的步骤。

3.根据权利要求2所述的方法,其特征在于,所述解读库包括阳性库,所述阳性库构建包括以下步骤:

4.根据权利要求1所述的方法,其特征在于,所述第一阈值为80%。

5.根据权利要求1所述的方法,其特征在于,所述s2步骤进一步包括如下步骤:

6.根据权利要求5所述的方法,其特征在于,所述s2步骤进一步包括如下疑似病原体判定条件:

7.根据权利要求5所述的方法,其特征在于,所述s2步骤进一步包括如下疑似病原...

【专利技术属性】
技术研发人员:杨丽刘佳朱鸿坤戴立忠李赛邓小龙陈姮玉
申请(专利权)人:圣维数智成都基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1