System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于宏基因组的食源性暴发事件溯源方法和系统技术方案_技高网

一种基于宏基因组的食源性暴发事件溯源方法和系统技术方案

技术编号:42733069 阅读:1 留言:0更新日期:2024-09-18 13:30
本发明专利技术提出了一种基于宏基因组的食源性暴发事件溯源方法和系统,属于生物信息学技术领域。本发明专利技术首先通过运行基于k‑mer算法的快速比对软件对食源性暴发事件样本宏基因组测序数据进行物种分类并计算相对丰度、rPM得到物种丰度表,进而根据物种丰度表和三级十二维现场流行病学数据量表运用随机森林模型,初步判定食源性暴发事件的条件致病菌;通过识别并抓取各样本宏基因组测序数据中该菌的毒力基因,并进一步通过识别各样本毒力基因的SNP数目及进化分析来确定本次暴发的病原菌。通过构建该方法和系统,实现了对各类致病菌所致食源性暴发事件的准确溯源,有助于对暴发事件的及时有效处置。

【技术实现步骤摘要】

本专利技术属于生物信息学,尤其涉及一种基于宏基因组的食源性暴发事件溯源方法和系统


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、食源性暴发事件是指由于食品中存在病原微生物或有毒物质,导致多人食用后感染或中毒的事件。这些事件给公共卫生和食品安全带来了严重威胁,因此,准确迅速地溯源出病原微生物或有毒物质的来源成为解决食源性暴发事件的关键。

3、当前病原菌所致食源性暴发事件的溯源主要依赖于细菌的分离培养,在此基础上进一步对分离到的疑似病原菌开展基因分型、全基因组测序等,通过聚类和进化分析来判断并确证本次暴发事件的病原菌。整个时间周期和人力资源成本相对较长,且存在由于分离培养方法选择不当造成假阴性的结果。另一方面,对于条件性病原菌,单个宿主可以携带多个不同的病原体谱系,造成分离得到的病原体有可能并非为致病谱系,进一步可能会得出关于暴发时发生的传播事件的错误推断。

4、宏基因组测序技术的出现为食源性暴发事件病原的快速识别奠定了基础。作为一种高通量测序技术,其能够在较短时间内获取食品或病人排泄物样本中所有微生物的基因组信息。这种方法与传统的检测方法相比,具有高效、快速、全面的优势。它可以同时鉴定和区分不同种类的微生物,并提供它们的进化关系和功能信息。然而,目前针对食源性暴发事件的宏基因组生物信息学分析方法存在一些挑战,尤其是在条件性病原菌所致的暴发事件识别中。首先,食品样品中的微生物丰富多样,包括细菌、真菌、病毒等多种类型,如何高效准确地鉴定和分类这些微生物是一个难题。其次,受正常菌群及背景菌的影响,现有宏基因组测序分析方法对条件性病原菌所致的食源性暴发溯源上存在一定的局限性,仅通过物种reads数、物种相对丰度及binning分析等方法无法准确识别条件性病原菌所致的食源性暴发事件。无法满足食品安全领域对高灵敏度和高特异性的要求。此外,数据分析和解读的复杂性也是当前技术面临的挑战之一。

5、因此,需要开发一种新的宏基因组生物信息学分析方法,以提高对条件性病原菌所致食源性暴发事件的溯源效率和准确性。这种方法应该能够快速、准确地鉴定和分类食品及病人样品中的微生物,具备高灵敏度和高特异性,同时简化数据分析和解读过程。


技术实现思路

1、为克服上述现有技术的不足,本专利技术提供了一种基于宏基因组的食源性暴发事件溯源方法和系统。本专利技术中所指食源性暴发事件主要针对由条件性致病菌导致。本专利技术首先通过运行基于k-mer算法的快速比对软件对食源性暴发事件样本宏基因组测序数据进行物种分类并计算相对丰度、rpm得到物种丰度表,进而根据物种丰度表和三级十二维现场流行病学数据量表运用随机森林模型,初步判定食源性暴发事件的条件致病菌;通过识别并抓取各样本宏基因组测序数据中该菌的毒力基因,并进一步通过识别各样本毒力基因的snp数目及进化分析来确定本次暴发事件的病原菌。通过构建该方法和系统,实现了对各类致病菌所致食源性暴发事件的准确溯源,有助于对暴发事件的及时有效处置。

2、为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:

3、本专利技术的第一方面,提供一种基于宏基因组的食源性暴发事件溯源方法,所述方法包括

4、s1、获取待测样品的宏基因组数据;基于所述宏基因组数据,初步判断食源性暴发事件的条件性致病菌;

5、s2、对宏基因组数据进行组装得到重叠群序列;

6、s3、重叠群序列与毒力基因数据库中符合步骤s1初步判定的条件性致病菌所含的毒力基因进行比对,得各样本所含毒力基因列表;

7、s4、从s3所得毒力基因列表中,筛选出在3~10个样本中存在的毒力基因;

8、s5、提取各样本重叠群序列中s4中所得毒力基因的序列;

9、s6、计算s5中所得毒力基因在各样本中的snp差异数量,如果snp差异数量均小于10,则s1条件致病菌为本次暴发事件的致病菌;

10、所述s1中,初步判断食源性暴发事件的条件性致病菌方法为:基于物种分类和暴发事件三级十二维现场流行病学数据量表数据,运用随机森林预测模型,初步判断食源性暴发事件的病原体;继续判断是否为条件致病菌,如是,则执行s3。

11、在本专利技术的具体实施方式中,所述食源性暴发事件主要由条件性致病菌导致。

12、在本专利技术的具体实施方式中,所述方法还包括,将s5所得病原体的毒力基因序列与其他来源菌株的毒力基因序列合并进行进化分析,构建系统发育进化树做进一步验证。

13、在本专利技术的具体实施方式中,所述物种分类获取方法为:

14、s11、采集样本并提取dna,对样本dna进行二代测序后所得reads数据进行质控;

15、s12、质控后的各样本reads序列进行基于k-mer的比对软件和算法物种判别,得到各样本中所含物种分类的reads,并计算各物种的相对丰度、每百万序列数(rpm)进一步生成本次暴发事件的物种丰度表;

16、s13,基于s12的本次暴发事件物种丰度表,按照物种rpm值进行排序,选取出rpm值排名1~20的物种分类。

17、在本专利技术的具体实施方式中,所述三级十二维现场流行病学数据量表中,所述三级包括类别、定性信息和量值;

18、所述类别包括流行病学数据和临床数据;

19、进一步的,所述定性信息中流行病学数据包括潜伏期、人群信息、地区分布、共同暴露史;

20、所述定性信息中临床症状数据包括腹泻次数、粪便性状、呕吐、腹痛、发热温度、白细胞计数。

21、在本专利技术的具体实施方式中,所述潜伏期包括发病时间;

22、所述人群信息包括性别、年龄和职业。

23、在本专利技术的具体实施方式中,所述条件性致病菌包括大肠埃希菌、金黄色葡萄球菌、蜡样芽孢杆菌、产气荚膜梭菌、铜绿假单胞菌、肠球菌、克罗诺杆菌、气单胞菌、邻单胞菌、李斯特菌。

24、在本专利技术的具体实施方式中,s2中,使用abricate把各样本宏基因组测序组装得到重叠群序列contigs;

25、s3中,所述毒力基因数据库为vfdb数据库;所述含毒力基因列表获得方法为:用blat(软件全称:the blast-like alignment tool)与毒力基因参考序列进行比对筛选,筛选条件为minidentity=90,输出格式为pslx。

26、本专利技术的第二方面,提供一种基于宏基因组的食源性暴发事件溯源的系统,包括:

27、初步判断模块,被配置为初步判断食源性暴发事件的条件性致病菌,其中,初步判断食源性暴发事件的条件性致病菌方法为:基于物种分类和暴发事件三级十二维现场流行病学数据量表数据,运用随机森林预测模型,初步判断食源性暴发事件的病原体;继续判断是否为条件致病菌,如是,则进入比对模块;

28、宏基因组数据处理模块,被配置为组装宏基因组数据得到重叠群序列;

本文档来自技高网...

【技术保护点】

1.一种基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述方法包括

2.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述方法还包括,将S5所得病原体的毒力基因序列与其他来源菌株的毒力基因序列合并进行进化分析,构建系统发育进化树做进一步验证。

3.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述物种分类获取方法为:

4.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述三级十二维现场流行病学数据量表中,所述三级包括类别、定性信息和量值;

5.如权利要求4所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述潜伏期包括发病时间;

6.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述条件性致病菌包括大肠埃希菌、金黄色葡萄球菌、蜡样芽孢杆菌、产气荚膜梭菌、铜绿假单胞菌、肠球菌、克罗诺杆菌、气单胞菌、邻单胞菌或李斯特菌。

7.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,S2中,使用abricate把各样本宏基因组测序组装的contigs;

8.一种基于宏基因组的食源性暴发事件溯源的系统,其特征在于,包括:

9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的基于宏基因组的食源性暴发事件溯源方法中的步骤。

...

【技术特征摘要】

1.一种基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述方法包括

2.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述方法还包括,将s5所得病原体的毒力基因序列与其他来源菌株的毒力基因序列合并进行进化分析,构建系统发育进化树做进一步验证。

3.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述物种分类获取方法为:

4.如权利要求1所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述三级十二维现场流行病学数据量表中,所述三级包括类别、定性信息和量值;

5.如权利要求4所述的基于宏基因组的食源性暴发事件溯源方法,其特征在于,所述潜伏期...

【专利技术属性】
技术研发人员:刘铭刘辉耿兴义李明君厉文娟马传敏简远志张梦鸽
申请(专利权)人:济南市疾病预防控制中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1