System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 外源污染基因及抗性基因、毒力因子编码基因的检测方法技术_技高网

外源污染基因及抗性基因、毒力因子编码基因的检测方法技术

技术编号:40276785 阅读:18 留言:0更新日期:2024-02-02 23:04
本发明专利技术公开了外源污染基因及抗性基因、毒力因子编码基因的检测方法,包括以下步骤:收集具代表性的微生物、病毒,抗性基因、毒力因子各个集合的外源参考基因组数据库,并进行过滤、整合得到综合数据库;分别将原始数据与各个集合的外源参考基因组数据库进行依次的DNA和蛋白比对;对比对结果进行过滤、整合、描述以及统计,使得结果可视化;本发明专利技术结合了经全基因组测序后的原始数据中外源基因、抗性基因和毒力因子编码基因三个流程的统一检测,将多个外源病毒数据库,毒力数据库和抗性基因数据库获得的信息聚合到单个参考序列数据库中,使得外源基因检测在临床上的实用性大大增强。

【技术实现步骤摘要】

本专利技术涉及生物信息领域二代测序数据分析,具体为外源污染基因及抗性基因、毒力因子编码基因的检测方法


技术介绍

1、污染微生物无处不在,可能存在于试剂或实验室器皿,环境或正常人类菌群中。由于全基因组测序的敏感性,测序数据中甚至可能存在微量的外部污染。在这种情况下,病原体可能包括许多常见和不常见的病原体,从病毒到细菌、真菌和寄生虫。假设pcr可能涉及针对特定目标生物的大量单独检测,但仍可能遗漏罕见病原体或使用含有与所涉微生物菌株不匹配的引物,这会降低检测的灵敏度。此外,基于pcr的传统检测方法检测到的病原体谱仍然很窄,只能识别约40%的病原体。因此,一种有可能检测几乎任何生物体的无假设诊断方法将导致微生物诊断测试的巨大范式转变。

2、值得注意的是,几乎所有传染因子都含有dna或rna基因组,这使得测序成为病原体检测的一种有吸引力的方法,并且已成为检测和分类表征患者临床样本中微生物的技术平台。因此,下一代测序是一项新技术,有望增强我们诊断、询问和跟踪传染病的能力。

3、此外,毒力因子和抗性基因的筛选鉴定对于理解病原体的毒力机制、预测和监测抗药性、推动药物研发和治疗优化、实施传播阻断和预防控制等方面都起着重要作用。生物信息学方法的应用和技术的发展为毒力因子和抗性基因的筛选鉴定提供了强大的工具和资源。

4、现有的有通过应用宏基因组学进行病原体监测,达成了使用不同检测方法进行菌株分型鉴定的结果。该研究更关注于对已知和尚未出现的病原体的检测,但是没有考虑到与入侵宿主致病性密切相关的毒力因素的鉴定,以及允许病原体免疫其他治愈性治疗的抗菌素耐药性基因的监测,这使得对测序数据检测的不全面。

5、现有的也有通过宏基因组数据集进行识别鉴定毒力因子和抗菌素耐药性基因,达成了使用单一pipeline同时检测毒力因子和抗菌素耐药性基因,这个方案在检测流程和数据集合方面做了改善,但是仅从蛋白层面对毒力因子和抗菌素耐药性基因进行筛选,在检测过程中需要将dna序列翻译成蛋白质序列,由于1条dna序列可翻译成为6条可能的蛋白序列,因此使得检测的假阳性率升高。该方法没有考虑到dna+蛋白双重验证的结果。

6、现有的还有通过应用宏基因组学对临床标本进行病原体检测,达成了通过病原体监测诊断癌症的结果,但是没有去除人类基因组。人类基因组中有约8%的病毒来源序列,如果在检测前不去除人类基因组中的病毒来源的序列,将有可能增加检测结果的假阳性风险。


技术实现思路

1、为解决现有技术存在基于pcr的传统检测方法检测到的病原体谱仍然很窄;而现有的检测方法存在检测不全面、检测准确度低和检测可靠差的缺陷,本专利技术提供外源污染基因及抗性基因、毒力因子编码基因的检测方法。

2、为了解决上述技术问题,本专利技术提供了如下的技术方案:

3、本专利技术外源污染基因及抗性基因、毒力因子编码基因的检测方法,

4、包括以下步骤:

5、步骤1、收集具代表性的微生物、病毒,抗性基因、毒力因子各个集合的外源参考基因组数据库,并进行过滤、整合得到综合数据库;

6、步骤2、分别将原始数据与各个集合的外源参考基因组数据库进行依次的dna和蛋白比对;

7、步骤3、对比对结果进行过滤、整合、描述以及统计,使得结果可视化。

8、本专利技术结合了经全基因组测序后的原始数据中外源基因、抗性基因和毒力因子编码基因三个流程的统一检测,将多个外源病毒数据库,毒力数据库和抗性基因数据库获得的信息聚合到单个参考序列数据库中,使得外源基因检测在临床上的实用性大大增强。

9、本专利技术在分析毒力基因和耐药基因分析方面,本方法结合了蛋白层面的比对结果与基因组层面的比对结果,根据基因+蛋白双重验证的方式确定毒力基因和耐药基因的存在,提高了检测的特异性。

10、本专利技术通过预先过滤原始数据中人类基因组来源的序列,使得检测的特异性升高,从而能更加准确地鉴定非人类基因中的外源污染基因、抗性基因、毒力因子编码基因

11、作为本专利技术的一种优选技术方案,所述的过滤、整合得到综合数据库的方法是,根据微生物基因分类数据库中的genome_id对应的genome_length进行降序排序处理,然后去除在genus水平上未得到明确分类的genome_id,再根据genus水平上的物种分类去除重复的分类内容;此后在family水平和order水平上重复以上过滤整合操作,最终保留在genus、family、order水平上重复过滤整合得到的每一genome_id对应的genome_length最长的唯一物种水平分类信息,并将该微生物序列与病毒序列整合至同一个文件中,从而实现对外源基因参考数据的整合过滤。

12、作为本专利技术的一种优选技术方案,所述的步骤1的外源参考基因组数据库中,还具有从蛋白层面和dna层面收集抗性基因以及相应的蛋白参考数据库;并将不同来源的参考数据整合为单一dna输入和单一蛋白输入文件;

13、还具有从蛋白层面和dna层面收集毒力因子编码基因以及相应的蛋白参考数据库,将不同来源的参考数据整合为单一dna输入和单一蛋白输入文件;

14、由以上处理最终得到外源基因、抗性基因、抗性蛋白、毒力因子编码基因以及毒力因子蛋白的五个全面集合的参考输入文件;针对五个经整合的参考数据库,分别在dna层面和相应的蛋白层面和建立参考数据库索引目录。

15、作为本专利技术的一种优选技术方案,所述的步骤2中分别将原始数据与各个集合的外源参考基因组数据库进行依次的dna和蛋白比对的方法是:

16、由全基因组测序得到原始数据a,将原始数据a与人类参考基因组比对,得到sam格式的标准比对结果b;将此比对结果b作为参照,预先过滤原始数据a中的人类基因组,得到非人类基因序列结果c;进一步将非人类基因序列c作为输入与整合的外源参考基因组进行比对,得到原始数据a中的非人类基因比对至外源基因数据库的原始比对信息d;对原始比对结果d去冗余,剔除未比对成功的reads,得到外源基因的完全单reads比对结果e;

17、将非人类基因序列c作为输入文件,分别在蛋白层面和dna层面上使用相同的比对参数与整合的抗性基因和蛋白参考数据库进行比对,分别得到原始的dna比对标准结果f和蛋白质标准比对结果g;对dna原始比对结果f去冗余,剔除未比对成功的reads,得到抗性基因的完全单reads比对结果g;筛选蛋白原始比对结果g,只保留相似性超过80%的比对序列h;

18、再次将非人类基因序列c作为输入文件,分别在蛋白层面和dna层面上使用相同的比对参数与整合的毒力因子编码基因和蛋白参考数据库进行比对,分别得到原始的dna标准比对结果i和蛋白质标准比对结果j;对原始比对结果去冗余,剔除未比对成功的reads,得到毒力因子编码基因的完全单reads比对结果l;筛选蛋白原始比对结果j,只保留相似性超过80%的比对结果m。

19、作为本专利技术的一种优选本文档来自技高网...

【技术保护点】

1.外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,所述的过滤、整合得到综合数据库的方法是,根据微生物基因分类数据库中的genome_id对应的genome_length进行降序排序处理,然后去除在genus水平上未得到明确分类的genome_id,再根据genus水平上的物种分类去除重复的分类内容;此后在family水平和order水平上重复以上过滤整合操作,最终保留在genus、family、order水平上重复过滤整合得到的每一genome_id对应的genome_length最长的唯一物种水平分类信息,并将该微生物序列与病毒序列整合至同一个文件中,从而实现对外源基因参考数据的整合过滤。

3.根据权利要求2所述的外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,所述的步骤1的外源参考基因组数据库中,还具有从蛋白层面和DNA层面收集抗性基因以及相应的蛋白参考数据库;并将不同来源的参考数据整合为单一DNA输入和单一蛋白输入文件;

4.根据权利要求3所述的外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,所述的步骤2中分别将原始数据与各个集合的外源参考基因组数据库进行依次的DNA和蛋白比对的方法是:

5.根据权利要求4所述的外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,所述的步骤3中对比对结果进行过滤、整合、描述以及统计,使得结果可视化的方法是,

...

【技术特征摘要】

1.外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的外源污染基因及抗性基因、毒力因子编码基因的检测方法,其特征在于,所述的过滤、整合得到综合数据库的方法是,根据微生物基因分类数据库中的genome_id对应的genome_length进行降序排序处理,然后去除在genus水平上未得到明确分类的genome_id,再根据genus水平上的物种分类去除重复的分类内容;此后在family水平和order水平上重复以上过滤整合操作,最终保留在genus、family、order水平上重复过滤整合得到的每一genome_id对应的genome_length最长的唯一物种水平分类信息,并将该微生物序列与病毒序列整合至同一个文件...

【专利技术属性】
技术研发人员:祁雪静孔华蕾阚科佳倪帅吴宁
申请(专利权)人:上海唯可生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1