System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物,尤其涉及一种基于大数据的毒素-抗毒素同源性鉴定方法及设备。
技术介绍
1、毒素-抗毒素(toxin-antitoxin,ta)系统是一类广泛存在于原核生物中的基因元件。典型的ta系统由毒素基因和抗毒素基因组成,前者表达产物提供毒性以杀死宿主细胞或抑制宿主细胞生长,后者的表达产物使毒素蛋白/rna无效。诸多研究指出ta系统在细菌生命活动中提供一系列复杂的功能,包括毒力增强、生物膜形成、诱导持久态、抗菌素耐药基因传播等。但无论哪一种都高度依赖于毒素的抑菌/杀菌作用。近年来,对ta系统的研究呈现出日益上升的趋势。
2、目前对ta的鉴定一般遵循同源性鉴定的研究思路。即依托一个整合的参考序列数据库,借助blast+、hmmer3等工具进行同源性检索,再返回具有一定同源性的匹配结果,科研人员再对结果进行解读。
3、现有的工具运作模式是“数据库”加上“鉴定功能”的形式,且数据库系主要职能,鉴定模块一般仅仅是简单封装外部工具进行初步的分析。这样的形式,现有库自带的鉴定模块一般为对外部工具的简单封装,且返回的结果是初步的匹配结果。这样带来的结果存在大量的冗余和没有合并的局部匹配结果。因此,使用这些工具的用户将面临解读成本过高的问题。
技术实现思路
1、本专利技术提供一种基于大数据的毒素-抗毒素同源性鉴定方法、装置、设备及存储介质,目的在于得到较为完整的可靠的同源物。
2、第一方面,本专利技术实施例提供了一种基于大数据的毒素-抗毒素同源性鉴定方法
3、基于预设数据库对测序数据经基因组拼接得到的草图基因组序列进行同源性检索,输出初始比对结果;
4、对所述初始比对结果进行结果过滤、整合和优化,输出同源物;
5、对携带ta的草图基因组序列进行整合元件注释、可移动基因元件和抗生素抗性基因注释;
6、将所述同源物作为参考序列,通过同源性检索在群体数据中进行同源基因鉴定,对每类同源物在群体中进行统计归纳。
7、第二方面,本专利技术实施例提供了一种基于大数据的毒素-抗毒素同源性鉴定装置,包括:
8、初步比对模块,用于基于预设数据库对测序数据经基因组拼接得到的草图基因组序列进行同源性检索,输出初始比对结果;
9、同源物输出模块,用于对所述初始比对结果进行结果过滤、整合和优化,输出同源物;
10、注释模块,用于对携带ta的草图基因组序列进行整合元件注释、可移动基因元件、可移动基因元件和抗生素抗性基因注释;
11、鉴定模块,用于将所述同源物作为参考序列,通过同源性检索在群体数据中进行同源基因鉴定,对每类同源物在群体中进行统计归纳。
12、第三方面,本专利技术实施例提供了一种电子设备,包括:
13、一个或多个处理器;
14、存储器,用于存储一个或多个程序;
15、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任意实施例提供的基于大数据的毒素-抗毒素同源性鉴定方法。
16、第四方面,本专利技术实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本专利技术任意实施例提供的基于大数据的毒素-抗毒素同源性鉴定方法。
17、本专利技术实施例提供的一种基于大数据的毒素-抗毒素同源性鉴定方法、装置、设备及存储介质,通过对初步同源性匹配结果进行更深层次的筛选,得到较为完整的可靠的同源物,解决了同源物结果存在大量的冗余和没有合并的局部匹配结果导致的解读成本过高的问题,实现了得到较为完整的可靠的同源物,降低用户解读成本的效果。
本文档来自技高网...【技术保护点】
1.一种基于大数据的毒素-抗毒素同源性鉴定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述基于预设数据库对测序数据经基因组拼接得到的草图基因组序列进行同源性检索,输出初始比对结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过预设同源检索工具对所述草图基因组序列进行同源性检索,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述初始比对结果进行结果过滤、整合和优化,输出同源物,包括:
6.根据权利要求1所述的方法,其特征在于,对携带TA的草图基因组序列进行整合元件注释,包括:
7.根据权利要求6所述的方法,其特征在于,对携带TA的草图基因组序列进行可移动基因元件和抗生素抗性基因注释,包括:
8.一种基于大数据的毒素-抗毒素同源性鉴定装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处
...【技术特征摘要】
1.一种基于大数据的毒素-抗毒素同源性鉴定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述基于预设数据库对测序数据经基因组拼接得到的草图基因组序列进行同源性检索,输出初始比对结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过预设同源检索工具对所述草图基因组序列进行同源性检索,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述初始比对结果进行结果过滤、整合和优化,输出同源物,包括:
<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。