System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及基因组注释领域,具体而言,涉及一种基因组注释的方法及电子装置。
技术介绍
1、基因组注释是生物学研究的基础,一个高质量的基因组注释结果对于基于该基因组的生物学研究具有重大的价值。对组装的基因组进行基因集预测是基因组注释的一个重要方面。一般而言,基因组中基因集预测的证据来源于以下三个方面,基于转录本序列注释基因结构、基于同源蛋白序列注释基因结构和软件从头预测基因结构,基于三种证据进行整合可以得到用于基因组注释的预测基因集,并对其进行基因组注释。
2、busco(benchmarking universal single-copy orthologs),收集了相近物种之间的保守序列,利用orthodb直系同源数据库构建了六种主要的系统进化分支(bacteria、eukaryota、protists、metazoa、fungi、plants)的基因集,可以评估基因组注释的基因集的完整性。
3、常规的注释流程中最后会使用evidencemodeler(evm)或geta等工具对三种证据的预测结果进行整合,合并成完整的基因结构。现有技术中的整合过程中,整合软件不会考虑busco库中存在的相似基因序列,因此可能会丢失部分该种相似的序列,故无法确保由上述的三种预测手段获得的预测基因集的busco评估文件中的基因序列,均能整合到最终的用于基因组注释的预测基因集中。因此,依此评估结果输出的用于基因组注释的预测基因集的完整性实际上比评估的完整性结果要差,故进一步影响了后续基因组注释的准确性。
【技术保护点】
1.一种基因组注释的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预测基因集包括第一预测基因集、第二预测基因集和第三预测基因集及第四预测基因集,其中,所述S1)包括:
3.根据权利要求2所述的方法,其特征在于,所述转录组预测的软件包括Isoquant软件、Stringtie软件或Pasa软件中的一种或多种;
4.根据权利要求2所述的方法,其特征在于,所述S2)包括:分别对所述第一预测基因集、所述第二预测基因集、所述第三预测基因集和所述第四预测基因集进行BUSCO评估,获得第一BUSCO评估文件、第二BUSCO评估文件、第三BUSCO评估文件和第四BUSCO评估文件。
5.根据权利要求4所述的方法,其特征在于,所述S3)包括:
6.一种基因组注释的电子装置,其特征在于,所述电子装置包括:预测基因集获取单元、BUSCO评估单元、修正单元和基因组注释单元;
7.根据权利要求6所述的电子装置,其特征在于,所述预测基因集包括第一预测基因集、第二预测基因集和第三预测基因集及第四预测基因集
8.根据权利要求7所述的电子装置,其特征在于,所述转录组预测的软件包括Isoquant软件、Stringtie软件或Pasa软件中的一种或多种;
9.根据权利要求7所述的电子装置,其特征在于,所述BUSCO评估单元包括:第一预测基因集评估单元、第二预测基因集评估单元、第三预测基因集评估单元或第四预测基因集评估单元;
10.根据权利要求9所述的电子装置,其特征在于,所述修正单元包括:第一修正单元、第二修正单元、第三修正单元、第四修正单元、第五修正单元和第六修正单元;
11.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时,控制权利要求1-5中任一项所述的一种基因组注释的方法。
12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1-5中任一项所述的一种基因组注释的方法。
...【技术特征摘要】
1.一种基因组注释的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预测基因集包括第一预测基因集、第二预测基因集和第三预测基因集及第四预测基因集,其中,所述s1)包括:
3.根据权利要求2所述的方法,其特征在于,所述转录组预测的软件包括isoquant软件、stringtie软件或pasa软件中的一种或多种;
4.根据权利要求2所述的方法,其特征在于,所述s2)包括:分别对所述第一预测基因集、所述第二预测基因集、所述第三预测基因集和所述第四预测基因集进行busco评估,获得第一busco评估文件、第二busco评估文件、第三busco评估文件和第四busco评估文件。
5.根据权利要求4所述的方法,其特征在于,所述s3)包括:
6.一种基因组注释的电子装置,其特征在于,所述电子装置包括:预测基因集获取单元、busco评估单元、修正单元和基因组注释单元;
7.根据权利要求6所述的电子装置,其特征在于,所述预测基因集包括第一预测基因集、第二预测基因集和第三...
【专利技术属性】
技术研发人员:李晓波,周勋,任雪,李泽阳,李华云,王娟,牛晓阳,李志民,
申请(专利权)人:安诺优达基因科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。