This application discloses a method for predicting microRNAs, a microRNAs system and its application. The microRNAs prediction method in this application includes: (1) setting the length of seed sequence; (2) arranging the four bases of A, T, C and G according to the set length to form seed sequence set; (3) removing the redundant sequence of seed sequence set; (4) searching the position of seed sequence on the genome to get the position set; (5) arranging the seed sequence position set from small to large; (6) arranging the seed sequence position set according to the position set. Calendar, if the front and back position sequences complement each other, and the distance is not greater than the length of the precursor sequence, output the sequence; (7) Predict the secondary structure of the output sequence by using secondary structure prediction software, obtain the microRNAs, and generate the microRNAs of the species. The proposed predictive method of microRNAs directly searches for microRNAs in genome sequences, and achieves a more complete set of microRNAs with high efficiency and convenience, which lays a foundation for subsequent research on microRNAs.
【技术实现步骤摘要】
一种miRNA预测方法、miRNA系统及应用
本申请涉及核酸分析检测领域,特别是涉及一种miRNA预测方法,miRNA预测方法得到的miRNA系统,以及miRNA预测方法的应用。
技术介绍
miRNA是一类由内源基因编码的长度约为22个核苷酸的非编码单链RNA分子,通过与基因完全或非完全互补结合,进行基因表达调控,进而引起形状、表型的差异。目前miRNA相关的数据库很多,诸如miRBase、Tarbase等,有利于对miRNA进行下游分析。但是,除了少部分模式生物外,大部分物种的已知miRNA数量非常有限,例如文昌鱼在miRBase中收录的miRNA只有173条,这在某种程度上局限了对miRNA的进一步研究,因此,对于潜在的新的miRNA的鉴定是至关重要的。目前也有很多miRNA预测方法,如miRDeep2、miRA、mireap等;它们都是基于测序数据,再结合基因组上的比对结果,通过判断测序片段在基因上的侧翼序列是否能形成发夹结构,来推测潜在的miRNA分子。这些miRNA预测方法,都是基于单次测序结果进行预测,对于不同批次或不同实验室的数据平行分析,需要全部放在一起进行,不仅影响项目周期,也增加计算资源消耗;并且,现有的miRNA预测方法整体运行时间较长。
技术实现思路
本申请的目的是提供一种新的miRNA预测方法,该miRNA预测方法的应用,以及该miRNA预测方法获得的miRNA系统。本申请采用了以下技术方案:本申请的一方面公开了一种miRNA预测方法,包括以下步骤,(1)设定种子序列长度;其中,种子序列长度是根据已知miRNA的前体序列发夹结构特征设 ...
【技术保护点】
1.一种miRNA预测方法,其特征在于:包括以下步骤,(1)设定种子序列长度;(2)对A、T、C、G四种碱基进行步骤(1)设定的种子序列长度的全排列,形成种子序列集;(3)去除种子序列集中的冗余种子序列,具体包括,如果一条种子序列与另一条种子序列的反向互补序列相同,则只保留其中一条;(4)在步骤(3)剩余的种子序列中,搜索每一条种子序列和其反向互补序列在待测物种的基因组上的位置,得到种子序列位置集;(5)将步骤(4)获得的种子序列位置集,在基因组上,按从小到大的顺序排列;(6)按位置集的位置遍历,如果基因组上相邻的前后两个位置正好是互补序列,且两者的距离小于或等于设定前体序列长度,则输出前面位置对应的种子序列前50bp至后面位置对应的种子序列后50bp的一段核酸序列,作为初选前体序列;(7)采用二级结构预测软件对步骤(6)获得的初选前体序列进行二级结构预测,如果不能形成发夹结构,则弃用该初选前体序列;如果能形成发夹结构,则从发夹结构的起始点开始,逐个碱基向后推移的取20‑25bp的片段及其互补序列片段作为预成熟体,对各个预成熟体进行打分,取其中分数最高者及其互补序列,并给出两者对应的二 ...
【技术特征摘要】
1.一种miRNA预测方法,其特征在于:包括以下步骤,(1)设定种子序列长度;(2)对A、T、C、G四种碱基进行步骤(1)设定的种子序列长度的全排列,形成种子序列集;(3)去除种子序列集中的冗余种子序列,具体包括,如果一条种子序列与另一条种子序列的反向互补序列相同,则只保留其中一条;(4)在步骤(3)剩余的种子序列中,搜索每一条种子序列和其反向互补序列在待测物种的基因组上的位置,得到种子序列位置集;(5)将步骤(4)获得的种子序列位置集,在基因组上,按从小到大的顺序排列;(6)按位置集的位置遍历,如果基因组上相邻的前后两个位置正好是互补序列,且两者的距离小于或等于设定前体序列长度,则输出前面位置对应的种子序列前50bp至后面位置对应的种子序列后50bp的一段核酸序列,作为初选前体序列;(7)采用二级结构预测软件对步骤(6)获得的初选前体序列进行二级结构预测,如果不能形成发夹结构,则弃用该初选前体序列;如果能形成发夹结构,则从发夹结构的起始点开始,逐个碱基向后推移的取20-25bp的片段及其互补序列片段作为预成熟体,对各个预成熟体进行打分,取其中分数最高者及其互补序列,并给出两者对应的二级结构;(8)合并步骤(7)获得的分数最高的成熟体序列及其对应的互补序列,以及各成熟体序列和其互补序列的二级结构,组成待测物种的miRNA集。2.根据权利要求1所述的miRNA预测方法,...
【专利技术属性】
技术研发人员:朱欠华,黎万顺,万胜青,
申请(专利权)人:深圳华大基因科技服务有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。