一种鉴定保守性circRNA的方法、系统、设备和介质技术方案

技术编号:36298627 阅读:62 留言:0更新日期:2023-01-13 10:13
本发明专利技术公开了一种鉴定目标物种保守性circRNA的方法、系统、设备和介质,属于生物信息学技术领域。所述方法包括以下步骤:获得所述目标物种的circRNA序列以及参考物种的circRNA序列;将所述目标物种的circRNA序列以及所述参考物种的circRNA序列按照长度是否小于预设长度阈值N分别构建跨反向剪切点序列;将所述目标物种的circRNA序列以及所述参考物种的circRNA序列进行比对,获得第一比对结果,并将所述目标物种的circRNA序列的跨反向剪切点序列与所述参考物种的circRNA跨反向剪切点序列进行比对,获得第二比对结果,第一比对结果和第二比对结果的交集为保守性circRNA。利用本发明专利技术,可以针对一些疾病相关circRNA获得与人源circRNA具有保守性的circRNA,从而为疾病诊断与治疗提供新的可能靶点。病诊断与治疗提供新的可能靶点。病诊断与治疗提供新的可能靶点。

【技术实现步骤摘要】
一种鉴定保守性circRNA的方法、系统、设备和介质


[0001]本专利技术属于生物信息
,具体地,涉及一种鉴定保守性circRNA的方法、系统、设备和介质。

技术介绍

[0002]环状RNA(circular RNA,circRNA)是一类具有调控功能的非编码RNA,具有共价键形成的闭合环状结构。circRNA没有游离的5'末端帽子结构和3'末端polyA结构,并且对核酸外切酶RNase R不敏感,因此比线性RNA(linear RNA)更稳定,使得circRNA在作为新型临床诊断标记物的开发应用上具有明显优势。circRNA可包含核糖体进入位点(IRES),可以通过IRES元件、类IRES元件或N6

甲基腺苷(m6A)介导帽非依赖性的翻译起始,从而编码蛋白。
[0003]circRNA最早发现于1976年作为类病毒被发现,1979年circRNA被发现是内源性RNA剪切产物。1993年在小鼠中发现Sry基因存在环状转录本。在2012年前后,借助于高通量测序技术,circRNA被大量发现,并且在2013年以后circRNA的相关研究进入了快速增长期。现在转录组测序(RNA

seq)已经成为鉴定、定量circRNA的主要技术之一,通过转录组测序已经在人、小鼠、大鼠、猪、拟南芥、水稻、番茄等物种中鉴定出大量的circRNA,为circRNA的发现与功能机制研究提供了重要支撑。
[0004]circRNA通常具有组织特异性和癌症特异性表达模式,现有的研究数据已经表明circRNA具有潜在的临床应用价值,可作为诊断、预后和预测性的生物标志物。在结直肠癌、髓母细胞瘤、胆管癌、神经退行性疾病、非酒精性脂肪肝炎等癌症和疾病中报导了circRNA的功能。不仅仅circRNA,circRNA编码的蛋白在多种癌症和非癌症疾病中参与各种重要的病理生理过程,如胶质母细胞瘤、阴性乳腺癌、胃癌、肝细胞癌、阿尔茨海默症等。例如一种由circular E

cadherin(hsa_circ_0039992)翻译而来的蛋白质C

E

Cad,在胶质母细胞瘤中会促进肿瘤恶性表型,包括增殖、侵袭、抗凋亡等,因此目前已经把circular E

cadherin作为治疗胶质母细胞瘤的一个重要靶点。circRNA也成为了核酸药物领域的研究热点,与mRNA疫苗类似的是,虽仍处于早期,circRNA疫苗或circRNA疗法也被积极地推动从实验室走向产业化。
[0005]实验动物是生命科学研究中必备的要素之一,动物疾病模型主要用于实验生理学和病理学的研究,也广泛用于新药的筛选。研究人员通常通过疾病动物模型研究某疾病发生、发展和治疗过程中的分子变化和相关机理,或者通过检测临床样本获取关键候选分子信息然后再在动物模型上探究其对某一生物学过程或疾病发生发展的影响。此外,转录组测序的广泛使用促进了很多优质的circRNA公共数据库的产生与发展,但这些数据库主要针对于模式动植物的,大部分物种并没有相关资源,因此在进行相关候选分子的研究时通常也会关注相关分子是否在模式动植物中存在,是否在模式动植物中有相关的研究,以便获得更多的参考信息,辅助于候选分子的筛选或研究。从动物模型到临床研究或从临床样本到动物模型,从非模式物种到模式物种都可能涉及到感兴趣的候选分子是否在其他物种中存在相同或相似(同源)分子的问题。如果候选分子存在高度的物种间保守性,那么其具
有重要意义或保守的功能的可能性就越大。比如,如果通过小鼠疾病模型筛选到一个可能与疾病发生发展高度相关的circRNA,但这个circRNA在人中是不存在的,那么小鼠中的功能机制研究便很难拓展到人的临床研究中,因为相关的分子机制可能在人中不存在,从而无法为疾病的治疗提供可能的靶点。因此,分析circRNA在物种间的保守性对于非模式物种研究以及临床研究就显得比较必要了。
[0006]目前,circRNA在物种间的保守性分析主要是基于亲本基因的保守性,circRNA是亲本基因的特殊剪切产物,因此基于亲本基因的保守性可以建立起circRNA保守性的联系。但是circRNA的功能不一定和亲本基因相关,而且一个基因座可能产生多种circRNA,因此基于亲本基因的circRNA对应可能不够精确。另外一种策略是基于circRNA的基因座或反向剪切点的位置对应不同物种的circRNA,比如可以基于人和小鼠间的基因坐标转换去对应同源circRNA,但此策略一个明显的限制是许多物种的基因组之间无直接的坐标对应关系,因而存在明显的物种适用性限制。而且反向剪切点是circRNA的特征位点,基于基因组坐标的转换无法获悉不同物种间序列相似circRNA的相似区域是否包含或跨越反向剪切点。

技术实现思路

[0007]为了解决上述技术问题中的至少一个,本专利技术旨在提出一种鉴定保守性circRNA的方法,能够分析任何物种的circRNA与参考物种中的circRNA的保守性关系或相似性关系,以及保守性区域是否包含反向剪切点,即反向剪切的保守性。
[0008]本专利技术第一方面提供一种鉴定目标物种保守性circRNA的方法,包括以下步骤:
[0009]S1,获得所述目标物种的circRNA序列以及参考物种的circRNA序列;
[0010]S2,将所述目标物种的circRNA序列以及所述参考物种的circRNA序列按照长度是否小于预设长度阈值N分别构建跨反向剪切点序列:
[0011]对于长度小于N的circRNA,将5'末端1/2长度的碱基移到3'末端,形成跨反向剪切点序列;
[0012]对于长度不小于N的circRNA,将5'末端N/2长度的碱基移到3'末端,然后截取3'末端长度为N的碱基,形成跨反向剪切点序列,
[0013]S3,将所述目标物种的circRNA序列以及所述参考物种的circRNA序列进行比对,获得第一比对结果,并将所述目标物种的circRNA序列的跨反向剪切点序列与所述参考物种的circRNA跨反向剪切点序列进行比对,获得第二比对结果,第一比对结果和第二比对结果的交集为保守性circRNA。
[0014]在本专利技术的一些实施方案中,所述预设长度阈值N为180~260,优选地为200。
[0015]在本专利技术的一些实施方案中,步骤S1中,获得目标物种的circRNA序列的步骤包括:
[0016]获得目标物种生物样本的RNA样本,去除核糖体RNA和/或线性RNA后,对剩余RNA进行建库测序,得到所述目标物种的circRNA序列。
[0017]进一步地,测序后原始数据去除测序接头序列和低质量序列后,比对到所述目标物种的参考基因组上,过滤比对上参考基因组的reads,将未比对上基因组的reads进行非线性化比对参考基因组,基于目标物种的注释文件进行circRNA的鉴定、注释和序列组装。
[0018]在本专利技术的一些具体实施方案中,所述低质量序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种鉴定目标物种保守性circRNA的方法,其特征在于,包括以下步骤:S1,获得所述目标物种的circRNA序列以及参考物种的circRNA序列;S2,将所述目标物种的circRNA序列以及所述参考物种的circRNA序列按照长度是否小于预设长度阈值N分别构建跨反向剪切点序列:对于长度小于N的circRNA,将5'末端1/2长度的碱基移到3'末端,形成跨反向剪切点序列;对于长度不小于N的circRNA,将5'末端N/2长度的碱基移到3'末端,然后截取3'末端长度为N的碱基,形成跨反向剪切点序列,S3,将所述目标物种的circRNA序列以及所述参考物种的circRNA序列进行比对,获得第一比对结果,并将所述目标物种的circRNA序列的跨反向剪切点序列与所述参考物种的circRNA跨反向剪切点序列进行比对,获得第二比对结果,第一比对结果和第二比对结果的交集为保守性circRNA。2.根据权利要求1所述的鉴定目标物种保守性circRNA的方法,其特征在于,所述预设长度阈值N为180~260。3.根据权利要求1所述的鉴定目标物种保守性circRNA的方法,其特征在于,步骤S1中,获得目标物种的circRNA序列的步骤包括:获得目标物种生物样本的RNA样本,去除核糖体RNA和/或线性RNA后,对剩余RNA进行建库测序,得到所述目标物种的circRNA序列。4.根据权利要求3所述的的鉴定目标物种保守性circRNA的方法,其特征在于,测序后原始数据去除测序接头序列和低质量序列后,比对到所述目标物种的参考基因组上,过滤比对上参考基因组的reads,将未比对上基因组的reads进行非线性化比对参考基因组,基于目标物种的注释文件进行circRNA的鉴定、注释和序列组装。5.根据权利要求1所述的鉴定目标物种保守性circRNA的方法,其特征在于,步骤S3中,将所述目标物种的circRNA序列以及所述参考物种的circRNA序列进行比对的比对结果中,若针对一条circRNA序列,比对到所述参考物种的多条circRNA序列,则保留evalue...

【专利技术属性】
技术研发人员:李浩方超韩斐然
申请(专利权)人:杭州联川生物技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1