一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法技术

技术编号:35593440 阅读:13 留言:0更新日期:2022-11-16 15:11
本发明专利技术涉及计算机辅助药物研发技术领域,具体涉及一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法,该方法包括步骤A:在DFA图中定位Motif子图的位置;步骤B:对局部的DFA图进行扩展;步骤C:删除独立出来Motif子图;步骤D:重复执行步骤A,直至Motif子图完全删除。本发明专利技术避免了显式地对候选密码子进行排列组合,而是将约束隐含在DFA图的路径之中,在优化开始前对DFA图进行处理,从而避免了密码子排列组合所需的大量后期处理的计算量。由此,该方法解决了在mRNA密码子优化中Motif序列的约束问题,为长序列的mRNA密码子设计提供了有效的解决手段。的解决手段。的解决手段。

【技术实现步骤摘要】
一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法


[0001]本专利技术涉及计算机辅助药物研发
,具体涉及一种在mRNA密码子优化的DFA(有限状态自动机)图中实现Motif序列约束的方法。

技术介绍

[0002]根据中心法则,信使RNA(mRNA)通过翻译产生相应的蛋白质,进而发挥生物学功能。其中从初始密码子开始至终止密码子结束,每三个连续的残基形成的密码子对应一个天然氨基酸(终止密码子除外)。在这个过程中mRNA是遗传物质从DNA 传递到蛋白质的中间载体。由于mRNA处于蛋白质的“上游”,从理论上讲,mRNA 可以对所有蛋白层面的药物进行替代。从制药行业的角度来看,mRNA是一种非常有潜力的候选药物,可以满足基因治疗、癌症治疗以及开发疫苗等需求,而且其整体工艺简单,研发速度快,稳定性高。因此,mRNA药物作为新兴的药物形式,已成为药物研发领域的研究热点。
[0003]在mRNA序列中,密码子与氨基酸的对应关系为一对多,同时不同的密码子选择会影响到mRNA的稳定性、翻译效率等性质。目前由于工艺的限制,部分短核酸序列(Motif序列)需要避免在mRNA设计中出现,包括合成酶切位点的序列。因此,密码子的实际可选排列组合数将是一个天文数字,这迫切需要使用计算机辅助的方式对密码子进行设计优化,以提高mRNA序列的结构紧密性、转录稳定性及翻译效率。

技术实现思路

[0004]本专利技术的目的在于针对现有技术中的不足,而提供一种在mRNA密码子优化的 DFA图中实现Motif序列约束的方法,该方法隐式地将约束加入到密码子优化的过程中,能够避免大量的无效计算从而提升设计效率。
[0005]本专利技术的目的通过以下技术方案实现:
[0006]提供一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法,包括以下步骤:
[0007]步骤A、在DFA图中定位Motif子图的位置,以获得Motif子图所属的边的序列;
[0008]步骤B、对局部的DFA图进行扩展,将Motif子图与其余部分进行分离;
[0009]步骤C、删除独立出来Motif子图,即在DFA图中删除相应的边和游离的顶点;
[0010]步骤D、重复以上步骤,直至Motif子图完全删除。
[0011]上述技术方案中,步骤A中,在DFA图中搜索定位Motif子图,其搜索的步骤为:
[0012]A1、从DFA图的初始节点即mRNA最左边部分出发;
[0013]A2、以深度递归的方式匹配DFA图边上的属性与Motif的碱基;
[0014]A3、依次遍历DFA图中的每一条边,直至返回匹配的边的序列,或是报告搜索失败。
[0015]上述技术方案中,步骤B中,对局部的DFA图进行扩展的步骤为:
[0016]B1、从获取的匹配Motif子图出发,分别以从后往前和从前往后的方式依次遍历每一个边,检查前后顶点的分支情况而采取不同的图修改方式,包括以下几种情况:
[0017](1)从后往前的情况:顶点的入度等于1、出度大于1,表明Motif子图的本顶点与其他子图共享了顶点,需要进行扩展;具体做法为新建一个顶点,连接原顶点的前后顶点,复制相应的边的属性,并且删除原出射边,最后更新Motif子图所在的边的序列,如图2所示;
[0018](2)从前往后的情况:顶点的入度大于1、出度大于等于1,表明Motif子图的本顶点与其他子图共享了顶点,需要进行扩展;具体做法为新建一个顶点,连接原顶点的前后顶点,复制相应的边的属性,并且删除原入射边,最后更新Motif子图所在的边的序列,如图3所示:
[0019]B2、循环执行步骤B1,直至没有发现需要修改图的情况发生。
[0020]本专利技术的有益效果:
[0021]本专利技术的一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法,包括步骤A、在DFA图中定位Motif子图的位置;步骤B、对局部的DFA图进行扩展;步骤C、删除独立出来Motif子图;步骤D、重复执行步骤A,直至Motif子图完全删除。由于该过程避免了显式地对候选密码子进行排列组合,而是将约束隐含在DFA 图的路径之中,即在密码子优化的动态规划算法(复杂度O(n3))的计算之前对DFA 图进行处理,这样相比在密码子优化后通过过滤剔除不符合约束的Motif序列的方案,能够避免密码子排列组合所需的大量后期处理的计算量,从而大大提升了设计效率。由此,本专利技术的方法直接避免了计算优化过程进入到无效的解空间,在不明显增加计算量的同时,隐式地将约束加入到密码子优化的过程中,可以支持任意数量和长度的 Motif序列,从而为实现工艺上可行的mRNA药物设计方案尤其是长序列的mRNA 密码子设计提供了计算时间上可行有效的解决手段。
附图说明
[0022]利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
[0023]图1为本专利技术的一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法的流程图。
[0024]图2为本专利技术实施例1的步骤B1中以从后往前的方式对局部的DFA图进行扩展的示意图。
[0025]图3为本专利技术实施例1的步骤B1中以从前往后的方式对局部的DFA图进行扩展的示意图。
[0026]图4为本专利技术实施例2的多肽MLP的mRNA优化所需要的DFA图。
[0027]图5为本专利技术实施例2的多肽MLP的mRNA被优化后的DFA图。
具体实施方式
[0028]实施例1。
[0029]一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法,包括以下步骤:
[0030]步骤A、在DFA图中定位Motif子图的位置,以获得Motif子图所属的边的序列;
[0031]步骤B、对局部的DFA图进行扩展,将Motif子图与其余部分进行分离;
[0032]步骤C、删除独立出来Motif子图,即在DFA图中删除相应的边和游离的顶点;
[0033]步骤D、重复以上步骤,直至Motif子图完全删除。
[0034]上述技术方案中,步骤A中,在DFA图中搜索定位Motif子图,其搜索的步骤为、
[0035]A1、从DFA图的初始节点即mRNA最左边部分出发;
[0036]A2、以深度递归的方式匹配DFA图边上的属性与Motif的碱基;
[0037]A3、依次遍历DFA图中的每一条边,直至返回匹配的边的序列,或是报告搜索失败。
[0038]上述技术方案中,步骤B中,对局部的DFA图进行扩展的步骤为:
[0039]B1、从获取的匹配Motif子图出发,分别以从后往前和从前往后的方式依次遍历每一个边,检查前后顶点的分支情况而采取不同的图修改方式,包括以下几种情况:
[0040](1)从后往前的情况:顶点的入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法,其特征在于:包括以下步骤:步骤A、在DFA图中定位Motif子图的位置,以获得Motif子图所属的边的序列;步骤B、对局部的DFA图进行扩展,将Motif子图与其余部分进行分离;步骤C、删除独立出来Motif子图,即在DFA图中删除相应的边和游离的顶点;步骤D、重复以上步骤,直至Motif子图完全删除。2.根据权利要求1所述的一种在mRNA密码子优化的DFA图中实现Motif序列约束的方法,其特征在于:步骤A中,在DFA图中搜索定位Motif子图,其搜索的步骤为:A1、从DFA图的初始节点即mRNA最左边部分出发;A2、以深度递归的方式匹配DFA图边上的属性与Motif的碱基;A3、依次遍历DFA图中的每一条边,直至返回匹配的边的序列,或是报告搜索失败。3.根据权利要求2所述的一种在mRNA密码子优化的DFA...

【专利技术属性】
技术研发人员:夏苗仁葛虎
申请(专利权)人:北京中大唯信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1