当前位置: 首页 > 专利查询>武汉大学专利>正文

多基因发现网络构造方法、装置、设备及存储介质制造方法及图纸

技术编号:35898992 阅读:17 留言:0更新日期:2022-12-10 10:34
本发明专利技术公开了一种多基因发现网络构造方法、装置、设备及存储介质,所述方法通过获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息;根据所述发现网络和所述存储信息生成DNA序列,并对所述DNA序列进行测序,获得测序结果;对所述测序结果进行解码,获得基因位置信息,根据所述基因位置信息判断是否存在被编码基因,能够在解码时快速高效地找到对应的基因,节省了基因寻找的时间,能够快速检出基因报告错误,避免了多种变异及测序本身所导致的测序结果差错,提升了多基因发现网络构造的速度和效率。络构造的速度和效率。络构造的速度和效率。

【技术实现步骤摘要】
多基因发现网络构造方法、装置、设备及存储介质


[0001]本专利技术涉及生物信息学
,尤其涉及一种多基因发现网络构造方法、装置、设备及存储介质。

技术介绍

[0002]生物信息学是一门利用应用数学、信息学、统计学和计算机科学等学科的方法研究生物学问题的交叉学科,早在19世纪60年代,学术界即提出了基于DNA的数据存储的概念,经过近六十年的发展,DNA存储相关的研究逐步成为生物信息学领域的重要分支。
[0003]在由多个基因组成的基因组的编解码的研究中,编码时,对每个基因进行编码,得到不改变基因组生物活性的基因组,解码时,对于测序所得的序列进行解码,第一步需要找到基因组中所有的基因;在测序以及生化演变过程中,会有概率发生一定的错误,替换错、插入错、删除错,可能会改变基因之间的位置距离。

技术实现思路

[0004]本专利技术的主要目的在于提供一种多基因发现网络构造方法、装置、设备及存储介质,旨在解决现有技术中基因编解码测序及生化演变过程中,存在替换错、插入错及删除错等错误,会改变基因之间位置距离,发现其他基因效率低下的技术问题。
[0005]第一方面,本专利技术提供一种多基因发现网络构造方法,所述多基因发现网络构造方法包括以下步骤:
[0006]获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息;
[0007]根据所述发现网络和所述存储信息生成DNA序列,并对所述DNA序列进行测序,获得测序结果;
[0008]对所述测序结果进行解码,获得基因位置信息,根据所述基因位置信息判断是否存在被编码基因。
[0009]可选地,所述获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息,包括:
[0010]获取用户输入的基因组信息,根据所述基因组信息构造发现网络;
[0011]获得各待编码基因之间的间隔序列,根据所述间隔序列形成多个环形基因组;
[0012]获取各环形基因组的基因个数和基因组解码信息,根据所述基因个数和所述基因组解码信息获取各待编码基因的关联基因,根据所述关联基因确定各待编码基因要嵌入的存储信息。
[0013]可选地,所述获取用户输入的基因组信息,根据所述基因组信息构造发现网络,包括:
[0014]获取用户输入的基因组信息,将各待编码基因抽象为各节点;
[0015]构造各节点均有两个入度和出度的有向无权连通图,根据所述有向无权连通图生
成发现网络。
[0016]可选地,所述获得各待编码基因之间的间隔序列,根据所述间隔序列形成多个环形基因组,包括:
[0017]根据所述基因组信息对所有待编码基因按顺时针进行标识,获得各待编码基因之间的间隔序列,根据所述间隔序列将各待编码基因组成多个环形基因组。
[0018]可选地,所述获取各环形基因组的基因个数和基因组解码信息,根据所述基因个数和所述基因组解码信息获取各待编码基因的关联基因,根据所述关联基因确定各待编码基因要嵌入的存储信息,包括:
[0019]获取各环形基因组中包含的基因个数,根据所述基因个数对各环形基因组进行求解,获得对应的基因组解码信息;
[0020]根据所述基因个数和所述基因解码信息求解每个待编码基因相关联的关联基因;
[0021]获取所述关联基因待嵌入的目标自然数,将所述目标自然数作为各待编码基因要嵌入的存储信息。
[0022]可选地,所述根据所述发现网络和所述存储信息生成DNA序列,并对所述DNA序列进行测序,获得测序结果,包括:
[0023]从所述发现网络中获得各待编码基因的位置信息,根据所述位置信息和所述存储信息对各待编码基因进行嵌入式编码,生成DNA序列;
[0024]将所述DNA序列进行生化过程处理,对处理后的DNA序列进行测序,获得测序结果。
[0025]可选地,所述对所述测序结果进行解码,获得基因位置信息,根据所述基因位置信息判断是否存在被编码基因,包括:
[0026]根据起始密码子对所述测序结果进行遍历,生成起始表,根据终止密码子对所述测序结果进行遍历,生成终止表,所述起始表为所有起始密码子在基因组中的位置的列表,所述终止表为所有终止密码子在基因组中的位置的列表;
[0027]根据所述起始表和所述终止表对所述测序结果进行解码,在所述测序结果中找到位于预设间接序列长度区间的目标基因;
[0028]获得所述目标基因的基因位置信息,根据所述基因位置信息判断除所述目标基因外的其他基因中是否存在被编码基因。
[0029]第二方面,为实现上述目的,本专利技术还提出一种多基因发现网络构造装置,所述多基因发现网络构造装置包括:
[0030]信息获取模块,用于获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息;
[0031]测序模块,用于根据所述发现网络和所述存储信息生成DNA序列,并对所述DNA序列进行测序,获得测序结果;
[0032]解码模块,用于对所述测序结果进行解码,获得基因位置信息,根据所述基因位置信息判断是否存在被编码基因。
[0033]第三方面,为实现上述目的,本专利技术还提出一种多基因发现网络构造设备,所述多基因发现网络构造设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的多基因发现网络构造程序,所述多基因发现网络构造程序配置为实现如上文所述的多基因发现网络构造方法的步骤。
[0034]第四方面,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有多基因发现网络构造程序,所述多基因发现网络构造程序被处理器执行时实现如上文所述的多基因发现网络构造方法的步骤。
[0035]本专利技术提出的多基因发现网络构造方法,通过获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息;根据所述发现网络和所述存储信息生成DNA序列,并对所述DNA序列进行测序,获得测序结果;对所述测序结果进行解码,获得基因位置信息,根据所述基因位置信息判断是否存在被编码基因,能够在解码时快速高效地找到对应的基因,节省了基因寻找的时间,能够快速检出基因报告错误,避免了多种变异及测序本身所导致的测序结果差错,提升了多基因发现网络构造的速度和效率。
附图说明
[0036]图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;
[0037]图2为本专利技术多基因发现网络构造方法第一实施例的流程示意图;
[0038]图3为本专利技术多基因发现网络构造方法第二实施例的流程示意图;
[0039]图4为本专利技术多基因发现网络构造方法第三实施例的流程示意图;
[0040]图5为本专利技术多基因发现网络构造方法第四实施例的流程示意图;
[0041]图6为本专利技术多基因发现网络构造方法中环形基因组的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多基因发现网络构造方法,其特征在于,所述多基因发现网络构造方法包括:获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息;根据所述发现网络和所述存储信息生成DNA序列,并对所述DNA序列进行测序,获得测序结果;对所述测序结果进行解码,获得基因位置信息,根据所述基因位置信息判断是否存在被编码基因。2.如权利要求1所述的多基因发现网络构造方法,其特征在于,所述获取用户输入的基因组信息,根据所述基因组信息在所有待编码基因之间构造发现网络,并确定各待编码基因的存储信息,包括:获取用户输入的基因组信息,根据所述基因组信息构造发现网络;获得各待编码基因之间的间隔序列,根据所述间隔序列形成多个环形基因组;获取各环形基因组的基因个数和基因组解码信息,根据所述基因个数和所述基因组解码信息获取各待编码基因的关联基因,根据所述关联基因确定各待编码基因要嵌入的存储信息。3.如权利要求2所述的多基因发现网络构造方法,其特征在于,所述获取用户输入的基因组信息,根据所述基因组信息构造发现网络,包括:获取用户输入的基因组信息,将各待编码基因抽象为各节点;构造各节点均有两个入度和出度的有向无权连通图,根据所述有向无权连通图生成发现网络。4.如权利要求2所述的多基因发现网络构造方法,其特征在于,所述获得各待编码基因之间的间隔序列,根据所述间隔序列形成多个环形基因组,包括:根据所述基因组信息对所有待编码基因按顺时针进行标识,获得各待编码基因之间的间隔序列,根据所述间隔序列将各待编码基因组成多个环形基因组。5.如权利要求2所述的多基因发现网络构造方法,其特征在于,所述获取各环形基因组的基因个数和基因组解码信息,根据所述基因个数和所述基因组解码信息获取各待编码基因的关联基因,根据所述关联基因确定各待编码基因要嵌入的存储信息,包括:获取各环形基因组中包含的基因个数,根据所述基因个数对各环形基因组进行求解,获得对应的基因组解码信息;根据所述基因个数和所述基因解码信息求解每个待编码基因相关联的关联基因;获取所述关联基因待嵌入的目标自然数,将所述目标自然数作为各待编...

【专利技术属性】
技术研发人员:崔竞松薛慧李嘉伟刘艺扬
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1