基因定位方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:23560025 阅读:19 留言:0更新日期:2020-03-25 05:09
本发明专利技术公开了一种基因定位方法、装置、计算机设备及存储介质。该基因定位方法通过获取待处理基因数据,所述待处理基因数据包括待检全基因组测序数据和待检转录组数据;对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表;对所述初始基因列表和所述待检转录组数据进行基因共表达网络分析,获取联动基因列表;将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体;获取标准基因模体,对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因。本发明专利技术的基因定位方法可以实现对异常基因进行快速、精准地定位。

Gene location method, device, computer equipment and storage medium

【技术实现步骤摘要】
基因定位方法、装置、计算机设备及存储介质
本专利技术涉及基因检测
,尤其涉及一种基因定位方法、装置、计算机设备及存储介质。
技术介绍
当前遗传物质受到环境或者其他因素影响,会形成异常基因,这些异常基因可能是致病基因,例如,糖尿病致病基因等;也可能是具有特殊功能的基因,例如,植物抗病基因等。对这些异常基因精准定位,可辅助医护人员确定病症或者辅助研究人员进行研究,但某一遗传物质中,基因数量巨大,很难精准地定位到这些异常基因。
技术实现思路
本专利技术实施例提供一种基因定位方法、装置、计算机设备及存储介质,以解决由于基因数量巨大,难以精准地定位到目标异常基因的问题。一种基因定位方法,包括:获取待处理基因数据,所述待处理基因数据包括待检全基因组测序数据和待检转录组数据;对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表;对所述初始基因列表和所述待检转录组数据进行基因共表达网络分析,获取联动基因列表;将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体;获取标准基因模体,对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因。一种基因定位装置,包括:待处理基因数据获取模块,用于获取待处理基因数据,所述待处理基因数据包括待检全基因组测序数据和待检转录组数据;低频单核苷酸多态性筛选模块,用于对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表;基因共表达网络分析模块,用于对所述初始基因列表和所述待检转录组数据进行基因共表达网络分析,获取联动基因列表;潜在异常模体获取模块,用于将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体;目标异常基因获取模块,用于获取标准基因模体,对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基因定位方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基因定位方法的步骤。上述基因定位方法、装置、计算机设备及存储介质,对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表,可以有效地从待检全基因组测序数据中缩小检测范围,提高数据处理效率。对所述初始基因列表和所述待检转录组数据进行基因共表达网络分析,获取联动基因列表,以便后续进行异常基因定位,提高异常基因定位的效率。将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体,获取标准基因模体,对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因,从而快速、精准地定位到目标异常基因,从而帮助研究人员高效分析出目标异常基因的位置或者为医护人员判断疾病提供技术支持。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中基因定位方法的一应用环境示意图;图2是本专利技术一实施例中基因定位方法的一流程图;图3是本专利技术一实施例中基因定位方法的另一流程图;图4是本专利技术一实施例中基因定位方法的另一流程图;图5是本专利技术一实施例中基因定位方法的另一流程图;图6是本专利技术一实施例中基因定位方法的另一流程图;图7是本专利技术一实施例中基因定位方法的另一流程图;图8是本专利技术一实施例中基因定位方法的另一流程图;图9是本专利技术一实施例中基因定位装置的一示意图;图10是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的基因定位方法,该基因定位方法可应用如图1所示的应用环境中。具体地,该基因定位方法应用在基因定位系统中,该基因定位系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于实现精准地对异常基因进行定位,以便后续分析。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种基因定位方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:S201:获取待处理基因数据,待处理基因数据包括待检全基因组测序数据和待检转录组数据。其中,待处理基因数据是指待检对象的基因数据,通过对待处理基因数据进行处理,以便根据处理结果快速对异常基因进行定位,为医疗人员确定病症或者研究人员的研究提供技术支持。待检对象是指需要确定异常基因位置的对象,该待检对象可以是人体,也可以动物或者植物。待检全基因组测序数据指通过全基因组测序技术得到的需要进行后续检测处理的基因数据。其中,全基因组测序是对未知基因组序列的物种进行个体的基因组测序。待检转录组数据是指转录本通过转录组分析流程分析后得到的需要进行后续检测处理的基因数据。转录本指由一条基因通过转录形成的一种或多种可供编码蛋白质的成熟的mRNA。S202:对待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表。其中,单核苷酸多态性(SingleNucleotidePolymorphisms,简称SNP)是指个体间基因组DNA序列同一位置单个核苷酸编译所引起的多态性,SNP所呈现的多态性可反映单个碱基是否发生变异。对待检全基因组测序数据进行低频单核苷酸多态性筛选,是指从待检全基因组测序数据中筛选出出现频率低于预设阈值的基因,并将这些出现频率低于预设阈值的基因作为潜在异常基因,将所有潜在异常基因集合在一起形成初始基因列表,后续仅需对初始基因列表中的潜在异常基因进行检测,以确定目标异常基因,从而大大降低了工作量。其中,预设阈值指预先设置的用于判断待检全基因组测序数据中某一基因的出现频率是否达到较低标准的值。潜在异常基因是指较大概率为异常基因的基因,具体是指出现概率小于预设阈值的基因。作为一示例,该预设阈值设置为0.1%,则可以将出现频率低于0.1%的基因确定为潜在异常基因,基于所有潜在异常基因形成初始基因列表。可以理解地,由于一个待检对象的基因数量很多,但是异常基因的数量通常只有几个,因此,在获取待检全基因组测本文档来自技高网...

【技术保护点】
1.一种基因定位方法,其特征在于,包括:/n获取待处理基因数据,所述待处理基因数据包括待检全基因组测序数据和待检转录组数据;/n对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表;/n对所述初始基因列表和所述待检转录组数据进行基因共表达网络分析,获取联动基因列表;/n将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体;/n获取标准基因模体,对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因。/n

【技术特征摘要】
1.一种基因定位方法,其特征在于,包括:
获取待处理基因数据,所述待处理基因数据包括待检全基因组测序数据和待检转录组数据;
对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表;
对所述初始基因列表和所述待检转录组数据进行基因共表达网络分析,获取联动基因列表;
将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体;
获取标准基因模体,对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因。


2.如权利要求1所述的基因定位方法,其特征在于,所述获取待处理基因数据,所述待处理基因数据包括待检全基因组测序数据和待检转录组数据,包括:
获取原始基因数据;
采用第二代测序技术对所述原始基因数据进行处理,获取待检全基因组测序数据;
采用转录组测序技术对所述原始基因数据进行处理,获取待检转录组数据。


3.如权利要求1所述的基因定位方法,其特征在于,所述对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取初始基因列表,包括:
采用单核苷酸多态性数据库、人类基因组单体型图和外显子组整合数据库,对所述待检全基因组测序数据进行低频单核苷酸多态性筛选,获取潜在异常基因;
对所述潜在异常基因进行检索,确定所述潜在异常基因对应的基因位置;
根据所述潜在异常基因对应的基因位置和已知异常基因列表,获取初始基因列表。


4.如权利要求1所述的基因定位方法,其特征在于,所述将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取潜在异常模体,包括:
将所述初始基因列表和所述联动基因列表,投影到基因调控网络中,获取拓扑信息;
基于所述拓扑信息,获取潜在异常模体。


5.如权利要求1所述的基因定位方法,其特征在于,所述对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,获取目标异常基因,包括:
对所述标准基因模体和所述潜在异常模体进行拓扑相似性计算,...

【专利技术属性】
技术研发人员:廖希洋欧秋雨
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1