基于HLA基因的生物信息处理方法、装置及终端制造方法及图纸

技术编号:24583046 阅读:43 留言:0更新日期:2020-06-21 01:23
本申请公开了一种基于HLA基因的生物信息处理方法、装置、电路及终端。其中,方法包括:基于待分型处理的DNA信息,确定DNA信息中针对HLA区域的多个基因片段;将多个基因片段分别与预存储的多个等位基因进行匹配,确定DNA信息与多个等位基因各自对应的匹配分值;依据DNA信息与多个等位基因各自对应的匹配分值,从多个等位基因中,确定候选的多个第一等位基因;确定与多个第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对;对多个等位基因对进行处理分析,确定针对DNA信息的目标等位基因对。本申请实施例通过确定候选等位基因的方式,提高了后续对基因片段的真实性进行分析的精度性。

Method, device and terminal of biological information processing based on HLA gene

【技术实现步骤摘要】
基于HLA基因的生物信息处理方法、装置及终端
本申请涉及基因识别
,具体涉及一种基于HLA基因的生物信息处理方法、装置及终端。
技术介绍
准确的高分辨率HLA分型技术不仅在移植配型等领域有广阔的应用前景,而且在研究某些疾病的致病机理方面,如自身免疫性疾病、感染类疾病、癌症的易感性和母婴健康中也十分重要。在高通量测序技术被广泛应用的今天,传统的分型技术也由于其不足之处而被逐步替代。但是,由于人类的MHC基因具有多基因性、多态性和共显性的特点,对高通量测序数据中HLA区域的数据分析也存在着困难。
技术实现思路
为了解决上述技术问题,本申请提供一种基于HLA基因的生物信息处理方法、装置、电路及终端。根据本申请的第一方面,提供了一种基于HLA基因的生物信息处理方法,该方法包括:基于待分型处理的DNA信息,确定DNA信息中针对HLA区域的多个基因片段;将多个基因片段分别与预存储的多个等位基因进行匹配,确定DNA信息与多个等位基因各自对应的匹配分值;依据DNA信息与多个等位基因各自对应的匹配分值,从多个等位基因中,确定候选的多个第一等位基因;确定与多个第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对;对多个等位基因对进行处理分析,确定针对DNA信息的目标等位基因对。根据本申请的第二方面,提供了一种基于HLA基因的生物信息处理装置,该装置包括:基因片段确定模块,用于确定针对HLA区域的基因片段;匹配分值确定模块,用于将基因片段与预存储的多个等位基因进行匹配,确定确定DNA信息分别与多个等位基因各自对应的匹配分值;候选基因确定模块,用于依据DNA信息分别与多个等位基因各自对应的匹配分值,从多个等位基因中,确定候选的多个第一等位基因;基因对确定模块,用于确定与多个第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对;基因识别处理模块,用于对多个等位基因对进行处理分析,确定针对DNA信息的目标等位基因对。根据本申请的第三方面,提供了一种终端,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时以实现上述基于HLA基因的生物信息处理方法。根据本申请的第四方面,提供了一种计算机可读存储介质,该介质存储有计算机可执行指令,该计算机可执行指令用于以执行上述基于HLA基因的生物信息处理方法。本申请实施例的有益效果:通过确定针对HLA区域的基因片段,以将基因片段与预存储的等位基因库进行匹配,确定基因片段与等位基因库中多个等位基因各自对应的匹配分值,从而依据基因片段与多个等位基因各自对应的匹配分值,从等位基因库的多个等位基因中确定多个候选等位基因,进而对基因片段和多个候选等位基因进行处理,确定与基因片段的各个位置的等位基因对,这种通过确定候选等位基因的方式,提高了后续对基因片段的真实性进行分析的精度性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。图1为根据本申请实施例提供的一种基于HLA基因的生物信息处理方法的流程示意图;图2为根据本申请实施例提供的一种基于HLA基因的生物信息处理方法中多个基因判断与等位基因库一个实施例的的流程示意图;图3为根据本申请实施例提供的一种基于HLA基因的生物信息处理方法中多个基因判断与等位基因库另一个实施例的的流程示意图;图4为根据本申请实施例提供的一种基于HLA基因的生物信息处理装置的框图结构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。根据本申请的一个实施例,提供了一种基于HLA基因的生物信息处理方法,如图1所示,该方法包括:步骤S101至步骤S104。其中,步骤S101:基于待分型处理的DNA信息,确定DNA信息中针对HLA区域的多个基因片段。具体地,DNA信息一般通过fastq.qz格式的文件进行获取。应用时,通过对fastq.qz格式的文件的解析,从而确定针对HLA区域的多个基因片段。具体应用时,待处理文件还可以是其他格式的文件。具体地,基因片段一般通过reads表示。步骤S102:将多个基因片段分别与预存储的多个等位基因进行匹配,确定DNA信息与多个等位基因各自对应的匹配分值。具体应用时,匹配分值用于表征基因片段与等位基因的相似或一致程度,例如,假设基因A的一个等位基因alleleA*01:01:01,序列是ACGATGGCAAC,若基因片段Reads序列,有ACGA、ATGG、CAAC,那么可以确定匹配分值为3。具体地,等位基因的表现形式一般为:HLA-A*01:01:01:01,通过该表现形式来确定其序列。步骤S103:依据DNA信息与多个等位基因各自对应的匹配分值,从多个等位基因中,确定候选的多个第一等位基因。步骤S104:确定与多个第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对。步骤S105:对多个等位基因对进行处理分析,确定针对DNA信息的目标等位基因对。本申请实施例,基于待分型处理的DNA信息,确定DNA信息中针对HLA区域的多个基因片段,将多个基因片段分别与预存储的多个等位基因进行匹配,确定DNA信息与多个等位基因各自对应的匹配分值,依据DNA信息与多个等位基因各自对应的匹配分值,从多个等位基因中,确定候选的多个第一等位基因,确定与多个第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对,对多个等位基因对进行处理分析,确定针对DNA信息的目标等位基因对,这种通过确定候选的第一等位基因的方式,提高了后续对基因片段的真实性进行分析的精度性。在又一个实现方式中,如图1所示,步骤S101确定待处理的针对HLA区域的多个基因片段,包括:步骤S1011(图中未示出):依据预配置的文件格式,获取待处理文件;步骤S1012(图中未示出):基于针对HLA区域的基因范围,DNA信息的多个基因片段。本申请实施例中,预配置的文件格式一般为fastq(命令参数-q)或bam(命令参数-b),通过预配置的文件格式来获取相应格式的待处理文件。在又一个实现方式中,如图1所示,步骤S102将多个基因片段分别与预存储的多个等位基因进行匹配,确定DNA信息与多个等位基因各自对应的匹配分值,包括:步骤S1021(图中未示出)、若DNA信息中本文档来自技高网...

【技术保护点】
1.一种基于HLA基因的生物信息处理方法,其特征在于,包括:/n基于待分型处理的DNA信息,确定所述DNA信息中针对HLA区域的多个基因片段;/n将多个所述基因片段分别与预存储的多个等位基因进行匹配,确定所述DNA信息与多个所述等位基因各自对应的匹配分值;/n依据所述DNA信息与多个所述等位基因各自对应的匹配分值,从多个所述等位基因中,确定候选的多个第一等位基因;/n确定与多个所述第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对;/n对多个所述等位基因对进行处理分析,确定针对所述DNA信息的目标等位基因对。/n

【技术特征摘要】
1.一种基于HLA基因的生物信息处理方法,其特征在于,包括:
基于待分型处理的DNA信息,确定所述DNA信息中针对HLA区域的多个基因片段;
将多个所述基因片段分别与预存储的多个等位基因进行匹配,确定所述DNA信息与多个所述等位基因各自对应的匹配分值;
依据所述DNA信息与多个所述等位基因各自对应的匹配分值,从多个所述等位基因中,确定候选的多个第一等位基因;
确定与多个所述第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对;
对多个所述等位基因对进行处理分析,确定针对所述DNA信息的目标等位基因对。


2.根据权利要求1所述的方法,其特征在于,所述基于待识别的DNA信息,确定所述DNA信息中针对HLA区域的多个基因片段,包括:
依据预配置的文件格式,获取待处理文件;
基于针对HLA区域的基因范围,对所述待处理文件进行定位,得到所述DNA信息的多个基因片段。


3.根据权利要求1所述的方法,其特征在于,所述将多个所述基因片段分别与预存储的多个等位基因进行匹配,确定所述DNA信息与多个所述等位基因各自对应的匹配分值,包括:
若所述DNA信息中针对HLA区域的任一基因片段匹配到任一等位基因的外显子区域内,则依据所述DNA信息中针对HLA区域的该任一基因片段与该任一等位基因的外显子区域的碱基匹配结果,确定第一匹配值;
若所述DNA信息中针对HLA区域的任一基因片段跨越该任一等位基因的外显子-内含子拼接处,则依据所述DNA信息中针对HLA区域的该任一基因片段与该任一等位基因的跨越该任一等位基因的外显子-内含子拼接处的碱基匹配结果,确定第二匹配值;
若所述DNA信息中针对HLA区域的任一基因片段未匹配到任一等位基因的外显子区域内以及未跨越外显子-内含子拼接处,则依据预配置参数确定第三匹配值;
将所述第一匹配值、所述第二匹配值和所述第三匹配值之和,作为所述DNA信息与该任一等位基因的匹配分值。


4.根据权利要求1所述的方法,其特征在于,所述依据所述DNA信息分别与多个所述等位基因各自对应的匹配分值,从多个所述等位基因中,确定候选的多个第一等位基因,包括:
依据所述DNA信息分别与多个所述等位基因各自对应的匹配分值,进行降序排序,并将排序前预定数量的等位基因作为候选的第一等位基因。


5.据权利要求1所述的方法,其特征在于,所述确定与多个所述第一等位基因各自互补的第二等位基因,并进行配对以得到多个等位基因对,包括:
基于任一所述第一等位基因与多个所述基因片段的匹配分值,确...

【专利技术属性】
技术研发人员:马旭蔡瑞琨曹宗富高华方喻浴飞陈翠霞
申请(专利权)人:国家卫生健康委科学技术研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1