一种设计高密度基因芯片上基因位点的方法技术

技术编号:25693339 阅读:41 留言:0更新日期:2020-09-18 21:04
本发明专利技术提供了一种设计高密度基因芯片上基因位点的方法,该一种设计高密度基因芯片上基因位点的方法包括以下步骤:S1:收集人群的基因检测数据;S2:对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得连锁不平衡程度值R

【技术实现步骤摘要】
一种设计高密度基因芯片上基因位点的方法
本专利技术涉及基因芯片的
,特别是涉及一种设计高密度基因芯片上基因位点的方法。
技术介绍
一切疾病都与基因有关。基因是脱氧核糖核酸(DNA)分子上携带有遗传信息的功能片断,是生物传递遗传信息的物质。基因主宰生命,是生命生老病死的根源。基因检测是通过被检测者外周静脉血或其他组织细胞等,利用生物基因技术,通过特定设备及分子生物技术检测方法、扩增受检者基因信息后,对被检测者细胞中的DNA分子信息作检测,分析它所含有的基因类型和基因缺陷及其表达功能是否正常的一种方法。人体有约30亿个碱基对,而基因检测的手段多种多样,其中最主流的是两种:全基因组测序和基因芯片检测。芯片检测技术,原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法,在一块基片表面固定了序列已知的靶核苷酸的探针。当溶液中带有荧光标记的核酸序列TATGCAATCTAG,与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。据此可重组出靶核酸的序列。相比全基因组测序,通量较低、信息量较少,但价格相对便宜。虽然芯片检测技术能检测的基因位点较少,但可以通过基因型填充或填补获取更多的基因型信息。基因型填充是一种基于观察对象已有基因型,对未进行基因分型的位点之等位基因进行预测的方法。而对未知的基因分型,依据连锁不平衡(linkagedisequilibrium)的原理来预测。连锁不平衡是指分属两个或两个以上基因座位的等位基因同时出现在一条染色体上的几率,高于随机出现的频率。通过基因型填充能增加基因位点的的密度,获取更多的基因位点信息。芯片检测技术有两个技术原理上的局限性:1.只能针对已知的基因位点进行基因分型检测;2.只能对有限数量的基因位点进行基因分型检测。因此,如何设计有限数量的基因位点,通过基因型填充技术,获取更多有价值的基因分型,是基因芯片设计的最重要的环节。
技术实现思路
本专利技术提供了一种设计高密度基因芯片上基因位点的方法,以解决基因芯片中设计有限的基因位点,如何获得更多有价值的基因分型所引发的技术问题。本专利技术提供了一种设计高密度基因芯片上基因位点的方法,该设计高密度基因芯片上基因位点的方法包括以下步骤:S1:收集希望服务的人群的基因检测数据;S2:收集的人群的基因检测数据中,对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得两两基因位点间的连锁不平衡程度值R2;S3:经过连锁不平衡计算后的每两个基因位点为一个基因位点关系对,筛选连锁不平衡程度值R2后的基因位点关系对;S4:扫描每一个筛选后的基因位点关系对,以重复出现的基因位点为关键位点,将所有与该基因位点组成了基因关系对的基因位点挑选出来,连接起来构建网络,确保每个有关系对的基因位点出现且仅出现在一个网络中;S5:对每个网络进行评分,得出评分最高的网络;S6:根据评分条件,对评分最高的网络中每个基因位点进行评分;S7:挑选出评分最高的基因位点,并将评分最高最高的基因位点作为设计高密度基因芯片上的基因位点。可选地,步骤S1中人群基因检测数据信息来自权威公布数据库或自有数据库。可选地,步骤S1中人群的基因检测数据包括全基因组测序数据和高密度芯片检测数据。可选地,步骤S3中筛选R2后的基因位点关系对的具体步骤为:S31:设定最低的连锁不平衡程度值R2值R0;S32:对所有基因位点关系对进行筛选;S33:保留大于R0的基因位点关系对。可选地,步骤S5中对网络进行评分的具体步骤为:S51:设定连锁不平衡程度值的阈值为R1。当一个基因位点关系对的连锁不平衡程度值R2大于等于R1时,该基因位点关系对定义为强基因位点关系对;当一个基因位点关系对的连锁不平衡程度值R2小于R1时,该基因位点关系对定义为弱基因位点关系对;S52:将网络中所有强基因位点关系对的R2求和,得到A1;将网络中所有弱基因位点关系对的R2求和,得到A2;S53:将步骤S52中的A1和A2求和并除以该网络中基因位点总数目,得到该网络的分数。可选地,得分高的网络将拥有更高的选择优先级。可选地,步骤S6中评分条件具体为:S61:设一个基因位点在该网络中拥有的连接数为W,则基础分数为W分;S62:如果该基因位点出现在已有的重要研究中,则增加3*W分;S63:如果该基因位点是AT或者CG突变,则减去2*W分;S64:根据步骤S61-S63,获得每个基因位点的得分Ws,将每个基因位点的最终得分Ws进行从高到底进行排序。可选地,步骤S7中得出评分最高的基因位点的步骤为:S71:设定需要每个网络排名靠前的百分比阈值P;S72:将该网络的所有基因位点数N乘以P后得到n,挑选每个网络中排名前n的基因位点;S73:如果n小于1,则选择该网络中分数第一的基因位点。可选地,一种设计高密度基因芯片上基因位点的系统由一种设计高密度基因芯片上基因位点的方法制成。可选地,一种设计高密度基因芯片上基因位点的系统包括:收集模块、计算模块、筛选模块、扫描模块、第一评分模块、第二评分模块和定位模块;收集模块用于收集希望服务的人群的基因检测数据,计算模块用于对所述收集的希望服务的人群的基因检测数据中,对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得两两基因位点间的连锁不平衡程度值R2,筛选模块用于对经过连锁不平衡计算后的每两个基因位点为一个基因位点关系对,筛选连锁不平衡程度值R2后的基因位点关系对,扫描模块用于扫描每一个筛选后的基因位点关系对,以重复出现的基因位点为关键位点,将所有与该基因位点组成了基因关系对的基因位点挑选出来,连接起来构建网络,确保每个有关系对的基因位点出现且仅出现在一个网络中;第一评分模块用于对每个网络进行评分,得出评分最高的网络;第二评分模块用于根据评分标准,对每个评分最高的网络中每个基因位点进行评分,定位模块用于挑选出评分最高的基因位点,并将评分最高的基因位点作为设计高密度基因芯片上的基因位点本专利技术的有益效果如下:本专利技术的一种设计高密度基因芯片上基因位点的方法,可以挑选合适的基因位点,使得这些位点能够获得尽可能多的获得基因信息。打破了市场上基因芯片设计方案的空白,并且本专利技术综合考虑了位点的关联信息,挑选出的基因位点更具有代表性,有利于基因芯片使用者的科学研究,促进了生物医学的发展。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1是本专利技术提供的一种设计高密度基因芯片上基因位点的方法的流程示意图;图2是本专利技术提供的一种设计高密度基因芯片上基因位点的系统的示意图。具体实施方式下面将结合本专利技术实施例中的附图,本文档来自技高网
...

【技术保护点】
1.一种设计高密度基因芯片上基因位点的方法,其特征在于包括以下步骤:/nS1:收集希望服务的人群的基因检测数据;/nS2:收集的人群的基因检测数据中,对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得两两基因位点间的连锁不平衡程度值R

【技术特征摘要】
1.一种设计高密度基因芯片上基因位点的方法,其特征在于包括以下步骤:
S1:收集希望服务的人群的基因检测数据;
S2:收集的人群的基因检测数据中,对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得两两基因位点间的连锁不平衡程度值R2;
S3:经过连锁不平衡计算后的每两个基因位点为一个基因位点关系对,筛选连锁不平衡程度值R2后的基因位点关系对;
S4:扫描每一个筛选后的基因位点关系对,以重复出现的基因位点为关键位点,将所有与该基因位点组成了基因关系对的基因位点挑选出来,连接起来构建网络,确保每个有关系对的基因位点出现且仅出现在一个网络中;
S5:对每个网络进行评分,得出评分最高的网络;
S6:根据评分标准,对每个评分最高的网络中每个基因位点进行评分;
S7:挑选出评分最高的基因位点,并将评分最高的基因位点作为设计高密度基因芯片上的基因位点。


2.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S1中人群的基因检测数据信息来自权威公布数据库或自有数据库。


3.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S1中人群的基因检测数据包括全基因组测序数据和高密度芯片检测数据。


4.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S3中筛选R2后的基因位点关系对的具体步骤为:
S31:设定最低的连锁不平衡程度值R2值R0;
S32:对所有基因位点关系对进行筛选;
S33:保留大于R0的基因位点关系对。


5.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S5中对网络进行评分的具体步骤为:
S51:设定连锁不平衡程度值的阈值为R1。当一个基因位点关系对的连锁不平衡程度值R2大于等于R1时,该基因位点关系对定义为强基因位点关系对;当一个基因位点关系对的连锁不平衡程度值R2小于R1时,该基因位点关系对定义为弱基因位点关系对;
S52:将网络中所有强基因位点关系对的R2求和,得到A1;将网络中所有弱基因位点关系对的R2求和,得到A2;
S53:将所述步骤S52中的A1和A2求和并除以该网络中基因位点总数目,得到该网络的分数。


6.根据权利要求5所述的一种设计高密度基因芯片上基因位点的...

【专利技术属性】
技术研发人员:姚笑天唐森威李鹰翔陈钢郑强
申请(专利权)人:深圳市早知道科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1