【技术实现步骤摘要】
一种设计高密度基因芯片上基因位点的方法
本专利技术涉及基因芯片的
,特别是涉及一种设计高密度基因芯片上基因位点的方法。
技术介绍
一切疾病都与基因有关。基因是脱氧核糖核酸(DNA)分子上携带有遗传信息的功能片断,是生物传递遗传信息的物质。基因主宰生命,是生命生老病死的根源。基因检测是通过被检测者外周静脉血或其他组织细胞等,利用生物基因技术,通过特定设备及分子生物技术检测方法、扩增受检者基因信息后,对被检测者细胞中的DNA分子信息作检测,分析它所含有的基因类型和基因缺陷及其表达功能是否正常的一种方法。人体有约30亿个碱基对,而基因检测的手段多种多样,其中最主流的是两种:全基因组测序和基因芯片检测。芯片检测技术,原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法,在一块基片表面固定了序列已知的靶核苷酸的探针。当溶液中带有荧光标记的核酸序列TATGCAATCTAG,与基因芯片上对应位置的核酸探针产生互补匹配时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列。据此可重组出靶核酸的序列。相比全基因组测序,通量较低、信息量较少,但价格相对便宜。虽然芯片检测技术能检测的基因位点较少,但可以通过基因型填充或填补获取更多的基因型信息。基因型填充是一种基于观察对象已有基因型,对未进行基因分型的位点之等位基因进行预测的方法。而对未知的基因分型,依据连锁不平衡(linkagedisequilibrium)的原理来预测。连锁不平衡是指分属两个或两个以上基因座位的等 ...
【技术保护点】
1.一种设计高密度基因芯片上基因位点的方法,其特征在于包括以下步骤:/nS1:收集希望服务的人群的基因检测数据;/nS2:收集的人群的基因检测数据中,对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得两两基因位点间的连锁不平衡程度值R
【技术特征摘要】
1.一种设计高密度基因芯片上基因位点的方法,其特征在于包括以下步骤:
S1:收集希望服务的人群的基因检测数据;
S2:收集的人群的基因检测数据中,对包含的所有基因位点进行基因位点间的连锁不平衡程度计算,获得两两基因位点间的连锁不平衡程度值R2;
S3:经过连锁不平衡计算后的每两个基因位点为一个基因位点关系对,筛选连锁不平衡程度值R2后的基因位点关系对;
S4:扫描每一个筛选后的基因位点关系对,以重复出现的基因位点为关键位点,将所有与该基因位点组成了基因关系对的基因位点挑选出来,连接起来构建网络,确保每个有关系对的基因位点出现且仅出现在一个网络中;
S5:对每个网络进行评分,得出评分最高的网络;
S6:根据评分标准,对每个评分最高的网络中每个基因位点进行评分;
S7:挑选出评分最高的基因位点,并将评分最高的基因位点作为设计高密度基因芯片上的基因位点。
2.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S1中人群的基因检测数据信息来自权威公布数据库或自有数据库。
3.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S1中人群的基因检测数据包括全基因组测序数据和高密度芯片检测数据。
4.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S3中筛选R2后的基因位点关系对的具体步骤为:
S31:设定最低的连锁不平衡程度值R2值R0;
S32:对所有基因位点关系对进行筛选;
S33:保留大于R0的基因位点关系对。
5.根据权利要求1所述的一种设计高密度基因芯片上基因位点的方法,其特征在于所述步骤S5中对网络进行评分的具体步骤为:
S51:设定连锁不平衡程度值的阈值为R1。当一个基因位点关系对的连锁不平衡程度值R2大于等于R1时,该基因位点关系对定义为强基因位点关系对;当一个基因位点关系对的连锁不平衡程度值R2小于R1时,该基因位点关系对定义为弱基因位点关系对;
S52:将网络中所有强基因位点关系对的R2求和,得到A1;将网络中所有弱基因位点关系对的R2求和,得到A2;
S53:将所述步骤S52中的A1和A2求和并除以该网络中基因位点总数目,得到该网络的分数。
6.根据权利要求5所述的一种设计高密度基因芯片上基因位点的...
【专利技术属性】
技术研发人员:姚笑天,唐森威,李鹰翔,陈钢,郑强,
申请(专利权)人:深圳市早知道科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。