System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物,涉及一种基于二代测序数据对hla-drb基因进行分型的方法及应用。
技术介绍
1、人类白细胞抗原(human leukocyte antigen,hla)是由hla基因复合体所编码的产物,位于第6染色体短臂上,其主要功能是识别和呈递抗原给免疫系统,从而引发免疫反应。hla基因分为ⅰ、ⅱ、ⅲ3类基因,其中hlaⅰ类基因包括经典的a、b、c基因座位,非经典hlaⅰ类基因包括e、f、g、h、mica、micb等基因座位;hlaⅱ类基因主要包括dr、dp和dq基因座位;hlaⅲ类基因包括补体基因和炎症递质基因。hla分型是指检测每个hla基因座上的等位基因,在器官移植、输血和疾病诊断上都有很大的临床价值。《人类白细胞抗原基因分型技术平台规范化建设及临床应用专家共识》中专家建议首选a、b、c、drb1、dqb1、dpb1、dpa1、dqa1、drb3/4/5位点相合的供者,其次选择a、b、c、drb1、dqb1位点相合的供者。
2、hla-drb等位基因编码hla-dr分子的β链,一共有9个等位基因,其中drb1、drb3、drb4和drb5(drb3/4/5)是功能基因,drb2、drb6、drb7、drb8和drb9是假基因。drb1和drb9基因存在于所有个体中,但是其它的等位基因不一定存在,主要取决于单倍型。例如,drb1*01、*10带有drb6;drb1*15、*16通常带有drb5和drb6;drb1*03、*11、*12、*13、*14带有drb2和drb3;drb1*04、*07、*09带
3、现有研究表明drb3/4/5配型可以改善无关造血干细胞移植的疗效。在对3410例接受了来自hla9/10或10/10等位基因相合非血缘造血干细胞移植的德国患者的回顾性分析中发现,drb3/4/5不相容可能会增加不良结局的风险,特别是那些有并发症和比较虚弱的患者。在另一项研究中发现,drb3/4/5位点相合可能有助于降低移植相关的发病率和死亡率。对1975例因血液恶性肿瘤接受了10/10匹配的非血缘供体的患者和供体分别进行高分辨率分型,发现接受来自drb3/4/5不相合供体的患者发生ii-iv级急性移植物抗宿主病(agvhd)的风险显著增加。此外,drb3/4/5与疾病的发生也有一定的相关性。2016年的一项研究发现drb3/4/5等位基因可能与胰岛自身抗体和儿童1型糖尿病风险相关。1型糖尿病和drb1*03:01:01之间的关联受到drb3*01:01:02和drb3*02:02:01的影响。
4、hla主要的分型方法有血清学分型、细胞学分型和基于dna的分型。基于dna的分型方法包括低分辨水平的序列特异性引物法(sequence specific primer,ssp)中分辨水平的序列特异性寡核苷酸探针法(sequence specific oligonucleotide probes,ssop)、高分辨水平的基于测序分型法(sequencing based typing,sbt)以及等位基因水平的二代测序法(next generation sequencing,ngs)。sbt技术是是现世界卫生组织(who)推荐的hla分型方法的金标准,具有分辨率高,特异性强及准确性高等特点。但是,这项技术只针对hla-ⅰ类基因的2、3、4外显子以及hla-ⅱ类基因2、3外显子的关键区域进行扩增和测序,无法检测全长,因此在分型过程中会出现摸棱两可的结果,即多个分型组合(不同的等位基因组合具有相同的外显子序列)。近年来,国内外已开始使用高通量测序技术对hla基因分型,通过对hla基因全长序列进行靶向捕获和上机测序,具有检测范围广、分辨率高、特异性强、通量高等特点。除了可以检测经典a、b、c、drb1/3/4/5、dqb1、dpb1、dpa1、dqa1位点外,还可检测非经典e、f、g、h位点,以及mica、micb位点的等位基因分型结果,且98%以上样本可直接获得唯一的分型结果。
5、目前,国内外已经开发了很多基于高通量测序数据进行hla分型的软件,例如hla-hd、athlates、optitype、hlascan、hlareporter、xhla和hla-la。由于drb3/4/5并非像drb1以及其它的hla等位基因一样存在于所有的个体中,再加上其重要性不及a、b、c、drb1、dqb1,很多方法都忽略了对它们的分型。即使有些软件能对drb3/4/5分型,也没有考虑到drb3/4/5的拷贝数情况,分型的准确性很低。例如,optitype只能用于a、b、c基因分型且精度只有4位;hlascan忽略了drb3/4的分型;hla-la软件也没有对drb3/4/5的拷贝数进行评估;athlates能对所有的hla基因进行分型,但准确率不高,部分基因的分型结果无法进行判定;hla-hd主要是基于reads的权重打分和等位基因对的筛选进行分型,整体来说分型效果很好,但依然存在错误分型的可能,需要合适的方法进行校正,特别是drb3/4/5,没有考虑到其拷贝数的特殊性,导致较高的分型错误率。
6、综上所述,目前基于高通量测序数据进行hla分型的软件忽略了对drb3/4/5的分型,没有考虑到drb3/4/5的拷贝数情况,分型的准确性低,如何提供一种能够考虑到drb3/4/5拷贝数的特殊性,校正错误分型的drb3/4/5分型方法,已成为目前生物
亟待解决的问题之一。
技术实现思路
1、针对现有技术的不足和实际需求,本专利技术提供一种基于二代测序数据对hla-drb基因进行分型的方法及应用,解决了现有drb3/4/5分型方法忽略了drb3/4/5拷贝数,准确性低的问题,能够准确判断包括drb3/4/5在内的15个基因的拷贝数,与已知分型结果100%一致,再结合等位基因对的打分和筛选规则,drb3/4/5六位分型结果的准确率分别从85%,98%,96%提升至100%。
2、为达到此专利技术目的,本专利技术采用以下技术方案:
3、第一方面,本专利技术提供了一种基于二代测序数据对hla-drb基因进行分型的方法,所述方法包括:测序数据质控,初步分型和校正分型;
4、所述数据质控包括测序reads统计和目标区域统计;
5、所述初步分型包括构建参考基因组,reads比对和权重打分,hla-drb基因拷贝数评估,单个等位基因的筛选和等位基因对的筛选;
6、所述校正分型包括组装consensus序列,序列比对,校正分型结果和提示变异;
7、所述hla-drb基因包括hla-drb3基因、hla-drb4基因和hla-drb5基因中的任意一种或至少两种的组合。
8、本专利技术中能够准确判断包括drb3/4/5在内的15个基因的拷贝数,与已知分型结果100%一致,再结合等位基因对的本文档来自技高网...
【技术保护点】
1.一种基于二代测序数据对HLA-DRB基因进行分型的方法,其特征在于,所述方法包括:测序数据质控,初步分型和校正分型;
2.根据权利要求1所述的方法,其特征在于,所述目标区域统计的指标包括碱基数、Q20、Q30、GC含量、插入片段长度、靶标区域比对率、捕获效率和HLA基因平均测序深度。
3.根据权利要求1或2所述的方法,其特征在于,所述质控的标准为:有效reads数大于500K,插入片段长度大于400bp,Q30大于0.85和HLA基因平均测序深度大于200,所述有效reads数为编辑距离<=2的reads数量。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述初步分型包括:
5.根据权利要求4所述的方法,其特征在于,步骤(1)中所述数据库包括IPD-IMGT/HLA数据库;
6.根据权利要求4或5所述的方法,其特征在于,步骤(5)中所述打分的公式如式(2)所示:
7.根据权利要求4-6中任一项所述的方法,其特征在于,步骤(5)中所述判断其基因型为纯合或杂合的公式如式(3)和式(4)所示:<
...【技术特征摘要】
1.一种基于二代测序数据对hla-drb基因进行分型的方法,其特征在于,所述方法包括:测序数据质控,初步分型和校正分型;
2.根据权利要求1所述的方法,其特征在于,所述目标区域统计的指标包括碱基数、q20、q30、gc含量、插入片段长度、靶标区域比对率、捕获效率和hla基因平均测序深度。
3.根据权利要求1或2所述的方法,其特征在于,所述质控的标准为:有效reads数大于500k,插入片段长度大于400bp,q30大于0.85和hla基因平均测序深度大于200,所述有效reads数为编辑距离<=2的reads数量。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述初步分型包括:
5.根据权利要求4所述的方法,其特征在于,步骤(1)中所述数据库包括ipd-imgt/hla数据库;<...
【专利技术属性】
技术研发人员:侯美灵,张军,朱秋洁,张雅文,康凯,孔令印,梁波,
申请(专利权)人:苏州贝康医疗器械有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。