本发明专利技术公开了一种基于SNP的亲缘关系鉴定方法,属于亲子鉴定技术领域。方法包括:获取样本S1和S2的SNP分型数据;假设S1为F1,以S2为基准,以SNP分型数据计算各种假设亲缘关系下S1的累计亲权指数CPI1;以S2为基准,每种假设亲缘关系下分别模拟多个基因数据Sm,计算Sm的累计亲权指数CPI2,得到每种亲缘关系的多个lg(CPI2)的概率分布;在各种假设亲缘关系下,判断lg(CPI1)是否符合lg(CPI2)的概率分布;若仅在除曾祖孙关系以外的一种亲缘关系符合,则S1与S2为该亲缘关系;若在至少两种亲缘关系下符合,则以lg(CPI1)最大对应的亲缘关系为S1与S2之间的亲缘关系。之间的亲缘关系。之间的亲缘关系。
【技术实现步骤摘要】
基于SNP的亲缘关系鉴定方法
[0001]本专利技术属于生物信息分析
,特别涉及一种基于SNP的亲缘关系鉴定方法。
技术介绍
[0002]遗传学理论已证实,子女的基因组DNA各有一半分别来源于亲生父母一方。亲缘关系鉴定就是依据遗 传学的基本原理,采用现代化的DNA分型检测技术来综合评判争议个体之间是否存在亲生、隔代或其他 血缘关系。目前亲缘关系鉴定包括以下几类:
[0003](1)常规的亲生血缘关系鉴定:这是目前需求量最大的一类亲权关系鉴定,包括父母子三方(又称为三 联体)、父子(或母子)双方(又称为二联体)的亲权鉴定。
[0004](2)隔代亲缘关系鉴定:这类鉴定指要确认曾祖父母、祖父母、与曾孙子(曾孙女)、孙子(孙女)之间 的亲缘关系。此外,还包括单纯的父系亲缘关系鉴定如要确认曾祖父、祖父、与曾孙子、孙子之间的亲 缘关系,以及单纯的母系亲缘关系鉴定如要确认曾祖母,外祖母,与外孙女,曾外孙女之间的亲缘关系。
[0005](3)疑难的亲缘关系鉴定:除上述两类外,还有一些比较疑难的亲缘关系鉴定,如父母皆疑(无)的同 胞(兄弟、兄妹、姐弟、姐妹)、表兄妹关系的鉴定,叔侄之间、姨和外甥女之间、舅舅与外甥(外甥女) 之间的亲缘关系鉴定等。
[0006]亲子鉴定是基因检测技术非常成熟的应用领域,一般通过检测两个检材的遗传标记,对两个样品的检 测结果进行比对,如果两个样品的遗传标记符合孟德尔遗传定律,则认为两个样品符合亲子关系。目前 常用的遗传标记主要有两种,短序列串联重复(STR)和单碱基多态性位点(SNP),此外也有一些研究采 用插入缺失(InDel)突变位点作为遗传标记物。一代测序技术是亲子鉴定领域应用最为成熟的检测技术, 一般通过21个STR位点来进行亲子鉴定与判别。一代测序有速度快,成本低和操作简便等优势,被各类 的鉴定机构广泛使用,是目前亲子鉴定方向的主要检测技术。
[0007]一代同胞关系鉴定使用的STR标记检测位点一般为19
‑
39个,STR标记平均具有0.2%的突变频率,用 于检测双方为生物学亲本与子代、生物学同胞、祖孙鉴定,也常出现基因突变导致的错配。因此STR用 于同胞鉴定,若发现1
‑
2个基因座不符合相应的遗传定律(考虑存在突变),《生物学全同胞关系鉴定实 施规范》建议增加常染色体体STR、Y染色体STR或线粒体DNA序列(SF/Z JD0105002
‑
2014,生物 学全同胞关系鉴定实施规范),一些研究提出可以结合其他遗传标记,比如SNP标记和/或插入缺失多 态性等更稳定的二等位基因遗传标记(汤美云,黄健,蔡金洪等。利用STR和Y染色体二等位基因标记 鉴定同胞兄弟关系[J]。法医学杂志,2012(03):190
‑
194。张素华,赵书民,李莉。采用STR和SNP遗传 标记鉴定全同胞姐妹关系[J]。法医学杂志,2010(03):185
‑
187)。由于STR检测数量有限、突变率较高 的,一代同胞关系鉴定常出现无法给出倾向性意见的情况。当STR用于祖孙鉴定时,《亲权鉴定技术规范》 要求同时提供祖父、祖母的检材,若出行1
‑
2个基因座不符合相应的遗传定律(考虑存在突变),应增加 检测其它的高度多态性且遗传稳定的STR基因座;若被检验的孩子为女孩,应尽可能对被检祖母与孙女 增加X
‑
STR的检验;若被检验的孩子为男孩,应
尽可能对被检祖父与孙子增加Y
‑
STR的检验。且只能 给出不排除存在生物学祖孙关系”的鉴定意见。
[0008]本专利技术专利采用新一代的高通量测序技术,以SNP位点为遗传标记物,通过对人类基因组中上千个二 态性常染色体的SNP位点进行目标区域捕获测序,每个SNP点位可以检测到低至千分之一的低频突变, 并通过特有的生物信息学分析以及数理统计算法,可以对同胞、半同胞/叔侄/姑侄/舅甥/姨甥/祖孙、曾 祖孙关系进鉴定,准确率>99.99%,检测对象不受性别限制。本方法可解决传统一代亲缘关系鉴定可行性 差,检出率低的问题。
技术实现思路
[0009]为了解决上述问题,本专利技术专利采用新一代的高通量测序技术,以SNP位点为遗传标记物,通过对人 类基因组中上千个SNP位点进行目标区域捕获测序,每个SNP点位可以检测到低至千分之一的低频突变, 并通过特有的生物信息学分析以及统计算法,可至少判断三种亲缘关系,准确率>99.99%。所述技术方案 如下:
[0010]本专利技术实施例提供了一种基于SNP的亲缘关系鉴定方法,所述方法包括以下步骤:
[0011]S101:获取待亲缘鉴定的两个样本S1和S2的SNP分型数据;
[0012]S102:假设S1为F1,以S2为基准,以SNP分型数据计算各种假设亲缘关系下S1的累计亲权指数CPI1;
[0013]S103:以S2为基准,每种假设亲缘关系下分别模拟多个基因数据Sm,以SNP分型数据计算Sm的累计 亲权指数CPI2,再计算得到每种亲缘关系的多个lg(CPI2)的概率分布;
[0014]S104:在各种假设亲缘关系下,通过统计学算法判断lg(CPI1)是否符合lg(CPI2)的概率分布;若 各种假设亲缘关系下均不符合,则S1和S2之间的假设亲缘关系不成立;若仅在除曾祖孙关系以外的一 种亲缘关系符合,则S1与S2为该亲缘关系;若在至少两种亲缘关系下符合,则以lg(CPI1)最大对应 的亲缘关系为S1与S2之间的亲缘关系;
[0015]其中,假设亲缘关系分为如下几种:类别1:亲子关系;类别2:同胞关系;类别3:半同胞关系、叔 侄关系和祖孙关系;类别4:曾祖孙关系。
[0016]进一步地,在步骤S104中,若只有曾祖孙关系符合,则不能判断S1与S2为曾祖孙关系。
[0017]具体地,所述步骤S103包括:
[0018]假设S1与S2的亲缘关系为类别1,则模拟出M1个S2的子代的基因数据Sm1;
[0019]假设S1与S2的亲缘关系为类别2,则模拟出M2个S2的同胞的基因数据Sm2;
[0020]假设S1与S2的亲缘关系为类别3,则模拟出M3个S2的半同胞、侄子或孙子的基因数据Sm3;
[0021]假设S1与S2的亲缘关系为类别4,则模拟出M4个S2的曾孙的基因数据Sm4;
[0022]所述M1≥30,M2≥30,M3≥30,M4≥30。
[0023]其中,在步骤S103中,以基因型的理论频率模拟多个基因数据Sm。
[0024]其中,所述累计亲权指数CPI=PI1
×
PI2
×
PI3
×…×
PIn,所述PIn为两个样本共有SNP位点的PI值, 所述PI值为待测个体之间存在亲缘关系情况下F1是某种基因组型可能性与随机个体与F1在该亲缘关系 下F1出现某种基因组型可能性的比值。
[0025]具体地本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于SNP的亲缘关系鉴定方法,其特征在于,所述方法包括以下步骤:S101:获取待亲缘鉴定的两个样本S1和S2的SNP分型数据;S102:假设S1为F1,以S2为基准,以SNP分型数据计算各种假设亲缘关系下S1的累计亲权指数CPI1;S103:以S2为基准,每种假设亲缘关系下分别模拟多个基因数据Sm,以SNP分型数据计算Sm的累计亲权指数CPI2,再计算得到每种亲缘关系的多个lg(CPI2)的概率分布;S104:在各种假设亲缘关系下,通过统计学算法判断lg(CPI1)是否符合lg(CPI2)的概率分布;若各种假设亲缘关系下均不符合,则S1和S2之间的假设亲缘关系不成立;若仅在除曾祖孙关系以外的一种亲缘关系符合,则S1与S2为该亲缘关系;若在至少两种亲缘关系下符合,则以lg(CPI1)最大对应的亲缘关系为S1与S2之间的亲缘关系;其中,假设亲缘关系分为如下几种:类别1:亲子关系;类别2:同胞关系;类别3:半同胞关系、叔侄关系和祖孙关系;类别4:曾祖孙关系。2.根据权利要求1所述的基于SNP的亲缘关系鉴定方法,其特征在于,在步骤S104中,若只有曾祖孙关系符合,则不能判断S1与S2为曾祖孙关系。3.根据权利要求1所述的基于SNP的亲缘关系鉴定方法,其特征在于,所述步骤S103包括:假设S1与S2的亲缘关系为类别1,则模拟出M1个S2的子代的基因数据Sm1;假设S1与S2的亲缘关系为类别2,则模拟出M2个S2的同胞的基因数据Sm2;假设S1与S2的亲缘关系为类别3,则模拟出M3个S2的半同胞、侄子或孙子的基因数据Sm3;假设S1与S2的亲缘关系为类别4,则模拟出M4个S2的曾孙的基因数据Sm4;所述M1≥30,M2≥30,M3≥30,M4≥30。4.根据权利要求3所述的基于S...
【专利技术属性】
技术研发人员:巫萍,严俊,曾丰波,黄奎匀,熊露,
申请(专利权)人:武汉蓝沙医学检验实验室有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。