根据具有多个供体的DNA样本来识别供体的STR的系统和方法技术方案

技术编号:10203330 阅读:160 留言:0更新日期:2014-07-12 02:04
在本发明专利技术的一方面下,提供分析来自两个或更多个供体的DNA的混合物以识别在多个STR基因座处至少一个供体的STR基因型的方法。对于各STR基因座,可独立地确定可能的解决方案,各解决方案包括供体的数目、在该基因座处各供体的STR基因型、他们各自成分的丰度比、和置信度得分。然后将具有最高置信度得分的STR基因座的最可能解决方案用作已知条件,根据其可连续获得其他STR基因座的解决方案,在各情况下,使用任何之前分析的基因座的最可能解决方案作为已知条件。输出在最后分析的STR基因座的最可能的解决方案中使用的供体的数目和丰度比共享作为已知条件的STR基因型。

【技术实现步骤摘要】
【国外来华专利技术】根据具有多个供体的DNA样本来识别供体的STR的系统和方法相关申请的交叉引用本申请要求2011年6月22日提交的美国临时专利申请N0.61/499,965的权益,其通过引用方式整体并入本文中。
本申请涉及根据具有多个供体(contributor)的脱氧核糖核酸(DNA)样本来识别某供体的短串联重复(STR)基因型的系统和方法。专利技术背景近几年,已经开发出根据个体各自基因型来识别个体的技术,例如,根据在个体的DNA序列中在已知基因座、或具体位直处出现的称为短串联重复(STR)的喊基对的特定序列。如在本领域所已知,STR是重复(例如,(CATG)n,其中η是重复数目)和在特定STR基因座处出现的两个或多个核苷酸的模式。在不同STR基因座处重复不同特定序列,但是在各基因座处个体仅在该基因座重复的特定遗传序列的重复数目上不同,重复数目限定“等位基因”。此外,在给定的STR基因座处,各个体具有至多两个可能的等位基因、或者遗传序列的特定重复数目,一个序列由个体的父亲提供以及另一序列由个体的母亲提供。如果两个等位基因相同(例如,两等位基因均具有8次重复),则个体定义为在该STR基因座处具有纯合等位基因,以及如 果两个等位基因不同(例如,一个等位基因具有8次重复,而另一等位基因具有15次重复),则个体定义为在该基因座处具有杂合等位基因。因此,在STR基因座处等位基因各重复数目提供在该基因座处个体的等位基因的身份,这反过来限定在该基因座处个体的STR基因型。尽管给定个体可与另一个体在单一 STR基因座处具有相同STR基因型,但是即使在少量基因座内该两个体彼此具有全部相同STR基因型在统计学上不可能,更别说在十个或更多个基因座内,随着在其处比较那些个体的STR基因型的基因座数目增加,匹配似然性降低。因此,在STR基因座的充足数目内个体的STR基因型可用作“遗传指纹”,该“遗传指纹”基本上能独特地识别该个体。对于进一步的细节,参见例如,Perlin等人,AnInformation Gap in DNA Evidence Interpretation, PLOS 0NE4(12)e8327,第 1-12 页,其通过引用方式整体并入本文中。然而,一直以来难以计算-要不就是难以控制计算,从而根据具有来自多个个体的DNA成分(contribution)的DNA样本来识别在多个基因座处个体的STR基因型。例如,以前尝试根据这些混合的DNA混合物来识别STR基因型,参见例如,Perlin的美国专利 N0.6,807,490,Wang 等人的美国专利 N0.7,162,372,Wang 的美国专利 N0.7,860,661、和Tvedebrink等人的美国专利公开N0.2010/0198522,每一篇专利均通过引用方式整体并入本文中。专利技术概述本专利技术的实施方案提供根据具有多个供体的脱氧核糖核酸(DNA)样本来识别供体的短串联重复(STR)基因型的系统和方法。在本专利技术的一方面下,提供分析来自两个或多个供体的DNA的混合物以识别在多个STR基因座处所述供体至少之一的STR基因型的方法。方法可包括:(a)对于在所述多个STR基因座中各STR基因座,鉴于表征在该基因座处在所述混合物中STR的相对丰度和尺寸的数据,独立地确定所述STR基因座的多个可能的解决方案(solution)和可能的解决方案的各置信度得分。各解决方案可包括:(i)供体的限定数目N,(ii)在该基因座处N个供体各自限定的STR基因型,以及(iii)来自N个供体的各自成分的限定丰度比。方法进一步可包括:(b)对于具有最高置信度得分的STR基因座,选择具有阈值以上的似然性的该基因座的一个或多个可能的解决方案。方法进一步可包括:(c)对于具有下一最高置信度得分的STR基因座,通过以下步骤分析该基因座:(i)鉴于数据和鉴于所述具有最高置信度得分的STR基因座的选择的一个或多个解决方案的所述限定数目N和所述限定丰度比,确定所述STR基因座的多个可能的解决方案,以及通过(ii)选择具有阈值以上似然性的该基因座的一个或多个解决方案。方法进一步可包括:(d)鉴于上一分析的STR基因座的可能的解决方案的所述限定数目N和所述限定丰度比,以置信度得分下降顺序对剩余的各STR基因座连续重复步骤(c)。方法进一步可包括:(e)输出分析的最后分析的STR基因座的最可能的选择的解决方案的STR基因型以及共享用于确定所述最后分析的STR基因座的所述最可能的选择的解决方案的所述限定数目N和所述限定丰度比作为已知条件的各之前分析的STR基因座的各选择的解决方案的STR基因型。在一些实施方案中,本方法进一步包括在实施步骤(a)之前获得供体的限定数目N。根据人口统计可获得所述供体的限定数目N。方法可进一步包括:(f)获得供体的新限定数目N’ ;(g)鉴于所述供体的新限定数目N’来重复步骤(a)至⑷;以及(h)输出所述分析的最后STR基因座的步骤(g)的所述最可能的选择的解决方案的所述STR基因型以及共享用于确定所述最后STR基因座的步骤(g)的所述最可能的选择的解决方案的供体的所述新限定数目N’和所述限定丰度比作为已知条件的各之前分析的STR基因座的各选择的解决方案的所述STR基因型。在一些实施方案中,鉴于多少STR存在于在数据中具有最大STR的基因座处的数据中,通过确定多少STR存在于在各基因座处的数据中、以及通过限定供体的数目N为能够构成所述DNA样本的个体的最小数目来获得所述供体的限定数目N。在一些实施方案中,步骤(a)包括:(i)限定所述供体的限定数目N的成分的假设丰度比范围;(ii)对于各STR基因座,限定与所述供体的限定数目N和表征在该基因座处STR的尺寸的数据相一致的在该基因座处假设STR基因型的组;以及(iii)对于各STR基因座,根据在步骤(a) (ii)中限定的该基因座的所述假设STR基因型的组以及在步骤(a) (i)中限定的不同假设丰度比来确定所述多个可能的解决方案。在一些实施方案中,步骤(a)进一步包括:(iv)对于各STR基因座,比较该基因座的步骤(a) (iii)的各解决方案与表征在该基因座处STR的所述丰度和尺寸的数据以获得该解决方案的所述似然性;以及(V)对于各STR基因座,分析该基因座的所述解决方案的所述似然性以获得该STR基因座的所述置信度得分。在一些实施方案中,分析在所述步骤(a) (V)中所述解决方案的所述似然性包括通过将该解决方案的所述似然性除以所述下一最可能的解决方案的所述似然性来获得各解决方案的似然比。在其 他实施方案中,分析在所述步骤(a) (V)中所述解决方案的似然性包括确定各基因座的似然性分布的稀疏性。在又一其他实施方案中,分析在所述步骤(a)(v)中所述解决方案的所述似然性包括确定各基因座的似然性分布的峰态。在一些实施方案中,在进行所述方法之前,各供体具有未知的STR基因型。在一些实施方案中,分析来自二至四个人供体的DNA的混合物。在一些实施方案中,在进行所述方法之前,二、三或四个人供体具有未知的STR基因型。在一些实施方案中,分析来自三或四个人供体的DNA的混合物。在一些实施方案中,在进行所述方法之前三或四个人供体具有未知STR基因型。在一本文档来自技高网...

【技术保护点】
一种分析来自两个或更多个供体的DNA的混合物以识别在多个STR基因座处所述供体至少之一的STR基因型的方法,所述方法包括:(a)对于在所述多个STR基因座中的各STR基因座,鉴于表征在该基因座处在所述混合物中STR的相对丰度和尺寸的数据,独立地确定所述STR基因座的多个可能的解决方案和可能的解决方案的各置信度得分,各解决方案包括:(i)供体的限定数目N,(ii)在该基因座处N个供体各自限定的STR基因型,以及(iii)来自所述N个供体的各自成分的限定丰度比;(b)对于具有最高置信度得分的STR基因座,选择具有阈值以上的似然性的该基因座的一个或多个可能的解决方案;(c)对于具有下一最高置信度得分的STR基因座,通过以下步骤分析该基因座:(i)鉴于数据和鉴于所述具有最高置信度得分的STR基因座的选择的一个或多个解决方案的所述限定数目N和所述限定丰度比,确定所述STR基因座的多个可能的解决方案,以及通过(ii)选择具有阈值以上似然性的该基因座的一个或多个解决方案;(d)鉴于上一分析的STR基因座的可能的解决方案的所述限定数目N和所述限定丰度比,以置信度得分下降顺序对剩余的各STR基因座连续重复步骤(c);以及(e)输出分析的最后分析的STR基因座的最可能的选择的解决方案的STR基因型以及共享用于确定所述最后分析的STR基因座的所述最可能的选择的解决方案的所述限定数目N和所述限定丰度比作为已知条件的各之前分析的STR基因座的各选择的解决方案的STR基因型。...

【技术特征摘要】
【国外来华专利技术】2011.06.22 US 61/499,9651.一种分析来自两个或更多个供体的DNA的混合物以识别在多个STR基因座处所述供体至少之一的STR基因型的方法,所述方法包括: (a)对于在所述多个STR基因座中的各STR基因座,鉴于表征在该基因座处在所述混合物中STR的相对丰度和尺寸的数据,独立地确定所述STR基因座的多个可能的解决方案和可能的解决方案的各置信度得分,各解决方案包括: (i)供体的限定数目N, (?)在该基因座处N个供体各自限定的STR基因型,以及 (iii)来自所述N个供体的各自成分的限定丰度比; (b)对于具有最高置信度得分的STR基因座,选择具有阈值以上的似然性的该基因座的一个或多个可能的解决方案; (c)对于具有下一最高置信度得分的STR基因座,通过以下步骤分析该基因座:(i)鉴于数据和鉴于所述具有最高置信度得分的STR基因座的选择的一个或多个解决方案的所述限定数目N和所述限定丰度比,确定所述STR基因座的多个可能的解决方案,以及通过(?)选择具有阈值以上似然性的该基因座的一个或多个解决方案; (d)鉴于上一分析的STR基因座的可能的解决方案的所述限定数目N和所述限定丰度t匕,以置信度得分下降顺序对剩余的各STR基因座连续重复步骤(c);以及 (e)输出分析的最后分析的STR基因座的最可能的选择的解决方案的STR基因型以及共享用于确定所述最后分析的STR基因座 的所述最可能的选择的解决方案的所述限定数目N和所述限定丰度比作为已知条件的各之前分析的STR基因座的各选择的解决方案的STR基因型。2.权利要求1所述的方法,其进一步包括在实施步骤(a)之前获得供体的所述限定数目N。3.权利要求2所述的方法,其中根据人口统计来获得所述供体的限定数目N。4.权利要求2所述的方法,其进一步包括: (f)获得供体的新限定数目N’; (g)鉴于所述供体的新限定数目N’来重复步骤(a)至(d);以及 (h)输出所述分析的最后STR基因座的步骤(g)的所述最可能的选择的解决方案的所述STR基因型以及共享用于确定所述最后STR基因座的步骤(g)的所述最可能的选择的解决方案的供体的所述新限定数目N’和所述限定丰度比作为已知条件的各之前分析的STR基因座的各选择的解决方案的所述STR基因型。5.权利要求2所述的方法,其中鉴于多少STR存在于在数据中具有最大STR的基因座处的数据中,通过确定多少STR存在于在各基因座处的数据中、以及通过限定供体的数目N为能够构成所述DNA样本的个体的最小数目来获得所述供体的限定数目N。6.权利要求1所述的方法,其中步骤(a)包括: (i)限定所述供体的限定数目N的成分的假设丰度比范围; (?)对于各STR基因座,限定与所述供体的限定数目N和表征在该基因座处STR的尺寸的数据相一致的在该基因座处假设STR基因型的组;以及 (iii)对于各STR基因座,根据在步骤(a) (ii)中限定的该基因座的所述假设STR基因型的组以及在步骤(a) (i)中限定的不同假设丰度比来确定所述多个可能的解决方案。7.权利要求6所述的方法,其中步骤(a)进一步包括: (iv)对于各STR基因座,比较该基因座的步骤(a) (iii)的各解决方案与表征在该基因座处STR的所述丰度和尺寸的数据以获得该解决方案的所述似然性;以及 (V)对于各STR基因座,分析该基因座的所述解决方案的所述似然性以获得该STR基因座的所述置信度得分。8.权利要求7所述的方法,其中分析在所述步骤(a)(V)中所述解决方案的所述似然性包括通过将该解决方案的所述似然性除以所述下一最可能的解决方案的所述似然性来获得各解决方案的似然比。9.权利要求7所述的方法,其中分析在所述步骤(a)(V)中所述解决方案的似然性包括确定各基因座的似然性分布的稀疏性。10.权利要求7所述的方法,其中分析在所述步骤(a)(V)中所述解决方案的所述似然性包括确定各基因座的似然性分布的峰态。11.权利要求1所述的方法,其中在进行所述方法之前,各供体具有未知的STR基因型。12.权利要求1所述的方法,其中分析来自二至四个人供体的DNA的混合物。13.权利要求12所述的方法,其中在进行所述方法之前,二、三或四个人供体具有未知的STR基因型。14.权利要求1所述的方法,其中分析来自三或四个人供体的DNA的混合物。15.权利要求14的方法,其中在进行所述方法之前三或四个人供体具有未知STR基因型。16.权利要求1所述的方法,其中分析四个人供体的DNA的混合物。17.权利要求16所述的方法,其中在进行所述方法之前四个人供体各自具有未知STR基因型。18.权利要求1所述的方法,其中在步骤(a)中确定的所述可能的解决方案包括N为2、3、或4的各单独的情况的解决方案。19.权利要求1所述的方法,其中通过在该基因座处在所述混合物中STR的...

【专利技术属性】
技术研发人员:B·拉森R·施赖纳C·T·刘易斯
申请(专利权)人:沃数据系统公司
类型:发明
国别省市:美国;US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1