用于检测伴侣未知的基因融合的方法技术

技术编号:30670641 阅读:21 留言:0更新日期:2021-11-06 08:52
一种用于检测基因融合的方法包含在引物池存在的情况下对核酸样品进行扩增以产生多个扩增子。所述引物池包含靶向驱动基因的多个外显子

【技术实现步骤摘要】
【国外来华专利技术】用于检测伴侣未知的基因融合的方法
[0001]相关申请的交叉引用
[0002]本申请根据35U.S.C.119(e)要求于2019年3月22日提交的美国临时申请第62/822,429号的权益。前述申请的全部内容以引用的方式并入本文中。


[0003]本申请总体上涉及用于检测基因融合的方法、系统和计算机可读介质,并且更具体地涉及基于使用下一代测序技术对驱动基因中的外显子

外显子连接处对靶向RNA测序的基因融合进行的伴侣未知的检测。

技术实现思路

[0004]由像ALK、RET、NTRK1等驱动基因中的染色体重新布置事件产生的基因融合转录物已成为癌症诊断和靶向疗法选择的重要生物标志物。根据各个示例性实施例,提供了用于基于驱动基因中的一些或所有外显子

外显子连接处的靶向RNA测序对基因融合进行检测的方法。测量每个外显子

外显子连接处的表达并且检测表达不平衡模式可以预测样品中涉及所述驱动基因的基因融合事件。基因融合事件可以以伴侣未知的方式检测,即不使用对特定融合伴侣基因或特定断点信息的任何先验知识。所述方法可以检测涉及测试样品中的任何靶向驱动基因的融合,并且可以预测驱动基因内被鉴定为对于融合为阳性的近似断点位置。基因融合事件是与置信度评分和p值一起检测和报告的。基于来自一组正常样品的读段数据构建的RNA基线可提高融合检测的稳健性和准确性。本文所述的方法的结果可以与如所靶向融合同种型测序等融合检测的其它方法的结果一起报告。
[0005]基于表达失衡对基因融合进行检测由于各种因素,如驱动基因基于样品类型、组织类型、条形码多路复用和肿瘤含量的RNA表达的可变性而具有挑战性。本文描述的方法借助于通过将每基因多个扩增子放置在具体模式中将基因融合产物中的不平衡的表达特征建模为覆盖率模式检测问题、对驱动基因中的扩增子的覆盖率表达值进行归一化,应用利用依据一组正常样品计算的基线进行的基因特异性校正并且计算不平衡评分和p值来解决这些挑战中的一些挑战。
[0006]根据示例性实施例,提供了一种用于检测基因融合的方法,所述方法包括:(a)在引物池存在的情况下对核酸样品进行扩增以产生多个扩增子,所述引物池包含靶向驱动基因的多个外显子

外显子连接处的引物,其中所述扩增子与所靶向外显子

外显子连接处相对应;(b)对所述扩增子进行测序以产生多个读段;(c)将所述读段与参考序列进行比对,所述参考序列包含与所述驱动基因的所述所靶向外显子

外显子连接处相对应的所述扩增子的核酸序列;(d)确定与每个所靶向外显子

外显子连接处相对应的每个扩增子的读段数量;(e)将每个扩增子的所述读段数量除以所述驱动基因的所述扩增子之中的最大读段数量以得到每个扩增子的经归一化读段计数;(f)对所述扩增子的所述经归一化读段计数应用基线校正以形成经校正读段计数,其中所述基线校正使用基于多个正常样品的扩增子的读段计数的基线值;(g)确定与所述驱动基因的5'端相对应的扩增子的经校正读段计数和
与所述驱动基因的3'端相对应的扩增子的经校正读段计数之间的不平衡;以及(h)基于所述不平衡来检测所述驱动基因中的基因融合。
[0007]根据示例性实施例,提供了一种用于检测基因融合的系统,所述系统包括机器可读存储器和与所述存储器连通的处理器,其中所述处理器被配置成执行机器可读指令,所述机器可读指令当由所述处理器执行时使所述系统执行方法,所述方法包括:(a)在所述处理器处接收通过在引物池存在的情况下对核酸样品进行扩增而产生的多个扩增子的多个核酸序列读段,所述引物池包含靶向驱动基因的多个外显子

外显子连接处的引物,其中所述扩增子与所述外显子

外显子连接处相对应;(b)将所述读段与参考序列进行比对,所述参考序列包含与所述驱动基因的所述所靶向外显子

外显子连接处相对应的所述扩增子的核酸序列;(c)确定与每个所靶向外显子

外显子连接处相对应的每个扩增子的读段数量;(d)将每个扩增子的所述读段数量除以所述驱动基因的所述扩增子之中的最大读段数量以得到每个扩增子的经归一化读段计数;(e)对所述扩增子的所述经归一化读段计数应用基线校正以形成经校正读段计数,其中所述基线校正使用基于多个正常样品的扩增子的读段计数的基线值;(f)确定与所述驱动基因的5'端相对应的扩增子的经校正读段计数和与所述驱动基因的3'端相对应的扩增子的经校正读段计数之间的平衡;以及(f)基于所述不平衡来检测所述驱动基因中的基因融合。
[0008]根据示例性实施例,提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质包括指令,所述指令当由处理器执行时使所述处理器执行用于检测基因融合的方法,所述方法包括:(a)在所述处理器处接收通过在引物池存在的情况下对核酸样品进行扩增而产生的多个扩增子的多个核酸序列读段,所述引物池包含靶向驱动基因的多个外显子

外显子连接处的引物,其中所述扩增子与所述外显子

外显子连接处相对应;(b)将所述读段与参考序列进行比对,所述参考序列包含与所述驱动基因的所述所靶向外显子

外显子连接处相对应的所述扩增子的核酸序列;(c)确定与每个所靶向外显子

外显子连接处相对应的每个扩增子的读段数量;(d)将每个扩增子的所述读段数量除以所述驱动基因的所述扩增子之中的最大读段数量以得到每个扩增子的经归一化读段计数;(e)对所述扩增子的所述经归一化读段计数应用基线校正以形成经校正读段计数,其中所述基线校正使用基于多个正常样品的扩增子的读段计数的基线值;(f)确定与所述驱动基因的5'端相对应的扩增子的经校正读段计数和与所述驱动基因的3'端相对应的扩增子的经校正读段计数之间的平衡;以及(f)基于所述不平衡来检测所述驱动基因中的基因融合。
[0009]根据示例性实施例,提供了一种用于检测基因融合的方法,所述方法包括:(a)在引物池存在的情况下对核酸样品进行扩增以产生多个扩增子,所述引物池包含靶向驱动基因的多个外显子

外显子连接处的引物,其中所述扩增子与所述外显子

外显子连接处相对应;(b)对所述扩增子进行测序以产生多个读段;(c)将所述读段与参考序列进行比对;(d)通过将与每个扩增子相对应的读段数量除以所述驱动基因的所述扩增子之中的最大读段数量来对读段数量进行归一化以得到每个扩增子的经归一化读段计数;(e)对所述驱动基因的所述扩增子的所述经归一化读段计数应用基线校正以形成经校正读段计数,其中所述扩增子的所述经校正读段计数通过所述经归一化读段计数除以所述扩增子的基线值的log2确定;(f)计算每个经校正读段计数的二元分割评分以提供与所述多个扩增子相对应的多个二元分割评分;以及(g)基于与最大绝对二元分割评分相对应的扩增子指数来确定
所述基因融合的预测断点。
[0010]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于检测基因融合的方法,所述方法包括:在引物池存在的情况下对核酸样品进行扩增以产生多个扩增子,所述引物池包含靶向驱动基因的多个外显子

外显子连接处的引物,其中所述扩增子与所靶向外显子

外显子连接处相对应;对所述扩增子进行测序以产生多个读段;将所述读段与参考序列进行比对,所述参考序列包含与所述驱动基因的所述所靶向外显子

外显子连接处相对应的所述扩增子的核酸序列;确定与每个所靶向外显子

外显子连接处相对应的每个扩增子的读段数量;将每个扩增子的所述读段数量除以所述驱动基因的所述扩增子之中的最大读段数量以得到每个扩增子的经归一化读段计数;对所述扩增子的所述经归一化读段计数应用基线校正以形成经校正读段计数,其中所述基线校正使用基于多个正常样品的扩增子的读段计数的基线值;确定与所述驱动基因的5'端相对应的扩增子的经校正读段计数和与所述驱动基因的3'端相对应的扩增子的经校正读段计数之间的不平衡;以及基于所述不平衡来检测所述驱动基因中的所述基因融合。2.根据权利要求1所述的方法,其中所述确定不平衡进一步包括:计算第一扩增子到第i扩增子的经校正读段计数X的部分和S
i
,其中S
i
=X1+

+X
i
;以及计算所述第一扩增子到第n扩增子的经校正读段计数的总和S
n
,其中S
n
=X1+

+X
n
,其中n是经校正读段计数的总数。3.根据权利要求2所述的方法,其中所述确定不平衡进一步包括通过以下确定所述第i扩增子的二元分割评分Z
i
:4.根据权利要求3所述的方法,其中所述确定不平衡进一步包括基于与最大绝对二元分割评分相对应的扩增子指数来确定所述基因融合的预测断点。5.根据权利要求1所述的方法,其中所述确定不平衡进一步包括基于观察到的不平衡值和预期不平衡值之比来确定不平衡评分。6.根据权利要求5所述的方法,其中所述预期不平衡值基于基线值的第一阵列,并且所述观察到的不平衡值基于所述经归一化读段计数的第二阵列,其中每个阵列中的阵列元素的数量为N。7.根据权利要求6所述的方法,其中所述确定不平衡评分进一步包括:计算所述第一阵列的从阵列元素(1+b)到阵列元素N的基线值的第一总和,其中b为预测断点;计算所述第一阵列的从阵列元素1到所述阵列元素N的基线值的第二总和;以及将所述第一总和除以所述第二总和以形成所述预期不平衡值。8.根据权利要求6所述的方法,其中所述确定不平衡评分进一步包括:计算所述第二阵列的从阵列元素(1+b)到阵列元素N的经归一化读段计数的第一总和,
其中b为预测断点;计算所述第二阵列的从阵列元素1到所述阵列元素N的经归一化读段计数的第二总和;以及将所述第一总和除以所述第二总和以形成所述观察到的不平衡值。9.根据权利要求6所述的方法,其中所述确定不平衡评分进一步包括:对于位于所述5'端处的所述驱动基因,计算所述第一阵列的从阵列元素1到阵列元素b的基线值的第一总和,其中b为预测断点;计算所述第一阵列的从阵列元素1到所述阵列元素N的基线值的第二总和;以及将所述第一总和除以所述第二总和以形成所述预期不平衡值。10.根据权利要求6所述的方法,其中所述确定不平衡评分进一步包括:对于位于所述5'端处的所...

【专利技术属性】
技术研发人员:J
申请(专利权)人:生命科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1