一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法技术

技术编号:20450117 阅读:59 留言:0更新日期:2019-02-27 03:40
本发明专利技术属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于经过获取BAF值步骤、确定BAF值的条件步骤,再根据公式得到所需要正常组织含量和肿瘤拷贝数值。本发明专利技术中检测方法用BAF值推算出CNV重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的CNV值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。

【技术实现步骤摘要】
一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法
本专利技术属于基因组学数据分析领域,尤其涉及一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法。
技术介绍
实体肿瘤的组织样本中,绝大多数情况下都含有一些正常组织,这是在活检取样过程中一个经常遇到的问题。在癌症的临床基因检测中,就有必要知道其正常组织的含量。同时,正常组织的含量的多少也会影响对肿瘤的拷贝数(CopyNumberVariants,CNV)的计算。这是一个所有临床基因检测实验室需要解决的困难。DNA拷贝数的变化(CNV)是癌症的一个主要治病原因,因此成为基因检测的一个重要指标。CNV目前的常用检测平台和金标准是基因芯片(microarray)。随着DNA二代测序(NGS)在基因组学领域的广泛应用,直接从NGS数据获得CNV结果已经逐渐在科研和临床检测中使用,并有最终取代基因芯片的势头。不论使用基因芯片还是NGS,CNV的计算都是来自于两种数据,log2Ratio和B-AlleleFrequency(BAF)。log2Ratio用于计算CNV片段,BAF则用于计算杂合体的缺失(Lossofheterozygosity,LOH)和等位基因的失衡(AllelicImbalance)。
技术实现思路
针对上述问题,本专利技术提供一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,用BAF值推算出CNV重复和缺失区域的肿瘤组织或正常组织含量,并可同时获得肿瘤的CNV值。公式简单,该检测方法很容易在临床基因检测中使用,易于推广。解决以上技术问题的本专利技术中的一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV重复片段的BAF值;(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:a)当肿瘤组织有一个CNV缺失时(CNLoss=1,而且假定缺失的是nB),,(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0<BAF<0.5);c是肿瘤组织的含量(正常组织含量因此是1–c),nA和nB分别是等位基因A和B的CNV值);b)当肿瘤组织的CNV重复时(CNGain>=1),假定nB=1,只有nA重复,这样下端的BAF一条带(0<BAF<0.5)就反映了nA的变化。定义:(TotalCopyNumber),其中,nt为总拷贝数;此时,。优化方案中,所述当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。本专利技术提出一种精确简便的新算法解决这个难题,这将会对实体肿瘤的基因检测及科研带来积极的作用。本专利技术利用基因芯片或DNA测序(NGS)数据中的B-AlleleFrequency(BAF)值对肿瘤组织中正常组织含量和肿瘤拷贝数(CNV)进行简单方便的检测计算。另外,BAF比log2Ratio对变化更加敏感,这比单纯使用log2Ratio的算法更有价值。附图说明下面结合附图及具体实施方式对本专利技术做更进一步详细说明:图1为本专利技术中肿瘤CNV和BAF的案例图图2为本专利技术中肿瘤组织中不同正常组织含量对在CNV一个缺失时BAF带分布的影响图图3为本专利技术中用CNV缺失片段的BAF值图图4为本专利技术中CNV重复区域的nt出现多个可能值时结果图具体实施方式下面结合具体实施方式对本专利技术进行进一步说明:实施例1(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV重复片段的BAF值;(3)根据公式得到所需要值:a)当肿瘤组织有一个CNV缺失时(CNLoss=1,而且假定缺失的是nB),,(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0<BAF<0.5);c是肿瘤组织的含量(正常组织含量因此是1–c),nA和nB分别是等位基因A和B的CNV值);b)当肿瘤组织的CNV重复时(CNGain>=1),假定nB=1,只有nA重复,这样下端的BAF一条带(0<BAF<0.5)就反映了nA的变化。定义:(TotalCopyNumber),其中,nt为总拷贝数;此时,。实施例2(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV重复片段的BAF值;(3)根据公式得到所需要值:a)当肿瘤组织有一个CNV缺失时(CNLoss=1,而且假定缺失的是nB),,(其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0<BAF<0.5);c是肿瘤组织的含量(正常组织含量因此是1–c),nA和nB分别是等位基因A和B的CNV值);b)当肿瘤组织的CNV重复时(CNGain>=1),假定nB=1,只有nA重复,这样下端的BAF一条带(0<BAF<0.5)就反映了nA的变化。定义:(TotalCopyNumber),其中,nt为总拷贝数;此时,。所述当CNV重复区域的nt出现多个可能值时,比较其对应的c值与CNV缺失区域的c值,同时参考其log2Ratio值。试验一如图1是一个肿瘤CNV和BAF的案例。图中上半部是log2Ratio在22个常染色体及X和Y染色体上的分布,其中每一个数据点反映探针的log2Ratio值,由此计算出CNV片段值。log2Ratio零值基线(log2Ratio=0)代表CNV的正常值(CN=2),CNV值大于零的片段代表CNV重复(CNGain),CNV值小于零的片段则代表CNV缺失(CNLoss)。图中的高于或低于零值基线的阈值线分别决定CNV重复或缺失的数目。高于第一条CNV重复阈值线(从零值基线算起)CNV重复为1(CNGain=1,总CN值为3),高于第二条CNV重复阈值线表示CNV重复为2或更多(CNGain>=2,总CN值>=4);低于第一条CNV缺失阈值线(从零值基线算起)CNV缺失为1(CNLoss=1,总CN值为1),低于第二条CNV缺失阈值线表示CNV缺失为2(CNLoss=2,总CN值=0)。图1中的下半部是BAF在22个常染色体及X和Y染色体上的分布,其中每一个数据点反映探针的BAF值,由此显示出BAF带(BAFBand),进而决定该区域是LOH还是AllelicImbalance。BAF带是以0.5中线呈镜像对称分布。当CNV片段正常时(CN=2,log2Ratio=0),相对的BAF显示3条带(BAF=0,0.5,1.0),如图中整个第2染色体;当CNV片段重复时,相对的BAF显示4条带(上下两条带表示纯合,BAF=0或1;中间两条带表示杂合),如图中整个第5染色体;当CNV片段缺失为1时(CNLoss=1),相对的BAF只有表示纯合的上下两条带,BAF=0或1),如图中的X染色体;当CNV片段缺失为2时(CNLoss=2),由于两个等位基因区域都缺失,探针的信号与背景信号相同,相对的BAF就会呈现杂乱无章的分布,图中没有这种例子显示。但是,当肿瘤组织中混有正常组织时,CNV重复和缺失相对的BAF带的分布将会受到本文档来自技高网...

【技术保护点】
1.一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV 重复片段的BAF值;(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:当肿瘤组织有一个CNV缺失时(CN Loss = 1, 而且假定缺失的是nB),

【技术特征摘要】
1.一种检测肿瘤组织中正常组织含量和肿瘤拷贝数的方法,其特征在于:包括以下步骤:(1)获取BAF值;根据基因芯片或NGS数据得到BAF值;(2)确定BAF值的条件:CNV一个缺失片段的BAF值,CNV重复片段的BAF值;(3)根据公式得到所需要正常组织含量和肿瘤拷贝数值:当肿瘤组织有一个CNV缺失时(CNLoss=1,而且假定缺失的是nB),,其中,BAF值采用两条代表杂合体的BAF带的下端一条带(0<BAF<0.5);c是肿瘤组织的含量(正常组织含量因此是1...

【专利技术属性】
技术研发人员:车志伟
申请(专利权)人:成都中珠健联基因科技有限责任公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1