一种简洁全面的拷贝数变异模式识别方法及其应用技术

技术编号：30544223 阅读：40 留言：0更新日期：2021-10-30 13:22

本发明专利技术涉及一种简洁全面的拷贝数变异模式识别方法及其应用，属于生物医学技术领域。本发明专利技术通过将获得的肿瘤样本的绝对拷贝数信息进行分类；并依据每种拷贝数片段在泛癌数据中的实际分布情况，形成一个176列数据信息的矩阵；计算每个肿瘤样本的拷贝数变异特征模式；利用非负矩阵分解算法计算每个肿瘤的具体拷贝数变异特征模式；量化每个肿瘤中拷贝数变异特征模式的活性；依据拷贝数变异特征模式对肿瘤进行分型；依据拷贝数变异特征模式的活性对肿瘤病人进行预后预测。从而实现对肿瘤病人预后的精准预测。预后的精准预测。预后的精准预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种简洁全面的拷贝数变异模式识别方法及其应用

[0001]本专利技术涉及一种简洁全面的拷贝数变异模式识别方法及其应用，属于生物医学

技术介绍

[0002]恶性肿瘤的分型以及预后的精准预测目前依然是未解决的医学难题。癌症主要是由体细胞基因组DNA的变异引起的。根据基因组变异的大小和特征，这些与癌症相关的DNA变异可分为以下四种类型：单碱基取代(single base substitution，SBS)，小片段插入和缺失(insertion/deletion，INDEL)，结构改变(包括易位/倒位)以及拷贝数变异(copy number alteration)。体细胞DNA的拷贝数变异在癌症中极为普遍，并且据报道是多种类型癌症进展的重要驱动力(1，2)。基因组DNA变异的特征模式是重复出现的基因组模式，是癌细胞发展过程中积累的诱变过程的印记(3，4)。拷贝数变异特征模式反映了，在癌症发展过程中特异性内源或外源性突变事件引起的重复拷贝数变异模式。单碱基变异的特征模式已在不同类型的癌症中有着广泛的研究(3，4)。拷贝数变异是多种癌症发生发展的重要驱动力。但是，系统研究拷贝数变异特征模式的实用工具，尤其是全面的适用于泛癌肿的分析工具依然缺乏。
[0003]参考文献
[0004]1.Beroukhim,R.et al.The landscape of somatic copy
‑
number alteration across human cancers.Nature 463,899<...

【技术保护点】

【技术特征摘要】
1.一种拷贝数变异模式识别方法，其特征在于：包括以下步骤：步骤1：提取肿瘤样本以及正常对照组织的基因组DNA，进行高通量全外显子组测序，全基因组测序或SNP芯片分析；步骤2：利用常规分析方法，从原始WES，WGS或SNP芯片数据获得肿瘤样本的绝对拷贝数信息；步骤3：对拷贝数片段进行分类；分类时参考每个具体拷贝数片段的前后拷贝数变化方向，共有三种类型，分别为高
‑
低
‑
高、低
‑
高
‑
低和梯度；分类时参考前后拷贝数变化大小，设为两类，分别为任何一端＞2和两边均≤2；分类时参考绝对拷贝数数值，绝对拷贝数数值设为七类，分别为0、1、2、3、4、5
‑
8和≥9；分类时参考杂合性缺失状态，设为两类，分别为有LOH和无LOH；分类时参考片段长度信息，设为四类，分别为S其长度<50kb、M其长度为50kb≤M长度<500kb、L其长度为500kb≤L长度<5Mb和E其长度为5Mb≤E长度；然后依据每种拷贝数片段在泛癌数据中的实际分布情况，最终总共形成176个拷贝数片段类型；形成一个有176列数据信息的矩阵，每一行代表一个具体肿瘤样本中具有某种拷贝数变异片段特征的拷贝数片段数目；步骤4：计算每个肿瘤样本的拷...

【专利技术属性】
技术研发人员：刘雪松，陶紫玉，吴宸旭，
申请(专利权)人：上海科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人