【技术实现步骤摘要】
一种结构变异的检测方法
本专利技术属于基因检测
,具体涉及一种结构变异的检测方法及其相关的系统、装置、计算机可读存储介质、设备。
技术介绍
起源于基因组内部的结构变异,包括同一条染色体内部的缺失,倒位,复制,以及不同染色体之间的异常连接。无论是哪种事件造成,其结果往往表现出两个基因的不同部分物理上连接到一起,转录以后,可以在转录水平上得到一个由两个不同基因的转录本的一部分构成的一个新的转录本。这些结构变异基因在癌症的发生发展过程中具有重要的科学意义,对于研究肿瘤的发生发展机理,肿瘤的治疗和监控具有极其重要的医学价值。例如BCR->ABL在血液肿瘤和膀胱癌,肺癌,恶性胶质瘤等肿瘤中广泛存在,FGFR3->TACC3主要出现在膀胱癌、宫颈鳞癌与宫颈腺癌中,EML4->ALK主要出现在肺癌中。基于二代测序技术手段的结构变异检测技术已经出现较长时间了,主要是通过对目标区域或者全基因组进行测序,对测序得到的序列进行分析来判断结构变异的发生与否。DNA水平的检测主要是通过将测序得到的数据比对到基因组上,根据比对的读段是否发生了断裂比对,也就是读段的两部分分别比对到基因组的不同位置,来搜集可能支持结构变异发生事件的证据,如果发生了断裂比对,则进一步对发生断裂比对的读段两部分进行分析,根据两部分比对的位置,链向来反推结构变异发生的起因,计算结构变异发生的结果。如果是双端测序,同一个模版经过测序会有两条读段产生,则可以根据两条配对的读段的比对情况是否异常收集支持结构变异的异常读段对,正常情况下两 ...
【技术保护点】
1.一种结构变异的检测方法,其特征在于,所述检测方法包含以下步骤:/n1)将测序数据比对至参考基因组序列或参考主转录本序列;/n2)寻找正常比对读段(read)、发生断裂比对的读段和不一致比对读段对;/n3)对发生断裂比对的读段和不一致比对读段对进行分类;/n4)分别对不同类别的断裂比对读段和不一致比对读段对进行分组,将支持同一个结构变异事件的读段归入同一个集合;/n5)对于由断裂比对读段确定的结构变异事件,通过对支持该结构变异事件的读段进行组装形成保守序列;/n6)基于保守序列确定精确的断点位置;/n7)分别对断裂比对读段支持的结构变异和不一致比对读段对支持的结构变异进行合并,所述合并是指将断点相近、类型相同的结构变异事件合并为同一个结构变异事件;/n8)将断点相近、类型相同的断裂比对读段支持的结构变异与不一致比对读段对支持的结构变异合并;/n9)删除保守序列能够完整的连续匹配到基因组上一段序列或者能够发生多处一致性比对的结构变异事件;/n10)计算结构变异事件频率。/n
【技术特征摘要】
1.一种结构变异的检测方法,其特征在于,所述检测方法包含以下步骤:
1)将测序数据比对至参考基因组序列或参考主转录本序列;
2)寻找正常比对读段(read)、发生断裂比对的读段和不一致比对读段对;
3)对发生断裂比对的读段和不一致比对读段对进行分类;
4)分别对不同类别的断裂比对读段和不一致比对读段对进行分组,将支持同一个结构变异事件的读段归入同一个集合;
5)对于由断裂比对读段确定的结构变异事件,通过对支持该结构变异事件的读段进行组装形成保守序列;
6)基于保守序列确定精确的断点位置;
7)分别对断裂比对读段支持的结构变异和不一致比对读段对支持的结构变异进行合并,所述合并是指将断点相近、类型相同的结构变异事件合并为同一个结构变异事件;
8)将断点相近、类型相同的断裂比对读段支持的结构变异与不一致比对读段对支持的结构变异合并;
9)删除保守序列能够完整的连续匹配到基因组上一段序列或者能够发生多处一致性比对的结构变异事件;
10)计算结构变异事件频率。
2.根据权利要求1所述的检测方法,其特征在于,步骤2)中还包含通过所述正常比对读段统计插入片段长度、计算插入片段长度分布的主要参数的步骤;所述主要参数优选最大值、最小值和/或均值。
3.根据权利要求1-2任一项所述的检测方法,其特征在于,利用SA标签寻找发生断裂比对的读段和/或不一致比对读段对。
4.根据权利要求1-3任一项所述的检测方法,其特征在于,步骤8)中,进行合并的条件包括一个断裂比对读段支持的结构变异事件的断点与另一个类型相同的不一致比对读段对支持的结构变异事件的断点距离在最大插入序列长度之内。
5.根据权...
【专利技术属性】
技术研发人员:伍林军,白健,茹兰兰,郑璐,
申请(专利权)人:福建和瑞基因科技有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。