紧凑的下一代测序数据集及使用其的高效测序处理制造技术

技术编号：10680520 阅读：207 留言：0更新日期：2014-11-26 13:30

在包括通过处理组织样本采集的碱基序列的基因测序读数上操作的方法中，生成基因测序读数的紧凑文本表示。所述紧凑文本表示包括：(1)文本串，其表示碱基序列，以及(2)碱基质量文本域，其识别碱基序列的最长子序列，针对所述最长子序列，子序列的碱基的碱基质量分数满足碱基质量分数阈值；以及将基因测序读数的紧凑文本表示存储在原始读数存储器中。为了提供灵活性，所述碱基质量文本域可以识别针对两个或更多不同碱基质量分数阈值的每个的最长子序列。在读数比对期间，针对基因测序读数的偏移边界能够使用碱基质量文本域的内容高效地进行选择。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】在包括通过处理组织样本采集的碱基序列的基因测序读数上操作的方法中，生成基因测序读数的紧凑文本表示。所述紧凑文本表示包括：(1)文本串，其表示碱基序列，以及(2)碱基质量文本域，其识别碱基序列的最长子序列，针对所述最长子序列，子序列的碱基的碱基质量分数满足碱基质量分数阈值；以及将基因测序读数的紧凑文本表示存储在原始读数存储器中。为了提供灵活性，所述碱基质量文本域可以识别针对两个或更多不同碱基质量分数阈值的每个的最长子序列。在读数比对期间，针对基因测序读数的偏移边界能够使用碱基质量文本域的内容高效地进行选择。【专利说明】紧凑的下一代测序数据集及使用其的高效测序处理
下文涉及基因分析领域，并涉及诸如包括肿瘤学领域、兽医学领域等医学领域的相同的应用。
技术介绍
高效的基因测序系统，有时被称为“下一代测序”(NGS)系统，能够迅速且实质上自动地对整个基因组进行测序。尽管NGS精确度已经足够用于临床应用，并且预期随着技术成熟而得到改善，但是与诸如桑格(Sanger)测序的较慢的常规技术相比，现有的NGS系统有时表现出较低的读数精确度。为了评估读数精确度(或可靠性)，通常针对读数的每个碱基计算碱基质量分数。在Sanger测序的情况下，通过计算用于所测序的碱基的参数(诸如峰形和分辨率)，并将这些值与凭借经验建立的查找表进行比较，根据谱图数据计算Phred质量分数。Phred分数通常被认为与错误地响应碱基的概率对数相关。例如，Q = 20的phred分数(Q)对应于99%的碱基响应(basecall)精确度，而Q = 30对应于99....
紧凑的下一代测序数据集及使用其的高效测序处理

【技术保护点】
一种装置，包括：电子数据处理设备(30)，其被配置为生成基因测序读数的紧凑文本表示，其包括具有碱基质量分数的对应有序序列的核苷酸碱基的有序序列，所述紧凑文本表示包括：(1)文本串，其表示核苷酸碱基的所述有序序列，以及(2)碱基质量文本域，其识别核苷酸碱基的所述有序序列中的最长子序列，针对所述最长子序列，对应的碱基质量分数满足碱基质量分数阈值；以及原始读数存储器(22)，其被配置为存储所述紧凑文本表示。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：S·库马尔，R·辛格，B·查克拉巴蒂，S·库马尔，
申请(专利权)人：皇家飞利浦有限公司，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人