鉴定和分析古DNA样本的方法技术

技术编号：20472279 阅读：140 留言：0更新日期：2019-03-02 14:34

本发明专利技术公开了鉴定和分析古DNA样本的方法，其中包括获得待测DNA样本的DNA信息的方法，该方法包括以下步骤：对所述待测DNA样本进行建库和测序，以便获得测序数据；对所述测序数据进行过滤处理；将所述经过过滤处理的测序数据进行比对处理，以便获得比对结果，所述比对结果包含所述待测DNA样本的DNA信息，所述比对处理最多容许4个碱基的错配。利用该方法能够有效地基于对待测古DNA样本的建库和测序，获得待测古DNA样本的DNA信息，并且，该信息准确，可信度高，能够有效用于待测古DNA的基因组分析，例如变异检测、古DNA的鉴定、性别判定以及现代人DNA污染率评估。

全部详细技术资料下载

【技术实现步骤摘要】
鉴定和分析古DNA样本的方法
本专利技术涉及生物测序
，具体而言，涉及鉴定和分析古DNA样本的方法。
技术介绍
古生物样本对现代生物种群的进化史研究至关重要，古人类基因组的研究成果使人们重新认识到现代人的遗传组成并非只有非洲祖先成分，而是在走出非洲之后又与古尼安德特人和古丹尼索尔人发生过基因交流，颠覆了以往人们对现代人进化史的认识。同时，古生物基因组的研究对现代生物种群，尤其是人类的自然选择和疾病的研究也有着无法替代的重要作用，藏族人的高原适应性基因被证明是来自与古丹尼索尔人的基因组之间的渗透作用。古生物样本作为一种无法复制的遗传资源，对现代生物群体的进化、选择和疾病等研究具有巨大的促进作用而且无法替代。古生物遗传学研究已经深入到基因组水平。我国作为一个古生物资源大国，不仅有着极其丰富的动植物化石和亚化石资源，更有丰富的古人类样本不断出土，限制我国古人类基因组学发展的最大的瓶颈之一就是缺乏对古DNA处理和信息分析方法的总结。因而，目前鉴定和分析古DNA样本的方法仍有待改进。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此，本专利技术的一个目的在于构建一套基于Illumina二代测序数据的古DNA的标准信息分析流程，提供一套古人类基因组分析方法。需要说明的是，本专利技术是基于专利技术人的下列发现和工作而完成的：专利技术人针对古DNA处理和信息分析的方法进行了一系列的理论研究和实验探索，结果发现：1、古DNA的片段化程度很高，因此在构建DNA文库的过程中不需对DNA进行片段化处理，DNA提取完成后可直接进行文库构建。2、针对古DNA，...

【技术保护点】
1.一种获得待测DNA样本的DNA信息的方法，其特征在于，包括以下步骤：对所述待测DNA样本进行建库和测序，以便获得测序数据，其中，在所述建库时不进行DNA片段化的步骤，所述测序读段的长度不超过100bp；对所述测序数据进行过滤处理，以便获得经过过滤处理的测序数据；以及将所述经过过滤处理的测序数据进行比对处理，以便获得比对结果，所述比对结果包含所述待测DNA样本的DNA信息，其中，所述过滤处理包括下列的至少之一：(1)过滤去除接头序列；(2)过滤去除质量值Q≤10的低质量碱基，其中，当所述低质量碱基的数量占整条读段总碱基数量的50％以上时，删除整条读段；当所述低质量碱基在读段的端头，且数量不超过整条读段的50％时，仅切除所述低质量碱基；(3)对N区进行过滤，其中，当读段中含N比例大于10％时，去除所述读段；当N区仅存在于读段两端时，仅切除所述读段两端的N区；(4)去除长度小于30bp及长度大于99bp的读段，所述比对处理最多容许4个碱基的错配。

【技术特征摘要】
1.一种获得待测DNA样本的DNA信息的方法，其特征在于，包括以下步骤：对所述待测DNA样本进行建库和测序，以便获得测序数据，其中，在所述建库时不进行DNA片段化的步骤，所述测序读段的长度不超过100bp；对所述测序数据进行过滤处理，以便获得经过过滤处理的测序数据；以及将所述经过过滤处理的测序数据进行比对处理，以便获得比对结果，所述比对结果包含所述待测DNA样本的DNA信息，其中，所述过滤处理包括下列的至少之一：(1)过滤去除接头序列；(2)过滤去除质量值Q≤10的低质量碱基，其中，当所述低质量碱基的数量占整条读段总碱基数量的50％以上时，删除整条读段；当所述低质量碱基在读段的端头，且数量不超过整条读段的50％时，仅切除所述低质量碱基；(3)对N区进行过滤，其中，当读段中含N比例大于10％时，去除所述读段；当N区仅存在于读段两端时，仅切除所述读段两端的N区；(4)去除长度小于30bp及长度大于99bp的读段，所述比对处理最多容许4个碱基的错配。2.根据权利要求1所述的方法，其特征在于，同时利用SoapAligner和BWA进行所述比对处理。3.根据权利要求2所述的方法，其特征在于，利用SoapAligner进行所述比对处理时，生成Soap格式的比对结果；利用BWA进行所述比对处理时，生成sam格式的比对结果。4.一种确定待测DNA样本是否为古DNA的方法，其特征在于，包括以下步骤：根据权利要求1-3任一项所述的方法，获得待测DNA样本的DNA信息；基于所述待测DNA样本的DNA信息，进行变异检测，以便确定所述待测DNA样本的变异信息；以及基于所述待测DNA样本的变异信息，确定所述待测DNA样本是否为古DNA，其中，存在下列情形的至少之一是所述待测DNA样本为古DNA的指示：(1)测序读段呈现如下的脱氨基特征：相对于参考基因组，所述测序读段的5’端和3’端出现大于10％的C->T和G->A的突变；(2)测序读段呈现如下的片段化特征：相对于参考基因组，所述测序读段的5’末端再往前一个碱基是嘌呤的比例显著增加，而3’末端再往后一个碱基是嘧啶的比例显著增加。5.根据权利要求4所述的方法，其特征在于，同时利用GATK和SoapSnp进行所述变异检测。6.根据权利要求5所述的方法，其特征在于，利用SoapSnp进行所述变异检测时，输出cns格式的结果。7.根据权利要求4所述的方法，其特征在于，所述待测DNA样本的变异信息包含单核苷酸变异信息。8.一种确定古DNA样本所属个体的性别的方法，其特征在于，包括以下步骤：根据权利要求1-3任一项所述的方法，获得待测古DNA样本的DNA信息；基...

【专利技术属性】
技术研发人员：郭小森，兰天明，蒋慧，
申请(专利权)人：深圳华大基因研究院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人