本发明专利技术涉及小麦功能基因定位技术领域,特别是涉及用于小麦外显子测序基因定位的探针设计方法,通过高通量测序平台进行测序获得转录组数据后与比对参考基因组进行比对分析,再进行转录本拼接、合并,再进行ORF预测,去掉重复区域的序列,将筛选的序列进行高密度探针合成,即得。基因定位方法包括:将小麦DNA打断成片段,再将打断后的小麦DNA与上述高密度探针进行杂交,磁珠富集后洗脱,再进行高通量测序、变异检测、统计定位即可。本发明专利技术解决现有技术中因小麦基因组庞大导致基因定位成本高昂的问题,通过设计超高密度多重引物探针,只针对于基因外显子序列进行测序,在同样的基因测序深度情况下,减少了80%的测序成本。
【技术实现步骤摘要】
用于小麦外显子测序基因定位的探针设计方法及定位方法
本专利技术涉及小麦功能基因定位
,特别是涉及用于小麦外显子测序基因定位的探针设计方法及定位方法。
技术介绍
现有小麦全基因组测序BSA-seq,是对小麦基因组整体进行测序检测,由于小麦基因组十分庞大,成本太高。现有小麦转录组测序BSR-seq使用的是基因表达的数据进行检测,受到样本组织、样本时期、环境等因素的影响,有非常大的数据偏好,基因表达数据本身不是遗传信息,具有一定的假阳性。现有SNP芯片无法获取基因的序列信息且SNP密度相对低,SNP芯片只能分析突变信号,无法获取到材料、样本的序列信息。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种用于小麦外显子测序基因定位的探针设计方法,用于解决现有技术中小麦基因组庞大导致使用全基因测序BSA-seq手段获得基因信息成本高昂的问题,同时,本专利技术还将提供一种小麦外显子测序基因定位方法。本专利技术中的一种用于小麦外显子测序基因定位的探针设计方法通过设计超高密度多重引物探针,在全基因组DNA水平对小麦基因组超过16万个基因外显子进行特异性捕获,只针对于基因外显子序列进行测序,在同样的基因测序深度情况下,减少了80%以上的测序成本,小麦基因组15GB大小,全基因重测序30倍覆盖需要450G数据量,该方法仅需对300M区段进行测序,100倍覆盖需要数据量30G数据量。为实现上述目的及其他相关目的,本专利技术的第一方面,提供一种用于小麦外显子测序基因定位的探针设计方法,包括如下步骤:步骤一、通过大规模转录组测序数据选取不同的组织、环境、发育等数据,再通过高通量测序平台进行测序,得到测序数据待用;步骤二、通过STAR软件对测序数据与比对参考基因组进行比对分析,再通过stringtie函数进行转录本拼接,并过滤基因表达量TPM(转录本表达量TranscriptsPerKilobaseMillion)小于2的转录本,保留基因表达量TPM≥2的转录本待用;步骤三、将步骤二中的转录本与IWGSCCSAnnotation转录本进行合并,得到合并后的转录本待用;步骤四、通过TransDecoder(v5.5.0)对步骤三中合并后的转录本进行ORF(开放式阅读框OpenReadingFrame)预测,再通过bedtools软件合并ORF预测出的CDS(编码区codingsequence)区域,再使用kmer算法扫描合并后的CDS序列,分析重复及重叠的区域,去掉N及Repeat区域的序列,得到筛选的序列;步骤五、将步骤四中筛选的序列进行高密度探针合成,即得用于小麦外显子测序基因定位的探针。上述探针设计方法通过设计超高密度多重引物探针,在全基因组DNA水平对小麦基因组超过16万个基因外显子进行特异性捕获,只针对于基因外显子序列进行测序,在同样的基因测序深度情况下,减少了80%的测序成本。步骤二中比对参考基因组具体为IWGSCRefSeq(https://www.wheatgenome.org/)。于本专利技术的一实施例中,所述高通量测序平台为二代Illumina或华大BGIseq。于本专利技术的一实施例中,所述用于小麦外显子测序基因定位的探针为多重高密度磁珠探针。本专利技术的第二方面,提供一种小麦外显子测序基因定位方法,包括如下步骤:S1、将小麦DNA打断成200-300bp长度的片段,再通过高通量测序文库(Kapa、NEB、Illumina、诺唯赞等标准DNA文库)构建DNA测序预文库;S2、再将打断后的小麦DNA与上述探针进行杂交,再对磁珠进行富集从而获得与探针杂交的小麦DNA序列,再使用洗脱液洗脱后得到小麦外显子DNA序列待用;S3、将S2步骤中小麦外显子DNA序列进行高通量测序,对测序获得的数据使用标准分析流程进行变异检测,再通过统计方法进行定位即可。全基因组测序需要对小麦16G基因组全部测序,需要的测序数据量是本专利技术中一种小麦外显子测序基因定位方法测序数据量的10倍以上,成本高昂。上述小麦外显子测序基因定位方法无数据偏好,上述小麦外显子测序基因定位方法是在DNA水平进行测序,避免了转录组BSR-seq方法只能对已经表达的基因进行分析的偏好。小麦外显子测序基因定位方法中设计捕获的目标区间超过260M,实际捕获区间超过300M,包含16万个基因的全部外显子及部分非编码启动子区域、调控区域,能够提供绝大多数性状变异的解析。于本专利技术的一实施例中,所述小麦DNA的制备过程为:将小麦自然杂交,突变体材料与亲本杂交,突变体材料与多样性亲本杂交后分别获得F2和F3分离群体,再将两个极端表型分别取10~50株,每个极端表型再取对应的根茎叶组织混合提取DNA,再将两个极端表型的DNA等量混合,即得小麦DNA。于本专利技术的一实施例中,每个所述极端表型在提取DNA的过程中选取10~50株。于本专利技术的一实施例中,所述统计方法为滑动窗口期望方差、滑动窗口T检验、滑动窗口Fisher精确检验或SNP-index。如上所述,本专利技术的用于小麦外显子测序基因定位的探针设计方法及定位方法,具有以下有益效果:上述小麦外显子测序基因定位方法无数据偏好,上述小麦外显子测序基因定位方法是在DNA水平进行测序,避免了转录组BSR-seq方法只能对已经表达的基因进行分析的偏好。小麦外显子测序基因定位方法中设计捕获的目标区间超过260M,实际捕获区间超过300M,包含16万个基因的全部外显子及部分非编码启动子区域、调控区域,能够提供绝大多数性状变异的解析。附图说明图1显示为本专利技术实施例1中外显子捕获实验流程图。图2显示为本专利技术实施例1中捕获数据分析流程图。图3显示为本专利技术实施例1中SNP的密度分布图。图4显示为现有技术BSR-seq获得SNP的密度分布图。图5显示为本专利技术实施例1中外显子测序基因定位结果图。具体实施方式以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本专利技术的其他优点及功效。实施例1一种用于小麦外显子测序基因定位的探针设计方法,包括如下步骤:步骤一、通过大规模转录组测序数据选取不同的组织、环境、发育的数据,再通过二代Illumina高通量测序平台进行测序,得到测序数据待用;步骤二、通过STAR软件对测序数据与比对参考基因组进行比对分析,再通过stringtie函数进行转录本拼接,并过滤基因表达量TPM小于2的转录本,保留TPM≥2的转录本待用;比对参考基因组具体为IWGSCRefSeq(https://www.wheatgenome.org/);步骤三、将步骤二中的转录本与IWGSCCSAnnotation转录本进行合并,得到合并后的转录本待用;步骤四、通过TransDecoder(v5.5.0)对步骤三中合并后的转录本进行ORF预测,再通本文档来自技高网...
【技术保护点】
1.一种用于小麦外显子测序基因定位的探针设计方法,其特征在于,包括如下步骤:/n步骤一、通过大规模转录组测序数据选取不同的组织、环境、发育的数据,再通过高通量测序平台进行测序,得到测序数据待用;/n步骤二、通过STAR软件对测序数据与比对参考基因组进行比对分析,再通过stringtie软件进行转录本拼接,保留基因表达量TPM≥2的转录本待用;/n步骤三、将步骤二中的转录本与IWGSC CS Annotation转录本进行合并,得到合并后的转录本待用;/n步骤四、通过TransDecoder函数对步骤三中合并后的转录本进行ORF预测,再通过bedtools软件合并ORF预测出的CDS区域,再使用kmer算法扫描合并后的CDS序列,去掉重复区域的序列,得到筛选的序列;/n步骤五、将步骤四中筛选的序列进行高密度探针合成,即得用于小麦外显子测序基因定位的探针。/n
【技术特征摘要】
1.一种用于小麦外显子测序基因定位的探针设计方法,其特征在于,包括如下步骤:
步骤一、通过大规模转录组测序数据选取不同的组织、环境、发育的数据,再通过高通量测序平台进行测序,得到测序数据待用;
步骤二、通过STAR软件对测序数据与比对参考基因组进行比对分析,再通过stringtie软件进行转录本拼接,保留基因表达量TPM≥2的转录本待用;
步骤三、将步骤二中的转录本与IWGSCCSAnnotation转录本进行合并,得到合并后的转录本待用;
步骤四、通过TransDecoder函数对步骤三中合并后的转录本进行ORF预测,再通过bedtools软件合并ORF预测出的CDS区域,再使用kmer算法扫描合并后的CDS序列,去掉重复区域的序列,得到筛选的序列;
步骤五、将步骤四中筛选的序列进行高密度探针合成,即得用于小麦外显子测序基因定位的探针。
2.根据权利要求1所述的一种用于小麦外显子测序基因定位的探针设计方法,其特征在于:所述高通量测序平台为二代Illumina或华大BIGseq。
3.根据权利要求1所述的一种用于小麦外显子测序基因定位的探针设计方法,其特征在于:所述用于小麦外显子测序基因定位的探针为多重高密度磁珠探针。
4.根据权利要求1所述的一种用于小麦外显子测序基因定位的探针设计方法,其特征在于:所述比...
【专利技术属性】
技术研发人员:陈中旭,
申请(专利权)人:成都天成未来科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。