System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及植物基因检测,具体涉及基于bsa重测序和pcr扩增对植物突变体染色体重排进行检测的方法。
技术介绍
1、作物新品种选育与生产是保障粮食安全的基石。各种作物全基因组测序的完成,为分子育种和基因组选择育种奠定了基础。但是大部分基因的功能还不清楚,限制了作物分子育种的进程。突变体库的创制可创造新的种质资源,为作物的遗传改良提供遗传材料。植物突变体库的构建方法主要包括:物理化学诱变、转座子随机插入诱变、crispr/cas9基因编辑系统构建等。上述方法创制的植物突变体材料,除了常见的基因突变(如碱基替换、插入、缺失等)外,还时有染色体重排的发生。
2、染色体重排是指断裂的染色体在重接过程中发生异常连接,导致染色体结构变异的现象。通常把染色体重排分为重复、缺失、倒位和易位四种类型。染色体重排会造成染色体上大片段的改变。其中,倒位是指一个片段在一条染色体内断裂并以相反的方向重新连接,dna可能会在这个过程中丢失,也可能不会丢失;易位是指当一条染色体断裂,染色体碎片重新附着在其他不同的染色体上时,发生遗传学易位,易位可发生在染色体之间或染色体内部。
3、此外,在植物中同样存在自发性的染色体重排,通常被认为是由遗传漂变、环境压力或者其他未知因素引起的,促进生物进化和物种形成。
4、植物染色体重排的检测方法主要包括细胞生物学检测方法、分子遗传学检测方法和高通量测序及生物信息学分析法。荧光原位杂交技术(fluorescence in situhybridization,fish)常被用于植物染色体重
5、近十年来随着测序技术的发展,人们希望通过高通量测序作为一体式的基因检测方法可以同时检测染色体结构变异来补充或取代细胞生物学传统检测方法。二代测序技术产生的短核苷酸序列,常为几十到数百个碱基,目前基于二代基因组测序数据已开发出4类算法检测染色体结构变异:基于双端测序读段匹配(paired-end mapping,pem)、基于read分割匹配(split read mapping,srm)、基于read的覆盖度(depth of coverage,doc)、基于组装的方法(assembly-based approach,asa),对于小长度范围内的变异和较长的deletion变异,当前的检测软件基本可以识别,但对于大多数的insertion和更复杂的结构性变异情况,则还无法解决。
6、三代测序技术相比于传统的二代测序技术而言,由于测得的序列长度长,在染色体结构变异(sv)的检测中有着不可替代的优势,但三代测序的高错误率和对indel错误的引入会带来比较大的纠错成本,其测序成本也较高。因此,本领域仍然需要基于二代测序数据鉴定植物突变体突变基因及相关染色体重排事件的方法。
7、bsa(bulked segregant analysis),又称集群分离分析法或混合分组分析法,是正向遗传学中定位基因的经典方法。bsa针对目标性状,选择表型极端差异的亲本构建家系,同时对两亲本和该家系目标性状表型极端的子代分别混合得到的两个混池进行全基因组重测序,检测到的两混池间dna差异片段即为候选区域,并注释该区域基因,可进一步定位到目标性状相关的基因或标记。利用该方法,可以快速的对单一性状在基因组上进行定位。但是,染色体重排的存在,使突变基因定位存在困难。
技术实现思路
1、本专利技术的目的在于提供一种能够低成本、快速、精准地检测植物突变体染色体重排事件及由染色体重排导致的基因突变的方法,以解决目前基于二代基因组测序数据检测染色体结构变异算法无法识别大片段插入和更复杂的染色体重排事件的缺陷。
2、为实现上述目的,本专利技术采用如下技术方案:
3、本专利技术提供了一种检测植物突变体染色体重排的方法,包括以下步骤:
4、(1)混池的构建和二代测序:以野生型为母本、稳定遗传的突变体为父本进行杂交,再自交获得f2分离群体;若f2代目标性状分离比符合单基因分离比即可进行基因定位;选取两组表型差异极端的个体提取基因组dna,构建野生型表型混池和突变体表型混池,进行illumina测序;
5、(2)测序数据处理:对每个混池的原始测序数据进行过滤后再通过bwa软件与参考基因组比对,然后采用gatk软件的unifiedgenotyper模块进行snp和indel位点检测;
6、(3)区间定位:计算每个混池中每个snp和indel位点出现的频率,即all-index值,过滤后计算两个混池的差值δall-index;再在基因组上选择序列长度0.1-1mb作为窗口,以1kb为步长通过滑窗法在全基因组水平内对窗口内包含的snp和indel进行计算,以每个窗口中δall-index的平均值来反映δall-index分布;然后置换检验,选取置信水平95%以上的窗口作为候选区间;
7、(4)目的基因定位及染色体重排位点的检测:参照植物基因组数据库对候选区间内所有注释基因进行功能分析,将候选区间内包含的或邻近的功能与目标性状相关的已知基因作为候选基因;使用samtools工具对每个混池中对应候选基因全长区域每个碱基进行比对深度统计,查找出野生型表型混池中覆盖而突变体表型混池中无覆盖的位点作为候选的重排位点a;然后在参考基因组中沿位点a上下游延伸,选定短序列1和短序列2,在突变体表型混池的测序数据中检索分别包含两段短序列的read1和read2,通过read1和read2与参考基因组比对,
8、若染色体上发生位点a和位点b之间的区间片段倒位,则read1将能分别比对到a点上游与b点上游,read2将能分别比对到a点下游与b点下游;
9、若染色体上发生位点b和位点c之间的区间片段与位点c和位点a之间的区间片段易位,或者该染色体上发生位点b和位点c之间的区间片段重复插入至a点的情况,则read1将能分别比对到a点上游与b点下游,read2将能分别比对到a点下游与c点上游;然后在参考基因组中分别沿位点b上游延伸选定短序列3,沿位点c下游延伸选定短序列4,在突变体混池的测序数据中检索出分别包含这两端段短序列的read3和read4,将其与参考基因组进行比对,如果read3和read4都本文档来自技高网...
【技术保护点】
1.一种检测植物突变体染色体重排的方法,其特征在于,包括以下步骤:
2.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(1)中,每组选择15-30个个体,提取基因组DNA后等量混合构建混池。
3.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,利用fastp软件对原始测序数据过滤的标准为:去除带接头的reads;去除N碱基占该条测序读长比例超过10%的reads;去除Q值≤5的碱基占该条测序读长比例超过50%的reads。
4.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,BWA软件比对参数设置为:mem,-t 4,-k 32,-M。
5.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,经BWA软件比对后的对比结果先经SAMTOOLS工具处理去除PCR重复后再进行SNP和InDel位点检测。
6.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,针对比对结果进行SNP和InDel位点检测后再
7.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(3)中,计算All-index值后对SNP和InDel位点过滤的标准为:去除两个混池中All-index均小于0.3的位点;去除单个混池中SNP或InDel深度小于7的位点;去除单个混池中All-index缺失的位点。
8.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(3)中,对每个窗口进行1000次置换检验,选取99%置信水平作为阈值线。
9.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(4)中,所述短序列的长度为50bp。
10.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(5)中,分别针对染色体重排前和重排后的连接处设计引物。
...【技术特征摘要】
1.一种检测植物突变体染色体重排的方法,其特征在于,包括以下步骤:
2.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(1)中,每组选择15-30个个体,提取基因组dna后等量混合构建混池。
3.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,利用fastp软件对原始测序数据过滤的标准为:去除带接头的reads;去除n碱基占该条测序读长比例超过10%的reads;去除q值≤5的碱基占该条测序读长比例超过50%的reads。
4.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,bwa软件比对参数设置为:mem,-t 4,-k 32,-m。
5.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,经bwa软件比对后的对比结果先经samtools工具处理去除pcr重复后再进行snp和indel位点检测。
6.如权利要求1所述的检测植物突变体染色体重排的方法,其特征在于,步骤(2)中,针对比对结果进行snp和indel位点检测后再使用variantfiltration模块进行过滤,对sn...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。