【技术实现步骤摘要】
基于二代测序技术的病毒载体序列分析系统和方法
[0001]本专利技术涉及病毒载体序列分析系统和方法,尤其涉及基于二代测序技术的病毒载体序列分析系统和方法
。
技术介绍
[0002]基因治疗制品通常由含有工程化基因构建体的载体或递送系统组成,其活性成分可为
DNA、RNA、
基因改造的病毒
、
细菌或细胞,通过将外源基因导入靶细胞或组织,替代
、
补偿
、
阻断
、
修正特定基因,以达到治疗疾病的目的
。
[0003]用于基因治疗制品的常见的载体系统是病毒载体和质粒
DNA
载体,载体设计与构建方案基于临床有效性和安全性考虑,通常基于基因治疗制品的作用机制,如通过编码功能性蛋白质的转基因表达,或采用
RNA
干扰
、
小
RNA
或基因编辑等方式,采用基因沉默
、
外显子跳跃
、
基因调控或基因敲除等方式修复
、
添加或删除特定的基因序列,进行载体的设计与构建
。
[0004]为了保证最终治疗产品的有效性及安全性,
《
人用基因治疗制品总论
》
等监管文件提出,应对基因治疗制品载体的完整序列进行分析,确认序列与理论预期相符
。
[0005]病毒载体是基因治疗制品中最常用到的载体系统
。
病毒载体的序列分析关系到临床申报和批次放行 ...
【技术保护点】
【技术特征摘要】
1.
一种基于二代测序技术的病毒载体序列分析系统,其特征在于,包含:载体序列组装模块,用于通过
de Bruijn
图算法将样本的二代测序数据
reads
拼接为
contigs
序列;还用于通过从
addgene
获取所有目标类别载体的骨架序列,使用分子遗传相关性计算工具
mash
计算各个目标类别载体的骨架序列和
contigs
序列之间的遗传相关性,保留和样本序列分子遗传特征最相似的
n
个载体的骨架序列作为载体参考序列库;以及还用于将载体参考序列库输入
shiver
程序进行初始化后与
contigs
序列进行比对融合为单条参考序列同时生成
softclip
数据,再将样本的二代测序数据
reads
比对到融合得到的单条参考序列上重构出初步全长序列,用
softclip
数据对初步全长序列进行矫正得到完整的载体全长序列;
n
为5~
20
,优选为8~
12
,更优选为
10
;载体序列和理论序列差异分析模块,用于对载体序列组装模块得到的载体全长序列与病毒载体设计的理论序列的差异位点和差异片断进行分析得到突变信息
。2.
根据权利要求1所述的基于二代测序技术的病毒载体序列分析系统,其特征在于,载体序列和理论序列差异分析模块利用基因组比对软件
MUMmer4
的核酸序列比对程序
nucmer
对载体序列组装模块得到的载体全长序列和病毒载体设计的理论序列进行比对;利用
MUMmer4
的比对筛选程序
delta
‑
filter
采用
LIS
算法对
nucmer
比对结果进行过滤,将载体序列组装模块得到的载体全长序列映射到病毒载体设计的理论序列的最佳参考位置;利用
MUMmer4
的核酸序列差异分析程序
dnadiff
基于过滤后的比对文件分析差异位点和差异片断
。3.
根据权利要求1所述的基于二代测序技术的病毒载体序列分析系统,其特征在于,还包含载体突变分析模块,用于利用二代数据比对软件
bwa
将样本的二代测序数据
reads
比对到病毒载体设计的理论序列上,并利用比对数据处理软件
samtools
将比对数据处理为排序过的
bam
文件;还用于利用突变分析软件
VarDict
的
VarDict
程序分析位点突变,并利用
VarDict
的
teststrandbias.R
和
var2vcf_valid.pl
过滤掉低可信度突变,获取
vcf
表格格式的突变结果;该突变结果包括突变位点与突变频率
。4.
根据权利要求1所述的基于二代测序技术的病毒载体序列分析系统,其特征在于,还包含载体重组分析模块,用于利用微生物分析软件
vsearch
的
fastq_mergepairs
指令基于重叠序列将二代测序的两端
reads
合并为单端序列;还用于利用基因组重组比对程序
ViReMa
将样本的二代测序数据
reads
比对到病毒载体设计的理论序列上,对于
reads
上不能比对上理论序列的片断,进一步基于宿主细胞参考基因组索引将其与宿主序列进行比对,分析样本的载体序列与宿主基因组序列的重组情况
。5.
一种基于二代测序技术的病毒载体序列分析方法,其特征在于,包括以下步骤:
S1、
载体序列组装:
S1.1、de Bruijn
图算法初步组装:使用多尺度
de Bruijn
图算法将样本二代测序数据
reads
初步拼接为
contigs
序列;
S1.2、
构建载体参考序列库:
a.
从
addgene
获取所有目标类别载体的骨架序列;
b.
使用分子遗传相关性计算工具
mash
计算各个载体骨架序列和初步组装步骤得到的样本
contigs
序列之间的遗传相关性...
【专利技术属性】
技术研发人员:陈靓靓,李源,王佳伟,林婕,潘轶,
申请(专利权)人:上海序祯达生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。