基于二代测序技术的病毒载体序列分析系统和方法技术方案

技术编号:39766527 阅读:7 留言:0更新日期:2023-12-22 02:20
本发明专利技术提供一种基于二代测序技术的病毒载体序列分析系统和方法

【技术实现步骤摘要】
基于二代测序技术的病毒载体序列分析系统和方法


[0001]本专利技术涉及病毒载体序列分析系统和方法,尤其涉及基于二代测序技术的病毒载体序列分析系统和方法


技术介绍

[0002]基因治疗制品通常由含有工程化基因构建体的载体或递送系统组成,其活性成分可为
DNA、RNA、
基因改造的病毒

细菌或细胞,通过将外源基因导入靶细胞或组织,替代

补偿

阻断

修正特定基因,以达到治疗疾病的目的

[0003]用于基因治疗制品的常见的载体系统是病毒载体和质粒
DNA
载体,载体设计与构建方案基于临床有效性和安全性考虑,通常基于基因治疗制品的作用机制,如通过编码功能性蛋白质的转基因表达,或采用
RNA
干扰


RNA
或基因编辑等方式,采用基因沉默

外显子跳跃

基因调控或基因敲除等方式修复

添加或删除特定的基因序列,进行载体的设计与构建

[0004]为了保证最终治疗产品的有效性及安全性,

人用基因治疗制品总论

等监管文件提出,应对基因治疗制品载体的完整序列进行分析,确认序列与理论预期相符

[0005]病毒载体是基因治疗制品中最常用到的载体系统

病毒载体的序列分析关系到临床申报和批次放行,有一定的实效性要求,需要准确

经济

快速的方案

二代测序相较一代测序和三代测序存在于速度快

成本低

覆盖度高

准确度高的优点,但是二代测序产出的序列为短序列
(reads)
,需要较好的完整序列分析方法来匹配病毒载体序列分析需求

除了基因治疗制品外,病毒载体还在基因编辑研究

细胞治疗

疫苗制备等多个生物医药领域有广泛的应用,好的病毒载体序列分析方案对各个领域的病毒载体应用都有所帮助

[0006]病毒载体序列分析与传统的病毒序列分析有一定到相似性,但是序列结构与自然界中的病毒有较大差异

病毒载体序列是人工设计的,其中包含的功能元件来自自然界多个不同生物物种,根据载体设计方法

应用场景

生产工艺不同存在多种多样的差异,导致病毒载体之间不像天然病毒同物种之间那样相似,没有通用的参考基因组

[0007]病毒载体分析的目的也与传统病毒分析存在差异

病毒载体分析首先需要验证载体序列全长是否完整且正确,因而需要通过序列拼接能得到完整基因组的精度

而传统病毒分析主要研究病毒的分类和功能特性,通常仅要求序列拼接能得到长于分类单元或功能单元的序列,通常拼接到
contig(
也称为重叠群
)

scaffold
的精度

在基因组组装领域,
contig、scaffold
和完整基因组都是指基因组组装的不同阶段或结果
。contig
可以反映出基因组中不同区域的顺序和相对位置,但是由于拼接算法以及基因组中的重复序列等因素,存在区间不连续

缺失

重复的情况
。scaffold
是指利用其他信息
(
如配对末端序列

物理图谱等
)

contig
进行排序和连接,形成更长的序列,但也经常存在缺失

分段和结构错误的情况

完整基因组通常是指所有的区间都被覆盖,实现了对基因组的完整重建

[0008]其次,病毒载体样本中包含多个拷贝的载体序列,其中部分拷贝的突变也可能对载体功能造成不良影响,分析需要关注数据中的杂合低频突变,而传统病毒分析中的突变
分析通常在拼接后进行突变分析,损失了突变频率和大部分杂合突变信息

最后,载体生产过程中用到了动物

细菌等其他宿主细胞,需要关注载体中是否存在与宿主基因组重组的情况,这部分分析现有的病毒分析产品均没有涉及

[0009]目前尚未有其他成熟的病毒载体完整序列分析方法公开,下面将列举一些已公开的其他病毒分析方法,并解释其在病毒载体序列应用场景的局限性
(
后文简称为局限性,皆特指本应用场景的局限性
)。
[0010]专利“一种基于二代和三代测序技术的宏病毒组分析方法”(
公开号
CN115691679A)
公开了一种基于二代和三代测序的病毒序列分析方法,主要用于病毒物种鉴定,能够结合二代和三代数据拼接得到相对完整的病毒基因组信息

局限性在于:需要用到较为昂贵的三代测序技术,不利于周期和成本控制;此外出于鉴定的目的,该专利技术仅将病毒序列拼接到
contig
的精度,没有拼接病毒完整基因组;并且不能进行突变和重组的分析

[0011]专利“病毒基因组鉴定和拼接的方法及应用”(
公开号
CN116072222A)
公开了病毒鉴定和基因组组装的方法,主要用于病毒物种鉴定和新病毒发现,能够组装得到较为完整的病毒基因组信息

局限性在于:该专利技术首先将病毒序列组装为
contig
,再基于
NCBI NR
库中基因最相似的参考基因组拼接为病毒基因组全长,不适用于病毒载体这种包含大量人工元件的情况;并且不能进行突变和重组的分析

[0012]专利“一种病毒测序序列的自动化分析方法及系统”(
公开号
CN112863599A)
公开了一种包含病毒组装

鉴定和变异检测等步骤的分析方法和系统,主要用于病毒鉴定

变异检测

系统发育分析和功能注释

局限性在于:该专利技术仅将序列拼接到
contig
的精度,没有拼接完整基因组;该专利技术检测病毒变异的方法为将组装后的
contig
比对到参考基因组,检测
contig
和参考基因组之间的差异,损失了突变频率和大部分杂合突变信息;并且不能进行重组分析

[0013]专利“一种适用于矮缩病毒科和双生病毒科病毒基因组拼接的转录组测序方法”(
公开号
CN107475449A)
公开了一种病毒基因组组装方法,首先通过比对找出目标病毒的序列,再通过拼接获得重叠群本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于二代测序技术的病毒载体序列分析系统,其特征在于,包含:载体序列组装模块,用于通过
de Bruijn
图算法将样本的二代测序数据
reads
拼接为
contigs
序列;还用于通过从
addgene
获取所有目标类别载体的骨架序列,使用分子遗传相关性计算工具
mash
计算各个目标类别载体的骨架序列和
contigs
序列之间的遗传相关性,保留和样本序列分子遗传特征最相似的
n
个载体的骨架序列作为载体参考序列库;以及还用于将载体参考序列库输入
shiver
程序进行初始化后与
contigs
序列进行比对融合为单条参考序列同时生成
softclip
数据,再将样本的二代测序数据
reads
比对到融合得到的单条参考序列上重构出初步全长序列,用
softclip
数据对初步全长序列进行矫正得到完整的载体全长序列;
n
为5~
20
,优选为8~
12
,更优选为
10
;载体序列和理论序列差异分析模块,用于对载体序列组装模块得到的载体全长序列与病毒载体设计的理论序列的差异位点和差异片断进行分析得到突变信息
。2.
根据权利要求1所述的基于二代测序技术的病毒载体序列分析系统,其特征在于,载体序列和理论序列差异分析模块利用基因组比对软件
MUMmer4
的核酸序列比对程序
nucmer
对载体序列组装模块得到的载体全长序列和病毒载体设计的理论序列进行比对;利用
MUMmer4
的比对筛选程序
delta

filter
采用
LIS
算法对
nucmer
比对结果进行过滤,将载体序列组装模块得到的载体全长序列映射到病毒载体设计的理论序列的最佳参考位置;利用
MUMmer4
的核酸序列差异分析程序
dnadiff
基于过滤后的比对文件分析差异位点和差异片断
。3.
根据权利要求1所述的基于二代测序技术的病毒载体序列分析系统,其特征在于,还包含载体突变分析模块,用于利用二代数据比对软件
bwa
将样本的二代测序数据
reads
比对到病毒载体设计的理论序列上,并利用比对数据处理软件
samtools
将比对数据处理为排序过的
bam
文件;还用于利用突变分析软件
VarDict

VarDict
程序分析位点突变,并利用
VarDict

teststrandbias.R

var2vcf_valid.pl
过滤掉低可信度突变,获取
vcf
表格格式的突变结果;该突变结果包括突变位点与突变频率
。4.
根据权利要求1所述的基于二代测序技术的病毒载体序列分析系统,其特征在于,还包含载体重组分析模块,用于利用微生物分析软件
vsearch

fastq_mergepairs
指令基于重叠序列将二代测序的两端
reads
合并为单端序列;还用于利用基因组重组比对程序
ViReMa
将样本的二代测序数据
reads
比对到病毒载体设计的理论序列上,对于
reads
上不能比对上理论序列的片断,进一步基于宿主细胞参考基因组索引将其与宿主序列进行比对,分析样本的载体序列与宿主基因组序列的重组情况
。5.
一种基于二代测序技术的病毒载体序列分析方法,其特征在于,包括以下步骤:
S1、
载体序列组装:
S1.1、de Bruijn
图算法初步组装:使用多尺度
de Bruijn
图算法将样本二代测序数据
reads
初步拼接为
contigs
序列;
S1.2、
构建载体参考序列库:
a.

addgene
获取所有目标类别载体的骨架序列;
b.
使用分子遗传相关性计算工具
mash
计算各个载体骨架序列和初步组装步骤得到的样本
contigs
序列之间的遗传相关性...

【专利技术属性】
技术研发人员:陈靓靓李源王佳伟林婕潘轶
申请(专利权)人:上海序祯达生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1