基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用技术

技术编号:25525605 阅读:50 留言:0更新日期:2020-09-04 17:14
本发明专利技术公开了基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用。该方法包括以下步骤:S01,转录组深度测序数据比对;S02,转录本组装;S03,转录本过滤;S04,预测翻译起始密码子;S05,反义转录本;S06,获取肿瘤特有全长新转录本蛋白序列;S07,获取肿瘤特有部分序列差异新转录本蛋白序列;S08,合并蛋白片段;S09,蛋白片段分割;S10,人类白细胞抗原基因分型;S11,肽段亲和力预测;和任选的,S12,质谱验证。通过本发明专利技术的方法发现的肿瘤新抗原,不局限于已注释的编码区,可以发现更多的新抗原;来自于非突变的高表达转录本,在不同肿瘤类型中有一定的通用性;经过质谱实验验证,有更高的概率产生免疫应答。

【技术实现步骤摘要】
基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用
本专利技术涉及肿瘤免疫治疗领域,尤其涉及一种基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法和应用。
技术介绍
新抗原疫苗肿瘤免疫治疗方法以其治疗效果显著、适用癌种广泛和毒副作用小等特点已成为免疫治疗家族重要的成员。该治疗方法的效果严重依赖于新抗原多肽的选择,进一步新抗原多肽的选择又严重依赖于数据和预测算法。理论上新抗原的生成可能有多种来源,而在实际临床上则仅仅聚焦于DNA点突变和插入缺失相关的新抗原。尽管基于DNA点突变和插入缺失的新抗原疫苗展现出了良好的临床效果,然而有研究表明基于其他生物通路来源生成的新抗原可能具有更强的免疫原性反应。同时对于一些突变负荷较小的恶性肿瘤,仅仅基于少数几种来源会由于被预测的新抗原数据不足而限制肿瘤新抗原疫苗配方的选择。因此发掘更多的新抗原来源对于新抗原的研究和临床应用都具有重要的意义。
技术实现思路
针对获取肿瘤新抗原存在的上述问题,本专利技术充分考虑了肿瘤基因组中存在大量新转录本的事实,开发了一套获取肿瘤特异新抗原的生物信息学方法。本专利技术的第一方面在于提供一种基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法,包括以下步骤:S01,转录组深度测序数据比对;S02,转录本组装;S03,转录本过滤;S04,预测翻译起始密码子;S05,翻译转录本;S06,获取肿瘤特有全长新转录本蛋白序列;S07,获取肿瘤特有部分序列差异新转录本蛋白序列;S08,合并蛋白片段;S09,蛋白片段分割;S10,人类白细胞抗原基因分型;S11,肽段亲和力预测;和任选的,S12,质谱验证。在本专利技术的一些实施方式中,S01中,包括以下步骤:S101,获取肿瘤样品和正常对照样品的包含编码RNA和非编码RNA的全转录组深度测序数据;S102,过滤肿瘤样品和正常对照样品全转录组深度测序数据;S103,对参考基因组构建索引;S104,将S12得到的过滤之后的数据对S13得到的参考基因组进行比对;优选地,S101中,采用去核糖体链特异性建库方法和小片段富集筛选建库方法建库测序;优选地,S101中,样本数据中包括多个重叠或部分重叠的短读序列,肿瘤样品以及正常对照样品测序数据均不小于30G;优选地,S102中,去除其中平均碱基质量低于20或者包含测序引物接头的短读序列。在本专利技术的一些实施方式中,S02中,将已经将短读序列定位到参考基因组的全转录组深度测序数据对比结果组装为转录本。在本专利技术的一些实施方式中,S03中,去除组装得到的转录本中存在的已知人类全长转录本和重复序列。在本专利技术的一些实施方式中,S04中,包括以下步骤:S401,计算肿瘤样品和正常对照样品的新转录本编码能力,根据编码能力的强弱分为蛋白编码转录本和非蛋白编码转录本;S402,预测肿瘤样品和正常对照样品中蛋白编码转录本的翻译起始密码子。在本专利技术的一些实施方式中,S05中,根据预测的翻译起始密码子对肿瘤样品和正常对照样品中有编码能力的新转录本进行翻译,得到蛋白序列。在本专利技术的一些实施方式中,S06中,对比肿瘤样品以及正常对照样品翻译得到的蛋白序列,遍历肿瘤样品蛋白序列,获取不能在正常对照中搜寻得到的肿瘤样品特有蛋白序列。在本专利技术的一些实施方式中,S07中,包括以下步骤:S701,过滤肿瘤样品特有蛋白;S702,将所有过滤得到的新转录蛋白和正常对照样品对应的所有转录本蛋白序列进行比对,比对结果中与正常对照样本不一致的序列将被定义为肿瘤特有部分序列差异新转录本蛋白序列。在本专利技术的一些实施方式中,S08中,将S06得到的肿瘤特有全长新转录本蛋白序列以及S07得到的肿瘤特有部分序列差异新转录本蛋白序列进行合并,并过滤长度小于9的序列。在本专利技术的一些实施方式中,S09中,将S08得到的蛋白序列分割,优选分割成长度为9到12个氨基酸的k-mer残基肽段。在本专利技术的一些实施方式中,S11中,预测S09分割之后的k-mer残基肽段与HLA分子的亲和力,选取亲和力大于阈值的为候选新抗原。在本专利技术的一些实施方式中,S12中,将肿瘤样品进行质谱实验分析,将产生的数据导入MaxQuant软件,添加候选新抗原为搜索库,最终能成功鉴定得到的肽段即为新抗原。根据本专利技术的方案,提供了一种由计算机实现的基于新转录本组装结果探索肿瘤新抗原的生物信息学方法,包括由处理器执行的如下步骤:获取肿瘤样品和正常对照样品的全转录组测序数据;组装肿瘤样品和正常对照样品的转录本;获取肿瘤样品和正常对照样品的新转录本;预测肿瘤样品和正常对照样品的新转录本编码蛋白序列;获取肿瘤样品特有的新转录本蛋白序列及蛋白片段序列;计算肿瘤样品特有蛋白及蛋白片段与MHC分子结合的亲和力,得到候选肿瘤新抗原;基于质谱数据对候选的新抗原进行筛选验证。优选的,所述样本为新鲜组织样品;作为替代,可以选用石蜡组织样品。本专利技术的的第二方面在于提供第一方面所述的方法在制备提取免疫治疗新抗原的药品或医疗器械中的应用。与现有技术相比,本专利技术的方案具有如下优势:1、从来源上讲,通过本专利技术方案发现的肿瘤新抗原不局限于已注释的编码区,因此可以发现更多的新抗原。当前常用的方法主要采用靶向区域捕获测序或外显子组测序处理流程,识别体细胞变异后通过亲和力预测得到新抗原。这实质上是将分析区域局限在了基因组上的已知编码区。2、本专利技术获得的肿瘤新抗原来自于非突变的高表达转录本(如内源性逆转录),因此在不同肿瘤类型中有一定的通用性。3、本专利技术获得的肿瘤新抗原经过质谱实验验证,得到的肽段是真实存在表达的,有更高的概率产生免疫应答。附图说明图1为本专利技术一种实施例的提取免疫治疗新抗原的流程图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。为使本领域技术人员更好地理解本专利技术,下面参照附图对本专利技术的实施例进行详细说明。本文具体实施例中所用的“首先”、“其次”、“再次”、“然后”、“接下来”等表达并不旨在对先后顺序进行限定。图1是本专利技术实施例的提取免疫治疗新抗原的流程图,该方法包括由处理器执行的如下步骤:S01,转录组深度测序数据比对具体地,首先采用去核糖体链特异性建库方法和小片段富集筛选建库方法建库测序,获取肿瘤样品和正常对照样品的包含编码RNA和非编码RNA的全转录组深度测序数据,样本数据中包括多个重叠或部分重叠的短读序列,重叠程度的不同与测序的深度有关,肿瘤样品以及正常对照样品应本文档来自技高网...

【技术保护点】
1.基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法,包括以下步骤:/nS01,转录组深度测序数据比对;/nS02,转录本组装;/nS03,转录本过滤;/nS04,预测翻译起始密码子;/nS05,翻译转录本;/nS06,获取肿瘤特有全长新转录本蛋白序列;/nS07,获取肿瘤特有部分序列差异新转录本蛋白序列;/nS08,合并蛋白片段;/nS09,蛋白片段分割;/nS10,人类白细胞抗原基因分型;/nS11,肽段亲和力预测;/n和任选的,S12,质谱验证。/n

【技术特征摘要】
1.基于新转录本组装的肿瘤特异转录区域提取免疫治疗新抗原的方法,包括以下步骤:
S01,转录组深度测序数据比对;
S02,转录本组装;
S03,转录本过滤;
S04,预测翻译起始密码子;
S05,翻译转录本;
S06,获取肿瘤特有全长新转录本蛋白序列;
S07,获取肿瘤特有部分序列差异新转录本蛋白序列;
S08,合并蛋白片段;
S09,蛋白片段分割;
S10,人类白细胞抗原基因分型;
S11,肽段亲和力预测;
和任选的,S12,质谱验证。


2.根据权利要求1所述的方法,其特征在于,S01中,包括以下步骤:
S101,获取肿瘤样品和正常对照样品的包含编码RNA和非编码RNA的全转录组深度测序数据;
S102,过滤肿瘤样品和正常对照样品全转录组深度测序数据;
S103,对参考基因组构建索引;
S104,将S12得到的过滤之后的数据对S13得到的参考基因组进行比对;
优选地,S101中,采用去核糖体链特异性建库方法和小片段富集筛选建库方法建库测序;
优选地,S101中,样本数据中包括多个重叠或部分重叠的短读序列,肿瘤样品以及正常对照样品测序数据均不小于30G;
优选地,S102中,去除其中平均碱基质量低于20或者包含测序引物接头的短读序列。


3.根据权利要求1或2所述的方法,其特征在于,S02中,将已经将短读序列定位到参考基因组的全转录组深度测序数据对比结果组装为转录本。


4.根据权利要求1-3任一所述的方法,其特征在于,S03中,去除组装得到的转录本中存在的已知人类全长转录本和重复序列。


5.根据权利要求1-4任一所述的方法,其特征在于,S04中,包括以下步骤:
...

【专利技术属性】
技术研发人员:万季刘鹏夏迪潘有东王奕宋麒
申请(专利权)人:深圳市新合生物医疗科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1