【技术实现步骤摘要】
本申请涉及生物信息计算。更具体地说,本申请涉及一种ercc2基因功能性突变的预测方法和装置。
技术介绍
1、膀胱癌中顺铂的疗效与ercc2的驱动突变介导的功能缺失密切相关。有研究表明,ercc2基因的突变与膀胱癌患者对顺铂反应之间存在显著关联,在顺铂反应者中,ercc2突变的频率达到38%,而在顺铂非反应者中仅为6%。几乎所有临床观察到的ercc2突变均表明核苷酸切除修复功能的丧失,且与顺铂敏感性增加相关联,这表明ercc2突变可能在接受化疗的膀胱癌患者中具有更强的临床意义。
2、临床发现的ercc2突变分布在整个基因中,靶向测序方法不能检测基因组全部区域。即使检测出ercc2基因存在基因突变,仅考虑特定区域的突变特征,也难以区分其基因突变为驱动突变还是乘客突变。而通过功能性验证ercc2突变是否为驱动突变的实验操作难度大、时间周期长且花销大。由此,现有技术缺乏直接测量ercc2基因驱动突变的预测(或者检测)方法。
技术实现思路
1、本申请实施的目的是,提供一种ercc2基因功能性突变的预测方法和装置,其能够识别ercc2驱动突变,有助于对膀胱癌辅助化疗方法的决策,改善临床治疗效果。本申请实施例主要通过下述技术方案实现:
2、本申请实施例的第一方面,提供了一种ercc2基因功能性突变的预测方法,包括:
3、获取肿瘤基因数据;
4、基于所述肿瘤基因数据获得第一突变结果;
5、基于所述第一突变结果获得基因组体细胞突变分布特征;
6、将所述基因组体细胞突变分布特征输入ercc2功能性突变预测模型,所述ercc2功能性突变预测模型对所述基因组体细胞突变分布特征进行预测处理,获得ercc2驱动突变的预测结果。
7、根据本申请的一个实施例,所述基于所述肿瘤基因数据获得第一突变结果的步骤包括:
8、对所述肿瘤基因数据进行全基因组测序处理,获得第一dna序列;
9、将所述第一dna序列与标准基因hg38进行比对,得到所述第一突变结果。
10、根据本申请的一个实施例,所述基于所述第一突变结果获得基因组体细胞突变分布特征的步骤包括:
11、设置全基因组的多个特征区域;
12、在所述第一突变结果内收集与每个所述特征区域对应的特征数据;
13、计算每个所述特征数据中所有突变的突变数量;
14、基于所有所述突变数量和所有所述特征区域生成突变矩阵;
15、将所述突变矩阵中的每个元素进行数据转换处理,以消除不同元素之间的尺度差异,形成目标矩阵;
16、从所述目标矩阵中提取基因组体细胞突变分布特征。
17、根据本申请的一个实施例,所述ercc2功能性突变预测模型的训练步骤包括:
18、获取训练数据集和真实标签集,其中,所述训练数据集中的每个训练数据均与所述真实标签集中的其中一个真实标签存在一一对应的关系;
19、将目标训练数据输入支持向量机模型,所述支持向量机模型对所述目标训练数据进行预测处理,获得训练结果,其中,所述目标训练数据为所述训练数据集中任意一个训练数据;
20、基于所述训练结果和与所述目标训练数据对应的真实标签计算损失函数;
21、基于所述损失函数调整所述支持向量机模型的第一模型参数,形成所述ercc2功能性突变预测模型。
22、根据本申请的一个实施例,在所述基于所述损失函数调整所述支持向量机模型的第一模型参数,形成所述ercc2功能性突变预测模型的步骤之后,所述ercc2功能性突变预测模型的训练步骤还包括:
23、采用留一交叉验证方法对所述ercc2功能性突变预测模型进行评估,获得评估结果;
24、基于所述评估结果调整所述ercc2功能性突变预测模型。
25、根据本申请的一个实施例,在所述基于所述评估结果调整所述ercc2功能性突变预测模型的步骤之后,所述ercc2功能性突变预测模型的训练步骤还包括:
26、基于所有的训练结果和所述真实标签集生成混淆矩阵;
27、基于所述混淆矩阵计算准确率、召回率、精确率和/或f1分数;
28、基于所述准确率、所述召回率、所述精确率和/或所述f1分数评估所述ercc2功能性突变预测模型的性能。
29、根据本申请的一个实施例,在所述基于所述准确率、所述召回率、所述精确率和/或所述f1分数评估所述ercc2功能性突变预测模型的性能的步骤之后,所述ercc2功能性突变预测模型的训练步骤还包括:
30、对所述ercc2功能性突变预测模型进行敏感性分析,以调整所述ercc2功能性突变预测模型的第二模型参数。
31、本申请实施例的第二方面,提供了一种ercc2基因功能性突变的预测装置,包括:
32、肿瘤基因数据获取模块,用于获取肿瘤基因数据;
33、第一突变结果获得模块,用于基于所述肿瘤基因数据获得第一突变结果;
34、基因组体细胞突变分布特征获得模块,用于基于所述第一突变结果获得基因组体细胞突变分布特征;
35、预测模块,用于将所述基因组体细胞突变分布特征输入ercc2功能性突变预测模型,所述ercc2功能性突变预测模型对所述基因组体细胞突变分布特征进行预测处理,获得ercc2驱动突变的预测结果。
36、本申请实施例的第三方面,提供了一种终端设备,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行上述本申请实施例第一方面提供的ercc2基因功能性突变的预测方法的步骤。
37、本申请实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序使得计算机执行上述本申请实施例第一方面提供的ercc2基因功能性突变的预测方法的步骤。
38、本申请实施例的有益效果包括:
39、本申请实施例设计了一种ercc2功能性突变预测模型,用于预测ercc2驱动突变的预测结果。具体的,本申请实施例基于肿瘤基因数据获得第一突变结果;基于第一突变结果获得基因组体细胞突变分布特征;将基因组体细胞突变分布特征输入ercc2功能性突变预测模型,即可输出ercc2驱动突变的预测结果。由此,与现有技术相比,本申请实施例能够在短时间内识别ercc2驱动突变,有助于对膀胱癌辅助化疗方法的决策,改善临床治疗效果。
本文档来自技高网...【技术保护点】
1.一种ERCC2基因功能性突变的预测方法,其特征在于,包括:
2.根据权利要求1所述的ERCC2基因功能性突变的预测方法,其特征在于,所述基于所述肿瘤基因数据获得第一突变结果的步骤包括:
3.根据权利要求1所述的ERCC2基因功能性突变的预测方法,其特征在于,所述基于所述第一突变结果获得基因组体细胞突变分布特征的步骤包括:
4.根据权利要求1所述的ERCC2基因功能性突变的预测方法,其特征在于,所述ERCC2功能性突变预测模型的训练步骤包括:
5.根据权利要求4所述的ERCC2基因功能性突变的预测方法,其特征在于,在所述基于所述损失函数调整所述支持向量机模型的第一模型参数,形成所述ERCC2功能性突变预测模型的步骤之后,所述ERCC2功能性突变预测模型的训练步骤还包括:
6.根据权利要求5所述的ERCC2基因功能性突变的预测方法,其特征在于,在所述基于所述评估结果调整所述ERCC2功能性突变预测模型的步骤之后,所述ERCC2功能性突变预测模型的训练步骤还包括:
7.根据权利要求6所述的ERCC2基因功能性突
8.一种ERCC2基因功能性突变的预测装置,其特征在于,包括:
9.一种终端设备,其特征在于,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行上述权利要求1至7任一项所述的ERCC2基因功能性突变的预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行上述权利要求1至7任一项所述的ERCC2基因功能性突变的预测方法的步骤。
...【技术特征摘要】
1.一种ercc2基因功能性突变的预测方法,其特征在于,包括:
2.根据权利要求1所述的ercc2基因功能性突变的预测方法,其特征在于,所述基于所述肿瘤基因数据获得第一突变结果的步骤包括:
3.根据权利要求1所述的ercc2基因功能性突变的预测方法,其特征在于,所述基于所述第一突变结果获得基因组体细胞突变分布特征的步骤包括:
4.根据权利要求1所述的ercc2基因功能性突变的预测方法,其特征在于,所述ercc2功能性突变预测模型的训练步骤包括:
5.根据权利要求4所述的ercc2基因功能性突变的预测方法,其特征在于,在所述基于所述损失函数调整所述支持向量机模型的第一模型参数,形成所述ercc2功能性突变预测模型的步骤之后,所述ercc2功能性突变预测模型的训练步骤还包括:
6.根据权利要求5所述的ercc2基因功能性突变的预测方法,其特征在于,在所述基于所述评估...
【专利技术属性】
技术研发人员:方虎,颜泽钦,王云洁,钟雅迪,蔡佳佳,
申请(专利权)人:深圳大学附属华南医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。