System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及药物敏感性预测,尤其涉及一种膀胱癌化疗药物敏感性预测模型的构建方法及其应用。
技术介绍
1、膀胱癌是泌尿系统最常见的恶性肿瘤,占我国泌尿生殖系肿瘤发病率第一位,由于膀胱癌的异质性且其对化疗药物存在不敏感,使治疗存在一定盲目性。化疗药物本身就有细胞毒性,在化疗过程中可能出现癌肿未得到控制,反而出现不良反应,给病人带来不必要的痛苦,影响生活质量,甚至预后。
2、随着分子生物学的飞速发展,发现癌症中的基因表达与肿瘤的发生、发展、转移、预后密切相关,且与肿瘤的化疗疗效也有一定的联系。而且越来越多的机器学习模型被用来预测药物敏感性,如何利用机器学习方法以精准预测患者药物敏感性,辅助指导肿瘤患者个性化治疗,具有重要的临床意义。目前大多数药物敏感性预测模型使用的数据主要来自于公用数据库,缺少针对于中国人的真实的临床数据,使得预测结果与临床真实效果相比参差不齐,且模型的预测结果为ic50值,没能直观地表现出用药效果。
3、因此,亟需一种膀胱癌化疗药物敏感性预测模型的构建方法,以辅助直观、精准地预测患者药物敏感性,指导肿瘤患者个性化治疗,提高患者痊愈率。
技术实现思路
1、本专利技术提供一种膀胱癌化疗药物敏感性预测模型的构建方法及其应用,用以解决现有的药物敏感性预测模型的预测结果准确性低,且预测结果为ic50值,没能直观地表现出用药效果的缺陷。
2、本专利技术提供一种训练集的构建方法,包括:
3、获取目标群体的肿瘤样本组织的全转录组测序数
4、根据目标群体的肿瘤样本组织的全转录组测序数据,得到目标群体的肿瘤样本组织的基因表达数据;
5、根据目标群体的肿瘤样本组织的基因表达数据,得到目标群体的肿瘤样本组织的免疫细胞浸润水平数据;
6、以目标群体的施用的膀胱癌化疗药物类型数据、肿瘤样本组织的免疫细胞浸润水平数据作为样本数据,以目标群体的膀胱癌化疗药物敏感性数据作为标签数据,构建训练集。
7、在一种实施方案中,施用的膀胱癌化疗药物类型数据包括以下任一项或其任意组合:吉西他滨数据、紫杉醇数据、多西他赛数据。
8、在一种实施方案中,所述根据目标群体的肿瘤样本组织的全转录组测序数据,得到目标群体的肿瘤样本组织的基因表达数据,包括:
9、获取参照基因组数据;
10、对目标群体的肿瘤样本组织的全转录组测序数据进行数据质控;
11、将数据质控后的全转录组测序数据与参照基因组数据进行比对,得到bam文件;
12、根据bam文件计算基因表达量,得到目标群体的肿瘤样本组织的基因表达数据。
13、在一种实施方案中,所述对目标群体的肿瘤样本组织的全转录组测序数据进行数据质控,包括:
14、根据预设数据质控条件,对目标群体的肿瘤样本组织的全转录组测序数据进行数据质控,其中,预设数据质控条件包括:
15、滤除碱基n的含量超过预设含量阈值的reads;
16、滤除测序质量值低于预设质量值阈值的reads。
17、在一种实施方案中,预设质量值阈值为15。
18、在一种实施方案中,所述根据目标群体的肿瘤样本组织的基因表达数据,得到目标群体的肿瘤样本组织的免疫细胞浸润水平数据,包括:
19、根据目标群体的肿瘤样本组织的基因表达数据,通过多种细胞浸润水平评估法,得到多个细胞浸润水平评估结果,继而得到目标群体的肿瘤样本组织的免疫细胞浸润水平数据,其中,多种细胞浸润水平评估法包括以下任一项或其任意组合:cibersort、cibersort-abs、epic、mcpcounter、quantiseq、timer、xcell。
20、在一种实施方案中,本专利技术提供一种训练集的构建方法还包括:
21、根据预设清洗规则,对训练集进行数据清洗,其中,预设清洗规则包括以下任一条或其任意组合:
22、对于目标群体的肿瘤样本组织的免疫细胞浸润水平数据中的每一条免疫细胞浸润水平数据,当>60%的免疫细胞浸润水平评估结果的值为0时,则删除该条免疫细胞浸润水平数据;
23、对于通过多种细胞浸润水平评估法得到的目标群体的肿瘤样本组织的免疫细胞浸润水平数据,当通过某一种细胞浸润水平评估法得到的免疫细胞浸润水平评估结果中的≥80%的值均为0时,则删除通过该种细胞浸润水平评估法得到的免疫细胞浸润水平评估结果;
24、在施用的膀胱癌化疗药物类型数据表示为同一膀胱癌化疗药物时,对于目标群体的膀胱癌化疗药物敏感性数据,若膀胱癌化疗药物敏感性数据表示膀胱癌化疗药物应答和膀胱癌化疗药物耐药的比值在预设比值范围之外时,则随机删除部分膀胱癌化疗药物敏感性数据直至膀胱癌化疗药物应答和膀胱癌化疗药物耐药的比值在预设范围内。
25、本专利技术提供一种膀胱癌化疗药物敏感性预测模型的构建方法,包括:
26、获取根据上述任一项所述的训练集的构建方法得到的训练集;
27、根据训练集,分别通过多种机器学习算法,训练得到多个候选模型;
28、根据预设模型指标,对多个候选模型进行筛选,得到至少两个最终的候选模型,作为至少两个膀胱癌化疗药物敏感性预测模型。
29、在一种实施方案中,至少两个最终的候选模型包括四个最终的候选模型,其中,四个最终的候选模型为根据训练集,分别通过easyensemble classifier(基于随机欠采样的集成分类器)、balancedrandomforest classifier(平衡随机森林分类器)、balancedbagging classifier(基于bagging技术的集成分类器)、rusboost classifier(基于随机欠抽样的分类器)机器学习算法训练得到的候选模型。
30、在一种实施方案中,预设模型指标包括以下任一项或其任意组合:roc曲线下方的面积(auc,area under curve)、f1分数(f1-score)、准确率(accuracy)、马修斯相关系数(matthews correlation coefficient,mcc)。
31、本专利技术提供一种膀胱癌化疗药物敏感性预测系统,包括:
32、数据接收模块,用于:接收由至少一个客户端发送的待测者的待施用的膀胱癌化疗药物类型数据、肿瘤样本组织的免疫细胞浸润水平数据,其中,待测者为膀胱癌患者;
33、预测模块,用于:根据待测者的待施用的膀胱癌化疗药物类型数据、肿瘤样本组织的免疫细胞浸润水平数据,通过上述任一项所述的膀胱癌化疗药物敏感性预测模型的构建方法得到的至少两个膀胱癌化疗药物敏感性预测模型,结合硬投票法,得到待测者的膀胱癌化疗药物敏感性预测结果;
本文档来自技高网...
【技术保护点】
1.一种训练集的构建方法,包括:
2.根据权利要求1所述的训练集的构建方法,其特征在于,所述根据目标群体的肿瘤样本组织的全转录组测序数据,得到目标群体的肿瘤样本组织的基因表达数据,包括:
3.根据权利要求2所述的训练集的构建方法,其特征在于,所述对目标群体的肿瘤样本组织的全转录组测序数据进行数据质控,包括:
4.根据权利要求3所述的训练集的构建方法,其特征在于,所述根据目标群体的肿瘤样本组织的基因表达数据,得到目标群体的肿瘤样本组织的免疫细胞浸润水平数据,包括:
5.根据权利要求4所述的训练集的构建方法,其特征在于,还包括:
6.一种膀胱癌化疗药物敏感性预测模型的构建方法,其特征在于,包括:
7.根据权利要求6所述的膀胱癌化疗药物敏感性预测模型的构建方法,其特征在于,至少两个最终的候选模型包括四个最终的候选模型,其中,四个最终的候选模型为根据训练集,分别通过EasyEnsembleClassifier、BalancedRandomForestClassifier、BalancedBaggingClassifi
8.一种膀胱癌化疗药物敏感性预测系统,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行以下步骤:
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行以下步骤:
...【技术特征摘要】
1.一种训练集的构建方法,包括:
2.根据权利要求1所述的训练集的构建方法,其特征在于,所述根据目标群体的肿瘤样本组织的全转录组测序数据,得到目标群体的肿瘤样本组织的基因表达数据,包括:
3.根据权利要求2所述的训练集的构建方法,其特征在于,所述对目标群体的肿瘤样本组织的全转录组测序数据进行数据质控,包括:
4.根据权利要求3所述的训练集的构建方法,其特征在于,所述根据目标群体的肿瘤样本组织的基因表达数据,得到目标群体的肿瘤样本组织的免疫细胞浸润水平数据,包括:
5.根据权利要求4所述的训练集的构建方法,其特征在于,还包括:
6.一种膀胱癌化疗药物敏感性预测模型的构建方法,其特征在于,包括:
7.根据权利要求6所述的膀...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。