System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及胰腺癌早期诊断,尤其是结合深度学习与机器学习的pdac分期预测方法。
技术介绍
1、胰腺导管腺癌(pdac)是最常见的胰腺癌,约占胰腺癌的90%,多在侵袭性不可治愈期被发现。由于胰腺癌预后差、侵袭性强、治疗耐药和诊断晚期,其发病率几乎等于胰腺癌患者的死亡率。因此,实现胰腺癌的早期诊断,是胰腺癌诊治的重要热点课题之一。目前,胰腺癌的筛查手段主要集中在内镜超声(eus)、磁共振成像(mri)等医学影像手段。近年来,胰腺癌生物标志物鉴定和胰腺癌患者内源化合物变化分析,也为胰腺癌的早期诊断和治疗提供新的思路。
2、胰腺癌肿瘤的生物标志物和胰腺癌患者内源性化合物的变化,可以通过对体液,如血液、尿液的代谢组学研究来获取。已有研究通过ms和nmr技术分析胰腺癌患者的血清和尿液代谢谱,发现了一些潜在的生物标志物。然而,目前相关研究主要集中在胰腺癌患者与健康人群之间的分类,胰腺癌具体分期的研究仍然面临挑战。现有的代谢组学方法难以在不同期pdac的代谢谱上获得显著的组间差异,这限制了通过代谢组学促进胰腺癌疾病诊断的进展。代谢组学数据特征变量多,有着高维稀疏的特点。机器学习能够处理多变量数据,通过训练从数据中提取知识,选取变量特征促进决策。尽管已有不少研究使用机器学习算法从代谢谱数据进行学习并实现了相应疾病的预测,但对于难以区分的数据,机器学习表现并不佳。深度学习作为机器学习技术的延伸,具有强大的学习能力和自动化训练性能,能够寻找变量之间的非线性关系,实现更准确的分类预测,已被广泛运用于各种预测问题。
1、本专利技术的目的在于解决现有技术中的问题。
2、本专利技术解决其技术问题所采用的技术方案是:提供一种结合深度学习与机器学习的pdac分期预测方法,包括以下步骤:
3、采集血清样本并获取血清代谢谱数据,构成数据集;
4、构建由深度神经网络、卷积神经网络和长短期记忆网络任意组成的不同组合模型,用于对血清代谢谱数据进行特征提取;
5、构建基于不同组合模型的不同混合模型,所述混合模型包括特征提取部分和分类部分,特征提取部分采用组合模型实现对血清代谢谱数据的特征提取,分类部分采用机器学习算法根据提取的特征进行分类;
6、基于数据集对不同混合模型进行训练,获得训练好的不同混合模型并比较不同混合模型的性能,选择性能最好的混合模型作为预测模型;
7、利用预测模型实现对pdac的分期预测。
8、优选的,采用adasyn算法对数据集进行扩充。
9、优选的,所述不同组合模型包括:
10、结合卷积神经网络和长短期记忆网络构建包括cnn层和lstm层的cnn-lstm模型,利用cnn层提取血清代谢谱的局部特征,利用lstm层处理序列数据;
11、结合深度神经网络和卷积神经网络构建包括dnn层和cnn层的dnn-cnn模型,利用dnn层提取全局特征,再由cnn层提取局部特征;
12、结合卷积神经网络和双向长短期记忆网络构建包括cnn层和双向lstm层的cnn-bilstm模型,结合cnn层和双向lstm层处理局部特征和前后文信息;
13、结合深度神经网络和长短期记忆网络构建包括dnn层和lstm层的dnn-lstm模型,结合dnn层和lstm层处理高维特征和时间依赖信息。
14、优选的,所述机器学习分类算法包括支持向量机、随机森林、梯度提升决策树和极限梯度提升。
15、优选的,所述基于数据集对不同混合模型进行训练,具体为:通过网格搜索算法优化cnn-lstm模型、dnn-cnn模型、cnn-bilstm模型和dnn-lstm模型及机器学习算法的超参数,包括学习率、训练迭代次数、批处理大小、卷积核大小、池化核大小、正则化系数和lstm层神经元数量,获得训练好的不同混合模型。
16、优选的,所述比较不同混合模型的性能,包括:
17、比较基于cnn-lstm模型的混合模型、基于dnn-cnn模型的混合模型、基于cnn-bilstm模型的混合模型和基于dnn-lstm模型的混合模型的roc曲线预测,获得各混合模型的真阳性率和假阳性率;
18、比较基于cnn-lstm模型的混合模型、基于dnn-cnn模型的混合模型、基于cnn-bilstm模型的混合模型和基于dnn-lstm模型的混合模型的混淆矩阵,获得各混合模型的分类准确率。
19、优选的,所述预测模型采用cnn-lstm模型,利用cnn层提取血清代谢谱的局部特征,利用lstm层处理序列数据,最后结合全连接层和relu激活函数进行特征展开;模型的输出再作为机器学习分类算法的输入,由机器学习分类算法进行pdac分期预测。
20、优选的,所述cnn-lstm模型的cnn层包括多个卷积层和池化层,其中,卷积层包括tanh激活函数;所述cnn-lstm模型的包括多层lstm层。
21、本专利技术还提供一种结合深度学习与机器学习的pdac分期预测装置,包括:
22、数据采集模块,采集血清样本并获取血清代谢谱数据,构成数据集;
23、组合模型构建模块,构建由深度神经网络、卷积神经网络和长短期记忆网络任意组成的不同组合模型,用于对血清代谢谱数据进行特征提取;
24、混合模型构建模块,构建基于不同组合模型的不同混合模型,所述混合模型包括特征提取部分和分类部分,特征提取部分采用组合模型实现对血清代谢谱数据的特征提取,分类部分采用机器学习算法根据提取的特征进行分类;
25、预测模型选择模块,基于数据集对不同混合模型进行训练,获得训练好的不同混合模型并比较不同混合模型的性能,选择性能最好的混合模型作为预测模型;
26、预测模型应用模块,利用预测模型实现对pdac的分期预测。
27、本专利技术具有如下有益效果:
28、(1)本专利技术的检查数据采用血清代谢谱数据,其获取过程简单且侵入性低,患者易于接受,同时提供丰富的生物化学信息,有助于更准确地判断疾病状态;并且,血清代谢谱数据的高维特性和复杂性非常适合用于cnn-lstm-ml混合模型,从而充分发挥深度学习和机器学习算法的优势。
29、(2)本专利技术创新性地结合了卷积神经网络(cnn)和长短期记忆网络(lstm),分别用于提取血清代谢谱数据的局部特征和捕捉时间序列信息,从而全面挖掘数据的复杂特征;该模型能够处理多维度的血清代谢谱数据,且由于cnn-lstm模块能够高效提取和表示复杂特征,这些特征可以无缝兼容多种机器学习算法设计允许其结合多种机器学习分类算法,通过这种设计,模型的泛化能力和预测准确性显著提升,有效增强了对复杂代谢谱数据的分类与预测效果。
30、以下结合附图及实施例对本专利技术作进一步详细说明,但本专利技术不局限于实施例。
本文档来自技高网...【技术保护点】
1.一种结合深度学习与机器学习的PDAC分期预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于,采用ADASYN算法对数据集进行扩充。
3.根据权利要求1所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于,所述不同组合模型包括:
4.根据权利要求3所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于,所述机器学习分类算法包括支持向量机、随机森林、梯度提升决策树和极限梯度提升。
5.根据权利要求4所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于,所述基于数据集对不同混合模型进行训练,具体为:通过网格搜索算法优化CNN-LSTM模型、DNN-CNN模型、CNN-BiLSTM模型和DNN-LSTM模型及机器学习算法的超参数,包括学习率、训练迭代次数、批处理大小、卷积核大小、池化核大小、正则化系数和LSTM层神经元数量,获得训练好的不同混合模型。
6.根据权利要求5所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于
7.根据权利要求6所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于,所述预测模型采用CNN-LSTM模型,利用CNN层提取血清代谢谱的局部特征,利用LSTM层处理序列数据,最后结合全连接层和ReLU激活函数进行特征展开;模型的输出再作为机器学习分类算法的输入,由机器学习分类算法进行PDAC分期预测。
8.根据权利要求7所述的结合深度学习与机器学习的PDAC分期预测方法,其特征在于,所述CNN-LSTM模型的CNN层包括多个卷积层和池化层,其中,卷积层包括Tanh激活函数;所述CNN-LSTM模型的包括多层LSTM层。
9.一种结合深度学习与机器学习的PDAC分期预测装置,其特征在于,包括:
...【技术特征摘要】
1.一种结合深度学习与机器学习的pdac分期预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的结合深度学习与机器学习的pdac分期预测方法,其特征在于,采用adasyn算法对数据集进行扩充。
3.根据权利要求1所述的结合深度学习与机器学习的pdac分期预测方法,其特征在于,所述不同组合模型包括:
4.根据权利要求3所述的结合深度学习与机器学习的pdac分期预测方法,其特征在于,所述机器学习分类算法包括支持向量机、随机森林、梯度提升决策树和极限梯度提升。
5.根据权利要求4所述的结合深度学习与机器学习的pdac分期预测方法,其特征在于,所述基于数据集对不同混合模型进行训练,具体为:通过网格搜索算法优化cnn-lstm模型、dnn-cnn模型、cnn-bilstm模型和dnn-lstm模型及机器学习算法的超参数,包括学习率、训练迭代次数、批处理大小、卷积核大小、池化核大小、...
【专利技术属性】
技术研发人员:沈桂平,廖博强,冯江华,钟金水,夏枫,
申请(专利权)人:厦门大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。