System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法技术_技高网

一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法技术

技术编号:44459843 阅读:0 留言:0更新日期:2025-02-28 19:07
本发明专利技术提供一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法,属于医学建模领域。包括:S1:喂入一定的胸部增强CT样本量,其中包括部分有标签队列和部分无标签队列;S2:根据所述有标签队列的样本,创建出第一机器学习模型;S3:使用第一机器学习模型预测无标签队列中的无标签淋巴结,将其贴上伪标签,包括低风险淋巴结和高风险淋巴结;S4:使用有标签队列和伪标签为样本,创建出第二机器学习模型;S5:两两合并,创建出第三机器学习模型用于临床预测乳腺癌是否已经有腋窝淋巴结转移。本发明专利技术的模型可以无创地预测乳腺癌患者的腋窝淋巴结受累情况,有助于筛选高风险患者,确定合适的腋窝治疗方案,避免不必要的腋窝手术和并发症。

【技术实现步骤摘要】

本专利技术属于医学建模的乳腺癌转移预测模型领域,具体涉及一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法


技术介绍

1、乳腺癌腋窝淋巴结转移是乳腺癌独立的预后因子,同时决定着患者的治疗方式,临床腋窝淋巴结评估是乳腺癌诊断和治疗的重要组成部分。

2、准确评估腋窝淋巴结(alns)对于确定乳腺癌患者的最佳分期和治疗方法至关重要。目前,临床实践仍依赖侵入性活检和腋窝手术来评估乳腺癌患者的腋窝淋巴结分期。前哨淋巴结活检作为有效的腋窝评估方式之一,其阳性结果往往是确定是否需要进行新辅助治疗(nat)的重要依据。尽管前哨淋巴结活检(slnb)可以减少腋窝淋巴结清扫术(alnd)的相关并发症,但这种手术仍有一定的假阴性率。目前,临床上常用的alns成像方法的准确性不足以实现alns的精确临床分期。

3、影像组学的出现给医学诊治带来便利,当前关于乳腺癌的影像组学研究越来越多,但是在专利技术人研究腋窝淋巴结转移以前的研究都是基于乳腺病灶去预测腋窝淋巴结转移,还没有基于淋巴结本身去预测腋窝淋巴结转移。专利技术人此前申请了专利cn202310560075.4提供一种乳腺癌患者腋窝淋巴结转移预测模型,包括对二维的肺部增强ct片进行三维重建后,建立腋窝淋巴结图谱,选取其中所有的腋窝淋巴结为roi区域,且选取每个腋窝淋巴结的全部影像组学特征中的5个以上影像组学特征联用进行区分所述乳腺癌是否有腋窝淋巴结转移;且使用随机森林机器学习预测模型构建所述预测模型。该专利技术建立的模型可以无创地预测乳腺癌患者的腋窝淋巴结受累情况,该模型中未纳入患者的临床病理特征,且该模型中的图像切割并不基于乳腺肿瘤,而是基于腋窝淋巴结;该专利技术所述模型用于确定合适的腋窝治疗方案,从而避免不必要的腋窝手术和并发症,有助于乳腺癌更精准的手术和辅助治疗模式的开展。

4、但是,该机器学习模型是全监督预测模型,其临床应用的广度仍有限;因此,本领域需要一种乳腺癌腋窝淋巴结转移预测的半监督模型及其构建方法。


技术实现思路

1、因此,本专利技术提供一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法,所述方法包括如下步骤:

2、s1:喂入一定的胸部增强ct样本量,其中包括部分有标签队列和部分无标签队列,所述有标签队列即已经知晓患者的乳腺癌是否已经有腋窝淋巴结转移,将这些患者的淋巴结标记为有转移淋巴结和非转移淋巴结,所述无标签队列即并不知晓患者的乳腺癌是否已经有腋窝淋巴结转移,将这些患者的淋巴结标记为无标签淋巴结;

3、s2:根据所述有标签队列的样本,提取和筛选出其中的若干个ct影像组学特征,训练和创建出第一机器学习模型;

4、s3:使用第一机器学习模型预测所述无标签淋巴结,将所述无标签淋巴结贴上伪标签,且所述伪标签包括低风险淋巴结和高风险淋巴结;

5、s4:使用所述有转移淋巴结、非转移淋巴结、低风险淋巴结和高风险淋巴结为样本,提取和筛选出其中的多个ct影像组学特征,训练和创建出第二机器学习模型;

6、s5:合并第二机器学习模型中的非转移淋巴结和低风险淋巴结得到无转移风险淋巴结,且合并其中的有转移淋巴结和高风险淋巴结得到有转移风险淋巴结,创建出第三机器学习模型;即所述第三机器学习模型仅包含无转移风险淋巴结和有转移风险淋巴结两类,所述第三机器学习模型用于临床预测乳腺癌是否已经有腋窝淋巴结转移。

7、在一种具体的实施方式中,所述若干个ct影像组学特征包括10~20个ct影像组学特征,优选包括14个ct影像组学特征。

8、具体地,所述14个ct影像组学特征包括伸长率、最大3d直径、表面积体积比、球形度、特征值的百分之10的值、最小特征值、均方根误差、最大相关系数、相关性、逆差分归一化、测量具有较高灰度值的大相关性的联合分布、区域熵、低灰度区域强调、小面积低灰度区域强调。

9、在一种具体的实施方式中,步骤s3中,第一机器学习模型对乳腺癌腋窝淋巴结转移的风险指数小于等于50%且大于0的淋巴结标记为低风险淋巴结,且对乳腺癌腋窝淋巴结转移的风险指数大于50%且小于100%的淋巴结标记为高风险淋巴结。

10、在一种具体的实施方式中,步骤s4中,所述多个ct影像组学特征包括60~90个ct影像组学特征,优选包括70~82个ct影像组学特征,更优选包括77个ct影像组学特征。

11、在一种具体的实施方式中,步骤s5中,对乳腺癌腋窝淋巴结转移的风险指数小于等于50%的淋巴结归集为无转移风险淋巴结,且对乳腺癌腋窝淋巴结转移的风险指数大于50%的淋巴结归集为有转移风险淋巴结。

12、在一种具体的实施方式中,所述第一机器学习模型为逻辑回归lr、朴素贝叶斯、支持向量机svm、k-最近邻、随机森林rf、极端随机树extratrees、极端梯度提升xgboost、轻量级梯度提升机lightgbm、梯度提升、自适应提升、多层感知器mlp模型这11种模型中的任意一种,所述第二机器学习模型和第三机器学习模型均为逻辑回归lr、支持向量机svm、随机森林rf、极端随机树extratrees、极端梯度提升xgboost、轻量级梯度提升机lightgbm、多层感知器mlp模型这7种模型中的任意一种,优选所述第一机器学习模型、第二机器学习模型和第三机器学习模型均为mlp模型,即多层感知器模型。

13、本专利技术至少具备如下有益效果:

14、现有技术中建立的机器学习模型均属于全监督模型,即全部都已知建模用的样本是已转移还是未转移;而本专利技术建立的第二机器学习模型和第三机器学习模型均属于半监督模型,即部分是已知“是否已经转移”的样本,而部分是未知“是否已经转移”的样本。已知“是否已经转移”的样本归属为“有标签队列”,而未知“是否已经转移”的样本归属为“无标签队列”。本专利技术提供的半监督预测模型可以结合使用有标签数据和无标签数据进行训练;这种方法不仅有助于通过使用无标签数据发现潜在的模式或结构,还能有效利用现有的有标签数据,从而提高模型的整体性能。

15、本专利技术最终在第三机器学习模型中将淋巴结分为两类,相比于在第一机器学习模型,其模型应用的敏感性得到提高。本专利技术中第二机器学习模型属于多分类器,而第三机器学习模型属于二分类器,使用本专利技术所述的第三机器学习模型预测乳腺癌患者的腋窝淋巴结转移情况时,与第二机器学习模型相比,它更适用于临床应用。

16、总的来说,本专利技术建立了一种基于增强胸部ct的乳腺癌腋窝淋巴结转移预测半监督模型,使用该模型可以无创地预测乳腺癌患者的腋窝淋巴结受累情况,有助于筛选高风险患者,确定合适的腋窝治疗方案,从而避免不必要的腋窝手术和并发症,有助于乳腺癌更精准的手术和辅助治疗模式的开展。

本文档来自技高网...

【技术保护点】

1.一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的构建方法,其特征在于,步骤S2中,所述若干个CT影像组学特征包括10~20个CT影像组学特征,优选包括14个CT影像组学特征。

3.根据权利要求1所述的构建方法,其特征在于,步骤S3中,第一机器学习模型对乳腺癌腋窝淋巴结转移的风险指数小于等于50%且大于0的淋巴结标记为低风险淋巴结,且对乳腺癌腋窝淋巴结转移的风险指数大于50%且小于100%的淋巴结标记为高风险淋巴结。

4.根据权利要求1所述的构建方法,其特征在于,步骤S4中,所述多个CT影像组学特征包括60~90个CT影像组学特征,优选包括70~82个CT影像组学特征,更优选包括77个CT影像组学特征。

5.根据权利要求1所述的构建方法,其特征在于,步骤S5中,对乳腺癌腋窝淋巴结转移的风险指数小于等于50%的淋巴结归集为无转移风险淋巴结,且对乳腺癌腋窝淋巴结转移的风险指数大于50%的淋巴结归集为有转移风险淋巴结。

6.根据权利要求1~5中任意一项所述的构建方法,其特征在于,所述第一机器学习模型为逻辑回归LR、朴素贝叶斯、支持向量机SVM、k-最近邻、随机森林RF、极端随机树ExtraTrees、极端梯度提升XGBoost、轻量级梯度提升机LightGBM、梯度提升、自适应提升、多层感知器MLP模型这11种模型中的任意一种,所述第二机器学习模型和第三机器学习模型均为逻辑回归LR、支持向量机SVM、随机森林RF、极端随机树ExtraTrees、极端梯度提升XGBoost、轻量级梯度提升机LightGBM、多层感知器MLP模型这7种模型中的任意一种,优选所述第一机器学习模型、第二机器学习模型和第三机器学习模型均为MLP模型,即多层感知器模型。

...

【技术特征摘要】

1.一种乳腺癌腋窝淋巴结转移预测半监督模型的构建方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的构建方法,其特征在于,步骤s2中,所述若干个ct影像组学特征包括10~20个ct影像组学特征,优选包括14个ct影像组学特征。

3.根据权利要求1所述的构建方法,其特征在于,步骤s3中,第一机器学习模型对乳腺癌腋窝淋巴结转移的风险指数小于等于50%且大于0的淋巴结标记为低风险淋巴结,且对乳腺癌腋窝淋巴结转移的风险指数大于50%且小于100%的淋巴结标记为高风险淋巴结。

4.根据权利要求1所述的构建方法,其特征在于,步骤s4中,所述多个ct影像组学特征包括60~90个ct影像组学特征,优选包括70~82个ct影像组学特征,更优选包括77个ct影像组学特征。

5.根据权利要求1所述的构建方法,其特征在于,步骤s5中,对乳腺癌腋...

【专利技术属性】
技术研发人员:易文君瞿莉梦梅习龙
申请(专利权)人:中南大学湘雅二医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1