System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 融合多模态数据的产后乳腺健康检测方法技术_技高网

融合多模态数据的产后乳腺健康检测方法技术

技术编号:42934521 阅读:5 留言:0更新日期:2024-10-11 15:56
本发明专利技术涉及人工智能领域,公开了一种融合多模态数据的产后乳腺健康检测方法,用于整合多种数据源、利用深度学习进行特征提取、采用集成学习技术等方式提高乳腺健康检测的准确性和效率。所述融合多模态数据的产后乳腺健康检测方法包括:获取并预处理多模态数据,利用深度学习提取乳腺影像深度特征,同时提取生理关键特征和生化关键特征,并将问卷调查数据量化为特征。接着,通过特征选择算法筛选出重要特征集,构建基于KNN的基础分类器,并使用AdaBoost算法将多个KNN分类器集成为强分类器,最终输出分类结果。通过集成深度学习、特征提取、特征选择和集成学习等多种技术手段,实现了对产后女性乳腺健康的精准分类与检测。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,尤其涉及一种融合多模态数据的产后乳腺健康检测方法


技术介绍

1、随着医疗技术的不断进步和人们健康意识的提高,产后乳腺健康问题越来越受到广泛关注。乳腺疾病,特别是乳腺癌,已成为女性健康的重大威胁。早期发现、诊断和治疗对于提高治愈率和生存率至关重要。因此,开发一种准确、高效的产后乳腺健康检测方法成为医学研究的重要课题。

2、传统的乳腺健康检测方法主要依赖于医生的触诊、乳腺x线摄影(如钼靶检查)、超声检查等手段。然而,这些方法各有局限性,如触诊的主观性、x线摄影的辐射问题,以及超声检查对操作者经验的依赖等。近年来,随着多模态数据的兴起,结合多种数据源进行综合分析的方法逐渐显示出其在提高诊断准确性方面的潜力。

3、尽管现有的乳腺健康检测方法在技术和效果上已有一定的成就,但仍存在一些明显的不足:

4、数据源单一:许多现有的检测方法主要依赖单一的数据源,如仅使用乳腺影像或生化指标,这限制了诊断的准确性和全面性。

5、特征提取方法有限:传统的特征提取方法可能无法充分捕捉数据的复杂性和细微差别,特别是在处理乳腺影像等复杂数据时。

6、分类器性能有待提升:传统的分类器可能无法充分利用多模态数据中的信息,导致分类准确性不高。

7、缺乏动态适应性:现有的方法往往使用固定的参数和模型,无法根据不同数据集的特点进行动态调整,从而限制了模型的泛化能力。

8、本研究提出的融合多模态数据的产后乳腺健康检测方法正是为了解决上述问题,通过整合多种数据源、利用深度学习进行特征提取、采用集成学习技术等方式,旨在提高乳腺健康检测的准确性和效率。


技术实现思路

1、本专利技术提供了一种融合多模态数据的产后乳腺健康检测方法,用于整合多种数据源、利用深度学习进行特征提取、采用集成学习技术等方式提高乳腺健康检测的准确性和效率。

2、本专利技术第一方面提供了一种融合多模态数据的产后乳腺健康检测方法,所述融合多模态数据的产后乳腺健康检测方法包括:获取产后女性的乳腺多模态数据,所述乳腺多模态数据包括训练数据集及待分类样本,所述训练数据集及待分类样本均包括乳腺影像数据、生理信号数据、生化指标数据及问卷调查数据;依据预设的深度学习模型结合所述乳腺影像数据进行提取得到乳腺影像深度特征,依据所述生理信号数据及生化指标数据提取得到生理关键特征及生化关键特征,依据所述问卷调查数据进行特征量化及特征选择,得到文本数值特征;依据所述乳腺影像深度特征、所述生理关键特征、所述生化关键特征及所述文本数值特征结合特征选择算法进行筛选得到训练数据集对应的特征集及待分类样本的特征集;依据所述训练数据集、所述待分类样本、所述训练数据集对应的特征集、所述待分类样本的特征集结合knn算法构建基础分类器,通过计算待分类样本与训练数据集之间的距离,找到最近的k个邻居,并根据这些邻居的类别来得到待测样本的类别;使用adaboost算法将多个knn基础分类器集成为一个强分类器,在每一轮迭代中,根据前一轮分类器的错误率来调整样本权重,并训练一个新的knn分类器,最终将所有knn分类器的结果按照权重进行线性组合,得到最终的分类结果。

3、可选的,在本专利技术第一方面的第一种实现方式中,所述获取产后女性的乳腺多模态数据,所述乳腺多模态数据包括训练数据集及待分类样本,所述训练数据集及待分类样本均包括乳腺影像数据、生理信号数据、生化指标数据及问卷调查数据,包括:依据所述乳腺影像数据、所述生理信号数据、所述生化指标数据及所述问卷调查数据进行预处理;对所述乳腺影像数据进行尺寸调整和色彩校正,使用图像处理技术去除图像中的噪声和伪影,通过直方图均衡化、对比度拉伸方法提高图像的对比度,以突出乳腺组织和潜在病变区域,将像素值归一化到0到1之间,以消除不同影像设备或拍摄条件的影响;对所述生理信号数据使用滤波器去除噪声,确保信号的基线平稳,消除信号漂移,将连续的信号数据分割成段,而后将数据转换到统一的尺度上,消除量纲和数量级的影响;对所述生化指标数据采用插值、均值填充方法进行估计和填充,使用iqr法则识别并处理异常值,进行对数转换及box-cox转换,以改善数据的正态性或使其更符合模型假设,对数据进行归一化处理,以消除不同生化指标之间的量纲和数量级差异;对所述问卷调查数据检查并纠正问卷中的错误、遗漏或不一致的信息,对于缺失值,根据问题的性质选择众数、中位数填充,对于分类变量,采用独热编码进行转换,以便机器学习模型能够处理,使用文本挖掘技术将文本描述转换为数值特征。

4、可选的,在本专利技术第一方面的第二种实现方式中,所述依据预设的深度学习模型结合所述乳腺影像数据进行提取得到乳腺影像深度特征,依据所述生理信号数据及生化指标数据提取得到生理关键特征及生化关键特征,依据所述问卷调查数据进行特征量化及特征选择,得到文本数值特征,包括:使用预设的卷积神经网络cnn对乳腺影像数据进行训练,提取出深度特征,包括乳腺组织的纹理、形状、边缘信息,将提取出的深度特征保存为向量形式,作为乳腺影像数据的表示;对生理信号数据进行处理,提取出与乳腺健康相关的关键特征,包括心率变异性、心电图波形特征;从生化指标数据中提取与乳腺健康密切相关的关键指标,包括激素水平、肿瘤标志物;对问卷调查数据进行量化处理,将文本信息转换为数值特征,使用卡方检验来选择与乳腺健康最相关的特征;对于每种特征类型:乳腺影像深度特征、生理关键特征、生化关键特征和文本数值特征,计算一个综合评分,用于衡量该特征对乳腺健康分类的重要性,设定f_{score}(f))是特征(f)的综合评分,则:

5、f_{score}(f)=w_1\cdot i_{relevance}(f)+w_2\cdot u_{niqueness}(f)+w_3\cdot c_{orrelation}(f)

6、其中,(i_{relevance}(f))是特征(f)的相关性评分,衡量该特征与乳腺健康状态的关联程度;(u_{niqueness}(f))是特征(f)的独特性评分,表示该特征在数据集中的稀有性或特异性;(c_{orrelation}(f))是特征(f)与其他特征之间的相关性评分,用于衡量特征的冗余性;(w_1,w_2,w_3)是权重系数,用于调整不同评分组件的重要性。

7、可选的,在本专利技术第一方面的第三种实现方式中,所述依据所述乳腺影像深度特征、所述生理关键特征、所述生化关键特征及所述文本数值特征结合特征选择算法进行筛选得到训练数据集对应的特征集及待分类样本的特征集,包括:使用包装法和过滤法进行特征选择,利用互信息、相关系数指标评估每个特征与产后乳腺健康状态之间的相关性,使用递归特征消除方法,结合分类器的反馈来迭代地选择最重要的特征子集,设定一个综合评分阈值,筛选出高于该阈值的特征,形成最终的特征集;将筛选出的特征集应用于训练数据集和待分类样本,构建对应的特征向量,对于训练数据集,使用有监督的学习方法来训练分类模型,对于待分类样本,利用训练好的模型进行本文档来自技高网...

【技术保护点】

1.一种融合多模态数据的产后乳腺健康检测方法,其特征在于,所述融合多模态数据的产后乳腺健康检测方法包括:

2.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述获取产后女性的乳腺多模态数据,所述乳腺多模态数据包括训练数据集及待分类样本,所述训练数据集及待分类样本均包括乳腺影像数据、生理信号数据、生化指标数据及问卷调查数据,包括:

3.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述依据预设的深度学习模型结合所述乳腺影像数据进行提取得到乳腺影像深度特征,依据所述生理信号数据及生化指标数据提取得到生理关键特征及生化关键特征,依据所述问卷调查数据进行特征量化及特征选择,得到文本数值特征,包括:

4.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述依据所述乳腺影像深度特征、所述生理关键特征、所述生化关键特征及所述文本数值特征结合特征选择算法进行筛选得到训练数据集对应的特征集及待分类样本的特征集,包括:

5.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述依据所述训练数据集、所述待分类样本、所述训练数据集对应的特征集、所述待分类样本的特征集结合KNN算法构建基础分类器,通过计算待分类样本与训练数据集之间的距离,找到最近的K个邻居,并根据这些邻居的类别来得到待测样本的类别,包括:

6.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述使用AdaBoost算法将多个KNN基础分类器集成为一个强分类器,在每一轮迭代中,根据前一轮分类器的错误率来调整样本权重,并训练一个新的KNN分类器,最终将所有KNN分类器的结果按照权重进行线性组合,得到最终的分类结果,包括:

7.根据权利要求6所述的融合多模态数据的产后乳腺健康检测方法,其特征在于还包括:

8.一种融合多模态数据的产后乳腺健康检测装置,其特征在于,所述融合多模态数据的产后乳腺健康检测装置包括:

9.一种融合多模态数据的产后乳腺健康检测设备,其特征在于,所述融合多模态数据的产后乳腺健康检测设备包括:存储器和至少一个处理器,所述存储器中存储有指令;

10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述的融合多模态数据的产后乳腺健康检测方法。

...

【技术特征摘要】

1.一种融合多模态数据的产后乳腺健康检测方法,其特征在于,所述融合多模态数据的产后乳腺健康检测方法包括:

2.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述获取产后女性的乳腺多模态数据,所述乳腺多模态数据包括训练数据集及待分类样本,所述训练数据集及待分类样本均包括乳腺影像数据、生理信号数据、生化指标数据及问卷调查数据,包括:

3.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述依据预设的深度学习模型结合所述乳腺影像数据进行提取得到乳腺影像深度特征,依据所述生理信号数据及生化指标数据提取得到生理关键特征及生化关键特征,依据所述问卷调查数据进行特征量化及特征选择,得到文本数值特征,包括:

4.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述依据所述乳腺影像深度特征、所述生理关键特征、所述生化关键特征及所述文本数值特征结合特征选择算法进行筛选得到训练数据集对应的特征集及待分类样本的特征集,包括:

5.根据权利要求1所述的融合多模态数据的产后乳腺健康检测方法,其特征在于,所述依据所述训练数据集、所述待分类样本、所述训练数据集...

【专利技术属性】
技术研发人员:陶佳杭英闵欣瑶
申请(专利权)人:宜兴市人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1