System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据缺失条件下的多模态混合融合分类方法技术_技高网
当前位置: 首页 > 专利查询>东北大学专利>正文

一种数据缺失条件下的多模态混合融合分类方法技术

技术编号:41381458 阅读:4 留言:0更新日期:2024-05-20 10:23
本发明专利技术属于智能分类技术领域,公开了一种数据缺失条件下的多模态混合融合分类方法。包括文本缺失数据补全和多模态混合融合;所述文本缺失数据补全通过KNN进行缺失值补充,得到补充后的文本数据,再通过TabNet提取文本特征;通过3D‑RSENet网络提取影像特征;将文本特征和影像特征输入基于注意力机制的多模态混合融合模型,进行分类。通过本发明专利技术的方法,考虑到不同模态之间的互补信息,而且很好的利用到了具有很强的标识功能的单模态数据的特异性信息,以此来学习更丰富的特征表示,从而提升模型的决策性能,大大提高了分类的准确性。

【技术实现步骤摘要】

本专利技术涉及智能分类,尤其涉及一种数据缺失条件下的多模态混合融合分类方法


技术介绍

1、多模态融合技术是当前热门的研究方向之一,它是指对包含多种模态数据的数据集进行组合分析,通过将这些不同模态的数据进行融合,从而得到更为全面和准确的信息。深度学习的成功已经成为解决日益复杂的机器学习问题的催化剂,这些问题通常涉及多种数据模式,如文字、图像、声音等。如何解决模态缺失问题,以及如何跨越不同模态之间的障碍将底层特征与抽象语义之间的差距联系起来,以挖掘多模态数据之间的相关性是当前亟待解决的问题。

2、在医疗领域众多的多模态融合应用中,按照融合策略主要可以分为三种,及前期融合、晚期融合以及中期融合。

3、(1)、前期融合;

4、前期融合是指在将多个输入模式输入到单个学习模型中进行训练之前,先将多个输入模式加入到单个特征向量的过程,更具体地说,在数据集被用作深度学习算法的输入之前的初始阶段就发生了融合过程。我们可以认为,融合过程直接发生在原始数据上,或者如果执行的不是原始数据,而是预处理特征提取步骤,那么认为合并步骤是在特征级别上执行的。“[thung k h,yap p t,shen d.multi-stage diagnosis of alzheimer’sdisease with incomplete multimodal data via multi-task deep learning[c].deeplearning in medical image analysis and multimodal learning for clinicaldecision support:third international workshop,dlmia 2017,and 7thinternational workshop,ml-cds2017,held in conjunction with miccai 2017,québeccity,qc,canada,september 14,proceedings.cham:springer internationalpublishing,2017:160-168.”使用联合融合方法对pet和mri图像进行了融合。“zhang l,xie y,xidao l,et al.multi-source heterogeneous data fusion[c].2018international conference on artificial intelligence and big data(icaibd).ieee,2018:47-51.”从视频和音频源中获得特征向量,然后通过自编码将其转换为具有共享表示的重构特征向量并进行特征融合。“srivastava n,salakhutdinov rr.multimodal learning with deep boltzmann machines[j].advances in neuralinformation processing systems,2012,25(1):1-15.”开发了两个玻尔兹曼机,将文本和图像特征向量组合成一个新的特征向量,用作支持向量机分类器的输入。“liu,z.,zhang,w.,quek,t.q.s.and lin,s.deep fusion of het-erogeneous sensor data.2017ieeeinternational conference on acoustics,speech and signal processing(icassp),ieee press,piscataway,nj,pp,2017:5965-5969.”通过将不同视图的特征向量统一到一个更具描述性和可积分性的特征空间中,从人脸的不同视图中积分特征向量来提高人脸识别的准确性。早期融合的优点首先在于其简单性,因为大多数情况下,不需要考虑针对不同模态数据进行特征选择,并且通常由于原始数据维度较低,因此融合方式比较简单,有利于模型的训练,加速模型的收敛。

5、(2)、晚期融合;

6、晚期融合是决策层面的融合,它是指利用可能存在的多个子模型的预测结果来做最终决策的过程。它通常使用不同的模态数据来训练不同的子模型,并使用聚合函数来组合多个模型的预测结果,从而做最终决策。常用的聚合方式例如:平均值、多数投票、加权投票或基于每个模型预测的分类器等。“yoo y,tang l y w,li d k b,et al.deep learningof brain lesion patterns and user-defined clinical and mri features forpredicting conversion to multiple sclerosis from clinically isolated syndrome[j].computer methods in biomechanics and biomedical engineering:imaging&visualization,2019,7(3):250-259.”将两个单模态模型的预测概率的平均值作为最终结果实现了mri并发的预测。“reda i,khalil a,elmogy m,et al.deep learning role inearly diagnosis of prostate cancer[j].technology in cancer research&treatment,2018,17(1):1-11.”利用单模态模型的预测概率作为输入构建了另一个分类器。“qiu s,chang g h,panagia m,et al.fusion of deep learning models of mriscans,mini-mental state examination,and logical memory test enhancesdiagnosis of mild cognitive impairment[j].alzheimer's&dementia:diagnosis,assessment&disease monitoring,2018,10(1):737-749.”训练了三个独立的成像模型,将来自特定解剖位置的单个mri切片作为输入,并分别应用max、mean和majority三种成像模型的综合预测策略,三种融合方法的结果在与临床模型进行后期融合前,通过多数投票再次合并,与仅使用单一模式的模型相比,所有后期融合模型的性能都有所提高。为了避免假设所有子模型都持有相同的相关信息来预测目标,可以采用其他聚合方法。“wang h,subramanian v,syeda-mahmood t.modeling uncer-tainty in multi-modal fusion forlung cancer survival analysis[c].2021ieee 18th international sy本文档来自技高网...

【技术保护点】

1.一种数据缺失条件下的多模态混合融合分类方法,其特征在于,所述多模态混合融合分类方法包括文本缺失数据补全和多模态混合融合;

2.根据权利要求1所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述基于KNN进行缺失值补充,具体如下:

3.根据权利要求2所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述提取文本特征具体如下:

4.根据权利要求3所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述注意力编码器包括切片模块、全连接层、归一化层、激活函数、掩码和加权缩放因子层,根据前一个步骤切片模块的部分输出,经过全连接层和批归一化层后,采用一个残差连接,输入至加权缩放因子层,计算得到当前步骤的掩码结果,输入至特征编码器中;

5.根据权利要求3或4所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述通过3D-RSENet网络提取影像特征具体如下:

6.根据权利要求5所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述残差学习具体为:首先采用尺寸为1×1×1的卷积核进行卷积,将其通道维度从M降低为M',并进行归一化和ReLU激活;其次使用尺寸为3×3×3的卷积核进行残差学习,并进行归一化和ReLU激活;最后再次采用尺寸为1×1×1的卷积核,将通道维度从M'维调回M维。

7.根据权利要求6所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述多模态混合融合模型包括基于注意力机制的多模态融合模块和基于中期融合的决策融合模块;

...

【技术特征摘要】

1.一种数据缺失条件下的多模态混合融合分类方法,其特征在于,所述多模态混合融合分类方法包括文本缺失数据补全和多模态混合融合;

2.根据权利要求1所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述基于knn进行缺失值补充,具体如下:

3.根据权利要求2所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述提取文本特征具体如下:

4.根据权利要求3所述的数据缺失条件下的多模态混合融合分类方法,其特征在于,所述注意力编码器包括切片模块、全连接层、归一化层、激活函数、掩码和加权缩放因子层,根据前一个步骤切片模块的部分输出,经过全连接层和批归一化层后,采用一个残差连接,输入至加权缩放因子层,计算得到当前步骤的掩码结果,输入至特征...

【专利技术属性】
技术研发人员:贾同朱哲仪原婧贾娜娜王雪莉赵紫旭陈东岳王昊邓诗卓
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1