基于注意力机制的特征提取方法、装置、计算机设备制造方法及图纸

技术编号:38704425 阅读:11 留言:0更新日期:2023-09-08 14:45
本发明专利技术涉及数字医疗技术领域,尤其涉及一种基于注意力机制的特征提取方法,可应用于医疗领域中图像特征提取等应用场景,包括:对原始特征图进行预处理,得到第一特征图;将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图,其中,所述特征提取模型包括平面注意力模块;将所述原始特征图和所述第二特征图进行拼接,得到最终的特征提取结果,从而提高特征提取模型提取尺寸和形状差异较大的病灶的信息能力,进而提高检测结果的准确率。率。率。

【技术实现步骤摘要】
基于注意力机制的特征提取方法、装置、计算机设备


[0001]本专利技术涉及数字医疗
,特别是涉及到一种基于注意力机制的特征提取方法、装置、计算机设备。

技术介绍

[0002]随着医学成像技术的进步,特别是医学成像系统性能的不断升级和数据存储能力的增强,病理图像数据呈爆发式增长。相比于小样本数据,大量的病理图像能够挖掘出更多的潜在信息和规律。例如,由于宫颈癌病理诊断需要对细胞层面医学影像进行观察诊断,一个样本往往制成多个切片,制片、染色、诊断、报告等各个环节耗时较长,具有自动化程度低、诊断时间长的特点。深度学习方法被广泛应用于宫颈癌辅助筛查,从而缓解病理医生的诊断压力。例如,利用深度神经网络对宫颈癌病理图像进行分类、分割、目标检测等辅助医疗诊断。计算机设备可以基于深度神经网络构建目标识别模型,对病理图像中包含的病灶进行识别。目前,在病理图像识别任务中,通常采用目标识别模型,对病理图像进行特征提取,获取病理图像对应的特征图,基于该特征图预测病理图像中的病灶的位置信息、类别信息等。
[0003]但是,在病理图像中通常会存在大小和形状差异较大的病灶,目标检测模型对于这些尺寸和形状差异较大的病灶的信息提取能力较差,在实际应用中,普遍存在假阳性偏高的问题,即在实际操作中,经常将正常的区域检测标出为病灶。同时,一些处于轻型的病灶,由于病变形态较小,会出现漏诊的情况,导致检测结果的准确率较低。

技术实现思路

[0004]本申请的主要目的为提供一种基于注意力机制的特征提取方法、装置、计算机设备,能够解决数字医疗的现有技术中,在病理图像中通常会存在大小和形状差异较大的病灶,目标识别模型对于这些尺寸和形状差异较大的病灶的信息提取能力较差,导致检测结果的准确率较低的技术问题。
[0005]本申请提供的一种基于注意力机制的特征提取方法,包括:
[0006]对原始特征图进行预处理,得到第一特征图;
[0007]将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图,其中,所述特征提取模型包括平面注意力模块;
[0008]将所述原始特征图和所述第二特征图进行拼接,得到最终的特征提取结果。
[0009]进一步,在所述将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图之前,所述方法包括:
[0010]获取训练数据,所述训练数据包括训练样本及与所述训练样本对应的标签;
[0011]通过待训练的特征提取模型对所述训练样本进行处理,获得所述特征提取模型的预测结果和注意力向量;
[0012]根据所述训练样本的预测结果及所述标签,获得固有损失函数;
[0013]根据所述固有损失函数和所述注意力向量确定总损失函数;
[0014]基于所述总损失函数更新所述特征提取模型的模型参数,获得所述特征提取模型的目标模型参数,进而得到以所述目标模型参数为模型参数的特征提取模型。
[0015]进一步,所述通过待训练的特征提取模型对所述训练样本进行处理,获得所述特征提取模型的预测结果和注意力向量的步骤,包括:
[0016]通过所述特征提取模型对所述训练样本进行处理,获得所述特征提取模型的隐藏状态;
[0017]根据所述隐藏状态获得所述特征提取模型的注意力向量。
[0018]进一步,所述根据所述固有损失函数和所述注意力向量确定总损失函数的步骤,包括:
[0019]根据所述注意力向量获得注意力向量熵;
[0020]根据所述注意力向量熵获得注意力分布损失函数;
[0021]根据所述注意力分布损失函数和所述固有损失函数获得所述总损失函数。
[0022]进一步,所述基于所述总损失函数更新所述特征提取模型的模型参数,获得所述特征提取模型的目标模型参数的步骤,包括:
[0023]通过所述特征提取模型基于所述总损失函数和所述训练样本获得所述模型参数的梯度;
[0024]根据所述模型参数的梯度更新所述特征提取模型的模型参数。
[0025]进一步地,所述将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图的步骤,包括:
[0026]对第一特征图进行reshape操作,得到第三特征图;
[0027]将所述第三特征图输入三个不同的fc层,得到与所述fc层对应的第一结果,其中,所述fc层的输入维度和输出维度保持不变;
[0028]对所述第一结果进行reshape操作,得到第一输入序列、第二输入序列和第三输入序列;
[0029]将所述第一输入序列和所述第二输入序列进行矩阵的乘法运算和softmax计算,生成第四特征图;
[0030]将所述第四特征图和所述第三输入序列进行矩阵的乘法运算,生成所述第二特征图。
[0031]进一步地,所述对原始特征图进行预处理,得到第一特征图的步骤,包括:
[0032]对所述原始特征图进行归一化处理,以统一所述原始特征图规格尺寸。
[0033]本申请还提供一种基于注意力机制的特征提取装置,包括:
[0034]预处理模块,用于对原始特征图进行预处理,得到第一特征图;
[0035]第二特征图获取模块,用于将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图,其中,所述特征提取模型包括平面注意力模块;
[0036]最终的特征提取结果获取模块,用于将所述原始特征图和所述第二特征图进行拼接,得到最终的特征提取结果。
[0037]本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法的步骤。
[0038]本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项方法的步骤。
[0039]相对于现有技术,本申请提供了一种基于注意力机制的特征提取方法,用于数字医疗领域,包括:对原始特征图进行预处理,得到第一特征图;将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图,其中,所述特征提取模型包括平面注意力模块;将所述原始特征图和所述第二特征图进行拼接,得到最终的特征提取结果。在数字医疗领域中,可以提高特征提取模型提取尺寸和形状差异较大的病灶的信息能力,进而提高检测结果的准确率。
附图说明
[0040]图1为本申请一实施例中的基于注意力机制的特征提取方法的步骤示意图;
[0041]图2为本申请另一实施例中的基于注意力机制的特征提取方法的步骤示意图;
[0042]图3为本申请一实施例中的基于注意力机制的特征提取装置的结构框图;
[0043]图4为本申请计算机设备的一实施例结构示意框图;
[0044]图5为本申请的具体工作流程图。
[0045]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0046]应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的特征提取方法,其特征在于,包括:对原始特征图进行预处理,得到第一特征图;将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图,其中,所述特征提取模型包括平面注意力模块;将所述原始特征图和所述第二特征图进行拼接,得到最终的特征提取结果。2.根据权利要求1所述基于注意力机制的特征提取方法,其特征在于,在所述将所述第一特征图输入预先训练好的特征提取模型中,生成第二特征图之前,所述方法包括:获取训练数据,所述训练数据包括训练样本及与所述训练样本对应的标签;通过待训练的特征提取模型对所述训练样本进行处理,获得所述特征提取模型的预测结果和注意力向量;根据所述训练样本的预测结果及所述标签,获得固有损失函数;根据所述固有损失函数和所述注意力向量确定总损失函数;基于所述总损失函数更新所述特征提取模型的模型参数,获得所述特征提取模型的目标模型参数,进而得到以所述目标模型参数为模型参数的特征提取模型。3.根据权利要求2所述基于注意力机制的特征提取方法,其特征在于,所述通过待训练的特征提取模型对所述训练样本进行处理,获得所述特征提取模型的预测结果和注意力向量的步骤,包括:通过所述特征提取模型对所述训练样本进行处理,获得所述特征提取模型的隐藏状态;根据所述隐藏状态获得所述特征提取模型的注意力向量。4.根据权利要求2所述基于注意力机制的特征提取方法,其特征在于,所述根据所述固有损失函数和所述注意力向量确定总损失函数的步骤,包括:根据所述注意力向量获得注意力向量熵;根据所述注意力向量熵获得注意力分布损失函数;根据所述注意力分布损失函数和所述固有损失函数获得所述总损失函数。5.根据权利要求2所述基于注意力机制的特征提取方法,其特征在于,所述基于所述总损失函数更新所述特征提取模型的模型参数,获得所述特征提取模型的目标模型...

【专利技术属性】
技术研发人员:郑喜民先健铭舒畅陈又新肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1