System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于医学图像处理和人工智能领域,具体涉及病理图像的深度学习特征提取、降维和相似度检索方法。
技术介绍
1、现有的病理图像相似度检索方法主要包括:基于传统图像处理技术的特征提取方法,使用卷积神经网络(cnn)进行特征提取的方法,基于注意力机制的深度学习模型,常见的相似度度量方法,如欧氏距离、余弦相似度等。尽管现有技术在病理图像检索方面取得了进展,但仍存在以下几个主要缺点:
2、特征提取不够精细:未能充分利用病理图像的多尺度信息和细胞级别的形态学特征。异质性处理不足:病理图像中的细胞和组织具有高度异质性,现有方法在特征提取时未能有效区分这些异质性特征,导致检索结果可能出现偏差。相似度度量方法的局限性:常用的欧氏距离或余弦距离等相似度度量方法可能无法充分捕捉病理图像特征分布的复杂性。可解释性不足:难以提供直观的相似度解释。
3、中国专利文献cn114168781a公开了一种病理图像检索方法,其中,方法包括:获取待查询的病理图像;生成待查询的病理图像的哈希编码;利用哈希编码在预设的数据库中进行检索,得到待查询的病理图像的查询结果,其中,数据库中包含由超图神经网络输出的高维特征表示转化得到的哈希编码和病理图像数据的对应关系。本申请实施例不但实现了兼顾局部与整体信息的全尺寸病理图像特征提取,并在无监督的条件下训练特征提取参数,实现更优的特征表示,以及哈希编码优化了检索匹配模式,极大地提升了检索性能。
4、中国专利文献cn118260442a公开了一种基于自监督学习的病理图像乘积量化检索方法,涉及
5、而目前关于基于最优传输的病理图像区域级相似度检索方法还未见报道。
技术实现思路
1、本专利技术旨在克服现有技术中的不足,提供一种基于最优传输理论的病理图像区域级相似度检索方法。该方法通过多尺度特征提取、非线性降维和高效的相似度度量,提高检索精度和可靠性,同时考虑病理图像的异质性和复杂性,为病理诊断和研究提供更准确的相似案例检索工具。
2、本专利技术提供了一种基于最优传输的病理图像区域级相似度检索方法,所述的病理图像区域级相似度检索方法包括以下步骤:
3、步骤1:数据预处理:wsi切片与图块提取,数据集划分;
4、步骤2:多尺度特征提取:使用预训练模型提取特征;
5、步骤3:特征处理:使用基于方差的特征选择,和umap、pca方法降维处理;
6、步骤4:相似度计算:使用欧氏距离和最优传输距离计算相似度;
7、步骤5:检索与评估:计算查询图像与侯选数据库中的图像的相似度,使用top-k检索结果排序评估准确率,并比较不同特征处理方式和相似度度量方法的检索性能。
8、作为一个优选例,所述的步骤4中包括:
9、基于欧氏距离euclidean的相似度度量:
10、对于两个图块ti和tj的class token分别为ci和cj,维度均为dim,欧氏距离计算公式为:
11、
12、其中,ci,k和cj,k分别表示class token在第k维度上的特征值。两个图块ti和tj的patch tokens分别取平均得到m_avgi和m_avgj维度均为dim同样适用欧氏距离计算相似度。
13、作为另一优选例,所述的步骤4包括:基于ot距离的相似度度量:
14、对于两个图块ti和tj的patch tokens特征矩阵分别为mi和mj,维度均为256x dim,ot距离通过以下成本矩阵计算计算和ot距离计算。
15、作为另一优选例,所述成本矩阵计算:成本矩阵c是基于mi和mj中点对之间的成本计算的。对于mi中的第k个点和mj中的第l个点,成本ckl可以定义为它们特征向量之间的欧氏距离:ckl=||mi,k-mj,l||2。
16、作为另一优选例,所述ot距离计算:利用成本矩阵和正则化参数,通过sinkhorn-knopp算法计算ot距离,目标是找到一个运输矩阵π,使得正则化运输成本最小化
17、
18、其中u(r,c)表示行和列和分别等于r和c的运输矩阵集合,选择为均匀分布。正则化参数∈设置为0.05。
19、作为另一优选例,所述的步骤3中通过比较特征方差的排序,选择前128个最具代表性的特征维度。计算每个特征的标准差:
20、
21、其中σi是第i个特征的标准差,xij是第j个样本的第i个特征值,是第i个特征的均值,n是样本数量。
22、作为另一优选例,根据向量σ降序排序得到排序后的索引集合,选择前128个索引,表示选择的方差最大的128个特征维度,分别得到class token和patch token中基于方差选择的特征维度。
23、作为另一优选例,所述的步骤3中:
24、所述的降维:使用umap算法对选择后的class token和patch token分别进行非线性降维,进行参数设置为n_neighbors=50,将特征降至16维,训练降维模型并保存。
25、作为另一优选例,所述的步骤3中,使用相同超参数设置,也训练pca模型降至16维并保存。
26、本专利技术优点在于:本专利技术提供了一种基于最优传输的病理图像区域级相似度检索方法,与现有技术相比,具有显著的优势和积极效果。具体如下:
27、区域级别的检索性能:相较于传统的欧氏距离度量方法,本专利技术采用的基于ot距离度量方法在病理区域级别的检索性能上有显著提升。
28、特征选择效果:通过基于方差的特征选择方法,进一步优化特征表示,检索性能在各项指标上均有提升。
29、降维效果:采用umap降维方法,对高维特征进行降维处理,保留了重要的特征信息,进一步提高了检索性能,且umap降维后的检索性能在各项指标上均优于未降维和pca降维的情况。
30、功能上的区别:
31、复杂结构处理:本专利技术充分考虑了病理图像内部结构的复杂性,通过微图块级别的特征提取和降维处理,能够更准确地捕捉到病理图像中的细粒度特征。
32、高效相似度度量:使用ot距离方法进行相似度度量,相较于传统的欧氏距离和余弦距离,更加适用于高维数据的大规模并行运算加速,提高了计算效率和精度。
33、综上本文档来自技高网...
【技术保护点】
1.一种基于最优传输的病理图像区域级相似度检索方法,其特征在于:所述的病理图像区域级相似度检索方法包括以下步骤:
2.根据权利要求1所述的病理图像区域级相似度检索方法,其特征在于:所述的步骤4中包括:
3.根据权利要求1所述的病理图像区域级相似度检索方法,其特征在于:所述的步骤4包括:
4.根据权利要求3所述的病理图像区域级相似度检索方法,其特征在于:所述成本矩阵计算:成本矩阵C是基于Mi和Mj中点对之间的成本计算的。对于Mi中的第k个点和Mj中的第l个点,成本Ckl可以定义为它们特征向量之间的欧氏距离:Ckl=||Mi,k-Mj,l||2。
5.根据权利要求4所述的病理图像区域级相似度检索方法,其特征在于:所述OT距离计算:利用成本矩阵和正则化参数,通过Sinkhorn-Knopp算法计算OT距离,目标是找到一个运输矩阵π,使得正则化运输成本最小化
6.根据权利要求1所述的病理图像区域级相似度检索方法,其特征在于:所述的步骤3中通过比较特征方差的排序,选择前128个最具代表性的特征维度。计算每个特征的标准差:
< ...【技术特征摘要】
1.一种基于最优传输的病理图像区域级相似度检索方法,其特征在于:所述的病理图像区域级相似度检索方法包括以下步骤:
2.根据权利要求1所述的病理图像区域级相似度检索方法,其特征在于:所述的步骤4中包括:
3.根据权利要求1所述的病理图像区域级相似度检索方法,其特征在于:所述的步骤4包括:
4.根据权利要求3所述的病理图像区域级相似度检索方法,其特征在于:所述成本矩阵计算:成本矩阵c是基于mi和mj中点对之间的成本计算的。对于mi中的第k个点和mj中的第l个点,成本ckl可以定义为它们特征向量之间的欧氏距离:ckl=||mi,k-mj,l||2。
5.根据权利要求4所述的病理图像区域级相似度检索方法,其特征在于:所述ot距离计算:利用成本矩阵和正则化参数,通过sinkhorn-knopp算法...
【专利技术属性】
技术研发人员:王晓东,高强,刘西洋,丁光宇,施杰毅,李津达,
申请(专利权)人:复旦大学附属金山医院上海市金山区眼病防治所,上海市金山区核化伤害应急救治中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。