System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于共识聚类的空间多组学技术空间域识别方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于共识聚类的空间多组学技术空间域识别方法及系统技术方案

技术编号:43074627 阅读:13 留言:0更新日期:2024-10-22 14:49
本发明专利技术提出了一种基于共识聚类的空间多组学技术空间域识别方法及系统,属于生物信息学技术领域,获取个细胞的空间组学数据,采用种空间域识别方法对空间组学数据进行识别,得到初步聚类结果;对于采用的种空间域识别方法,计算任意两个方法的预测结果之间的修正兰德系数;基于计算的修正兰德系数获得个相似性矩阵,对于每一个空间域识别方法获得的识别结果,将其转化为一个的相似性矩阵能够有效结合共识聚类和空间组学特性,不仅可以提高空间域的识别精度,也能优化计算效率,对于推动空间组学以及相关生物医学研究具有重要的科学意义和应用价值。

【技术实现步骤摘要】

本专利技术属于生物信息学,尤其涉及一种基于共识聚类的空间多组学技术空间域识别方法及系统


技术介绍

1、共识聚类技术,作为一种强大的数据分析工具,通过整合多个聚类结果来提高聚类决策的稳定性和准确性。然而,直接将传统共识聚类技术应用于空间多组学数据,仍面临着如何有效融合空间信息和多维组学数据特性的问题。此外,现有方法在处理大规模空间多组学数据时,需要利用大量的计算设备进行处理,且处理时间较长,这在实际应用中是不可接受的。


技术实现思路

1、为克服上述现有技术的不足,本专利技术提供了一种基于共识聚类的空间多组学技术空间域识别方法,能够有效结合共识聚类和空间组学特性,不仅可以提高空间域的识别精度,也能优化计算效率,对于推动空间组学以及相关生物医学研究具有重要的科学意义和应用价值。

2、为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:

3、第一方面,公开了一种基于共识聚类的空间多组学技术空间域识别方法,包括:

4、获取多个细胞的空间组学数据,采用种空间域识别方法对空间组学数据的同一样本进行识别,得到初步聚类结果;

5、对于同一样本采用的种空间域识别方法,计算任意两个方法的预测结果之间的修正兰德系数;

6、生成一个的相似性矩阵,其中表示方法和方法的修正兰德系值,基于相似性矩阵生成一个期望相似性矩阵;

7、基于计算的修正兰德系数获得个相似性矩阵,对于每一个空间域识别方法获得的识别结果,将其转化为一个的相似性矩阵;

8、对于个细胞,根据位置信息计算两细胞之间的距离,即欧氏距离,基于欧氏距离计算相似性,进而获得空间相似性矩阵;

9、对于相似性矩阵b、空间相似性矩阵及期望相似性矩阵,利用均方误差来计算每种方法和空间位置相似性损失函数,对损失函数进行加权求和,迭代优化相似性矩阵,使得损失函数达到最小;

10、使用谱聚类算法对得到的相似性矩阵进行数据分析,并以作为预训练的相似性矩阵,识别空间域。

11、作为进一步的技术方案,计算任意两个方法的预测结果之间的修正兰德系数的过程为:

12、给定两个聚类结果和,分别表示由两个不同方法得到的聚类结果;

13、构建一个混淆矩阵,其中表示在聚类结果中属于第类并且在聚类结果中属于第类的样本对数;

14、计算每行、每列及总和的组合数;

15、根据组合数计算修正兰德系数。

16、作为进一步的技术方案,还包括:对于相似性矩阵,其中表示方法和方法的ari值;通过对相似性矩阵各列求均值,得到每个方法的平均ari值,并剔除ari值低于阈值的方法,得到ari值高于阈值α的对应的方法。

17、作为进一步的技术方案,对于相似性矩阵行列均表示个细胞,若两个细胞为同一类别则为,表示方法和方法的ari值;不同类别则为。

18、作为进一步的技术方案,期望相似性矩阵,为对角矩阵,用于初始化相似性矩阵。

19、作为进一步的技术方案,为第种方法的相似性矩阵,、分别表示第行第列,然后获得每种方法的相似性损失函数,空间位置的相似性损失函数。

20、上述每种方法的相似性损失函数:

21、

22、

23、其中,为方法生成的相似性矩阵与期望相似性矩阵之间的均方误差,为所有方法的相似性损失函数的平均值,表示多个识别方法生成的相似性矩阵与期望相似性矩阵之间的平均均方误差,为第种方法的相似性矩阵,、分别表示第行第列,表示细胞数量,期望相似性矩阵在第行第列的值。

24、空间位置的相似性损失函数:

25、。

26、其中,表示空间相似性矩阵在第行第列的值,为空间相似性矩阵与期望相似性矩阵之间的均方误差,是空间位置的相似性损失函数。

27、作为进一步的技术方案,还包括计算核范数:

28、生成随机矩阵以映射转移矩阵;

29、

30、表示细胞数量,表示识别结果数量,是一个的随机矩阵,是转移矩阵;

31、对映射后的矩阵进行分解,得到正交矩阵和上三角矩阵;

32、在进行svd分解和其他矩阵分解时,正交矩阵的引入可以简化计算过程;

33、

34、是映射后的矩阵,是的正交矩阵,是的上三角矩阵,然后对进行svd分解;

35、

36、是的左奇异矩阵,是对角线上的元素是的奇异值,是的右奇异矩阵,是的奇异值矩阵计算核范数的近似值。

37、

38、是的奇异值数量,是的第个奇异值。

39、第二方面,公开了一种基于共识聚类的空间多组学技术空间域识别系统,包括:

40、初步聚类模块,被配置为:获取多个细胞的空间组学数据,采用种空间域识别方法对空间组学数据的同一样本进行识别,得到初步聚类结果;

41、期望相似性矩阵生成模块,被配置为:对于同一样本采用的种空间域识别方法,计算任意两个方法的预测结果之间的修正兰德系数;

42、生成一个的相似性矩阵,其中表示方法和方法的修正兰德系值,基于相似性矩阵生成一个期望相似性矩阵;

43、相似性矩阵生成模块,被配置为:基于计算的修正兰德系数获得个相似性矩阵,对于每一个空间域识别方法获得的识别结果,将其转化为一个的相似性矩阵;

44、空间相似性矩阵生成模块,被配置为:对于个细胞,根据位置信息计算两细胞之间的距离,即欧氏距离,基于欧氏距离使用高斯核函计算相似性,进而获得空间相似性矩阵;

45、优化模块,被配置为:对于相似性矩阵b、空间相似性矩阵及期望相似性矩阵,利用均方误差来计算每种方法和空间位置相似性损失函数,对损失函数进行加权求和,迭代优化相似性矩阵,使得损失函数达到最小;

46、空间域识别模块,被配置为:使用谱聚类算法对得到的相似性矩阵进行数据分析,并以作为预训练的相似性矩阵,识别空间域。

47、以上一个或多个技术方案存在以下有益效果:

48、本专利技术技术方案公开了空间多组学技术空间域识别方法,能够有效结合共识聚类和空间组学特性,不仅可以提高空间域的识别精度,也能优化计算效率,对于推动空间组学以及相关生物医学研究具有重要的科学意义和应用价值。

49、本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。

本文档来自技高网...

【技术保护点】

1.一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,包括:

2.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,计算任意两个方法的预测结果之间的修正兰德系数的过程为:

3.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,还包括:对于相似性矩阵,其中表示方法和方法的ARI值;通过对相似性矩阵各列求均值,得到每个方法的平均ARI值,并剔除ARI值低于阈值的方法,得到ARI值高于阈值α的对应的方法。

4.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,对于相似性矩阵行列均表示个细胞,若两个细胞为同一类别则为,表示方法和方法的ARI值;不同类别则为。

5.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,期望相似性矩阵,为对角矩阵,用于初始化相似性矩阵。

6.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,为第种方法的相似性矩阵,、分别表示第行第列,然后获得每种方法的相似性损失函数,空间位置的相似性损失函数。

7.一种基于共识聚类的空间多组学技术空间域识别系统,其特征是,包括:

8.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

9.一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-6任一所述的方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时执行上述权利要求1-6任一所述方法的步骤。

...

【技术特征摘要】

1.一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,包括:

2.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,计算任意两个方法的预测结果之间的修正兰德系数的过程为:

3.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,还包括:对于相似性矩阵,其中表示方法和方法的ari值;通过对相似性矩阵各列求均值,得到每个方法的平均ari值,并剔除ari值低于阈值的方法,得到ari值高于阈值α的对应的方法。

4.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,对于相似性矩阵行列均表示个细胞,若两个细胞为同一类别则为,表示方法和方法的ari值;不同类别则为。

5.如权利要求1所述的一种基于共识聚类的空间多组学技术空间域识别方法,其特征是,期望相...

【专利技术属性】
技术研发人员:张威高瑞张道良于娜隋新仪江正帅李浩杨
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1