System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及生物信息,具体而言,本申请涉及一种图神经网络构建方法、装置、电子设备及存储介质。
技术介绍
1、细胞标注是处理单细胞数据的关键步骤,准确的细胞类型标注是细胞通信、类型特异性表达模式、分化轨迹以及其他下游分析的基础。
2、目前的细胞标注都是基于单细胞转录组测序实现的,单细胞转录组测序(scrna-seq)以高分辨率量化基因表达谱,有利于深入了解细胞异质性和组织表型差异的分子基础,使得我们能够从单细胞分辨率上识别各种细胞类型,并分析细胞表达谱间差异。但是仍然存在细胞标注不准确、费时费力、受限于批次效应的技术问题。
3、由上可知,现有技术中存在细胞标注不准确、费时费力、受限于批次效应的技术问题。
技术实现思路
1、本申请提供了一种图神经网络构建方法、装置、电子设备及存储介质,可以解决相关技术中存在的细胞标注不准确、费时费力、受限于批次效应的问题。所述技术方案如下:
2、根据本申请的一个方面,一种图神经网络构建方法,所述方法包括:将单细胞数据集中的单细胞数据编码到低维潜空间,得到保留所述单细胞数据的关键特征和/或类型特异性信息的第一特征向量;获取已构建的基因调控网络,并将所述基因调控网络编码成低维基因节点;在保留所述基因调控网络的全局网络结构的情况下,对所述低维基因节点进行局部拓扑特征的提取,得到第二特征向量;所述第二特征向量用于反映所述单细胞数据集中所有基因之间的相互作用;基于所述第一特征向量和第二特征向量,构建图神经网络;所述图神经网络用于
3、根据本申请的一个方面,一种图神经网络构建装置,包括:单细胞数据编码模块,用于将单细胞数据集中的单细胞数据编码到低维潜空间,得到保留所述单细胞数据的关键特征和/或类型特异性信息的第一特征向量;基因调控网络编码模块,用于获取已构建的基因调控网络,并将所述基因调控网络编码成低维基因节点;局部拓扑特征提取模块,用于在保留所述基因调控网络的全局网络结构的情况下,对所述低维基因节点进行局部拓扑特征的提取,得到第二特征向量;所述第二特征向量用于反映所述单细胞数据集中所有基因之间的相互作用;图神经网络构建模块,用于基于所述第一特征向量和第二特征向量,构建图神经网络;所述图神经网络用于对单细胞数据进行自动标注。
4、在一示例性实施例中,所述图神经网络构建模块包括:基因节点初始特征获取单元,用于将所述第二特征向量作为所述图神经网络中基因节点的初始特征;细胞节点初始特征获取单元,用于将所述第一特征向量作为所述图神经网络中细胞节点的初始特征;边构建单元,用于在所述基因节点与细胞节点之间构建所述图神经网络的边;图神经网络获取单元,用于由基因节点、细胞节点之间的边,得到所述图神经网络。
5、在一示例性实施例中,所述图神经网络的边包括以下至少一种:连接在基因节点之间的基因调控边;基因节点或细胞节点指向自身的自反馈边;连接在基因节点与细胞节点之间的基因表达边。
6、在一示例性实施例中,所述局部拓扑特征提取模块包括:第二特征向量获取单元,用于确定所述基因调控网络的图邻接矩阵;基于所述图邻接矩阵,通过自编码器使连接的所述低维基因节点具有相似的嵌入,以捕获所述低维基因节点的局部拓扑特征,并通过使具有相似邻居结构的所述低维基因节点具有相似的嵌入,在保持全局网络结构的情况下得到所述第二特征向量;所述第二特征向量包括所述全局网络结构的信息以及各所述低维基因节点的局部拓扑特征。
7、在一示例性实施例中,所述基因调控网络编码模块包括:基因关系采集单元,用于采集有方向的基因关系;基因调控关系库调用单元,用于将采集到的所述基因关系存储至基因调控关系库,并通过所述基因调控关系库的调用得到所述基因调控网络。
8、在一示例性实施例中,所述图神经网络构建装置还包括:图神经网络训练模块,用于对所述图神经网络进行训练。
9、在一示例性实施例中,所述图神经网络训练模块包括:参考数据集获取单元,用于获取参考数据集;所述参考数据集包括携带标签的单细胞数据;所述标签指示所述单细胞数据所对应的细胞类型;预测结果获取单元,用于基于所述参考数据集中的单细胞数据训练所述图神经网络,得到预测结果;所述预测结果指示所述单细胞数据所对应的细胞类型;损失函数计算单元,用于根据所述预测结果和所述标签计算损失函数,并利用所述损失函数优化所述图神经网络的参数;重复单元,用于基于所述参考数据集中的其他单细胞数据重复上述步骤,直到所述损失函数满足特定条件,则所述图神经网络的训练完成。
10、在一示例性实施例中,所述图神经网络构建装置还包括:单细胞数据获取模块,用于获取新测序的单细胞数据;概率预测模块,用于将所述单细胞数据输入所述图神经网络,使得所述图神经网络的最后一层神经网络的细胞节点通过线性分类器,预测所述单细胞数据属于不同细胞类型的概率;标注结果获取模块,用于基于预测到的概率,得到所述单细胞数据的标注结果。
11、根据本申请的一个方面,一种电子设备,包括至少一个处理器以及至少一个存储器,其中,所述存储器上存储有计算机可读指令;所述计算机可读指令被一个或多个所述处理器执行,使得电子设备实现如上所述的图神经网络构建方法。
12、根据本申请的一个方面,一种存储介质,其上存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行,以实现如上所述的图神经网络构建方法。
13、根据本申请的一个方面,一种计算机程序产品,计算机程序产品包括计算机可读指令,计算机可读指令存储在存储介质中,电子设备的一个或多个处理器从存储介质读取计算机可读指令,加载并执行该计算机可读指令,使得电子设备实现如上所述的图神经网络构建方法。
14、本申请提供的技术方案带来的有益效果是:
15、在上述技术方案中,根据单细胞数据集中的单细胞数据和基因调控网络获取第一特征向量和第二特征向量,基于第一特征向量和第二特征向量构建图神经网络,所得到的图神经网络可以用于对新测序的单细胞数据进行自动标注。在构建图神经网络时,将大规模基因调控关系(基因调控网络)与单细胞rna测序数据(单细胞数据)集成在一起,不仅能反映基因与细胞之间信息流,还能反映基因调控关系引起的基因与基因之间的影响,即引入基因调控关系,考虑了基因之间的影响,使得构建的图神经网络可以更加准确地进行细胞标注,无论是在同一数据集内部进行细胞标注,还是在不同数据集、组织、测序平台甚至物种之间本专利技术都可以达到更高的单细胞数据标注准确度,即克服了批次效应;此外,本专利技术自带构建好的基因调控网络,节省了手工从各种各样的数据库中收集相关信息的时间,也更利于使用者的操作,省时省力。本专利技术有效地解决了相关技术中存在的细胞标注不准确、费时费力、受限于批次效应的问题。
本文档来自技高网...【技术保护点】
1.一种图神经网络构建方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述基于所述第一特征向量和第二特征向量,构建图神经网络,包括:
3.如权利要求2所述的方法,其特征在于,所述图神经网络的边包括以下至少一种:
4.如权利要求1所述的方法,其特征在于,所述在保留所述基因调控网络的全局网络结构的情况下,对所述低维基因节点进行局部拓扑特征的提取,得到第二特征向量,包括:
5.如权利要求1所述的方法,其特征在于,所述获取已构建的基因调控网络,包括:
6.如权利要求1所述的方法,其特征在于,所述基于所述第一特征向量和第二特征向量,构建图神经网络之后,所述方法还包括:
7.如权利要求1至6任一项所述的方法,其特征在于,所述基于所述第一特征向量和第二特征向量,构建图神经网络之后,所述方法还包括:
8.一种图神经网络构建装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:至少一个处理器以及至少一个存储器,其中,
10.一种存储介质,其上存储有计算机可读
...【技术特征摘要】
1.一种图神经网络构建方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述基于所述第一特征向量和第二特征向量,构建图神经网络,包括:
3.如权利要求2所述的方法,其特征在于,所述图神经网络的边包括以下至少一种:
4.如权利要求1所述的方法,其特征在于,所述在保留所述基因调控网络的全局网络结构的情况下,对所述低维基因节点进行局部拓扑特征的提取,得到第二特征向量,包括:
5.如权利要求1所述的方法,其特征在于,所述获取已构建的基因调控网络,包括:
6.如权利要求1所述的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。