System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多维数据特征提取方法、装置、设备和存储介质制造方法及图纸_技高网
当前位置: 首页 > 专利查询>鹏城实验室专利>正文

多维数据特征提取方法、装置、设备和存储介质制造方法及图纸

技术编号:44746178 阅读:6 留言:0更新日期:2025-03-26 12:35
本申请实施例提供多维数据特征提取方法、装置、设备和存储介质,涉及数据处理技术领域。该方法获取离散的蛋白质残基数据和连续的蛋白质结构数据,然后确定离散网络参数和连续网络参数,将蛋白质残基数据和蛋白质结构数据作为初始输入数据输入连续离散卷积神经网络模型,利用连续离散卷积层根据离散网络参数和连续网络参数更新卷积核参数,基于更新后的卷积核参数对初始输入数据进行特征提取,得到多维表征输出数据。利用连续离散卷积层根据离散网络参数和连续网络参数将连续卷积和离散卷积的特征提取过程进行融合,利用更新后的卷积核参数对多维输入数据进行特征提取,提升多维数据的特征提取结果准确性。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及多维数据特征提取方法、装置、设备和存储介质


技术介绍

1、卷积神经网络通过多层的卷积和池化操作,能够有效提取数据的局部特征,并逐步构建出高层次的特征表示。然而,实际应用中许多数据集并非仅包含单一维度的信息,而是由多种维度的信息综合构成。这些维度可能包括离散特征和连续特征,因此在基于卷积神经网络的数据表征过程中需要考虑多维数据的特征提取。

2、在相关技术中,离散数据通常具有明确的类别边界,而连续数据则可能表现出更复杂的分布特性。卷积神经网络在处理这类多维混合数据时,往往难以充分挖掘离散数据和连续数据的综合特征。


技术实现思路

1、本申请实施例的主要目的在于提出多维数据特征提取方法、装置、设备和存储介质,提高卷积神经网络对于多维数据的特征提取准确性。

2、为实现上述目的,本申请实施例的第一方面提出了一种多维数据特征提取方法,应用于连续离散卷积神经网络模型,所述连续离散卷积神经网络模型中至少包括连续离散卷积层,所述方法包括:

3、获取离散的蛋白质残基数据和连续的蛋白质结构数据;

4、根据所述蛋白质残基数据从至少一个离散卷积网络中确定离散网络参数,以及根据所述蛋白质结构数据确定连续网络参数;

5、将所述蛋白质残基数据和所述蛋白质结构数据作为初始输入数据输入所述连续离散卷积神经网络模型,利用所述连续离散卷积层根据所述离散网络参数和所述连续网络参数更新卷积核参数,基于更新后的卷积核参数对所述初始输入数据进行特征提取,得到多维表征输出数据。

6、在一实施例中,所述根据所述蛋白质残基数据从至少一个离散卷积网络中确定离散网络参数,以及根据所述蛋白质结构数据确定连续网络参数,包括:

7、根据所述蛋白质残基数据从至少一个离散卷积网络中选取一维卷积网络,获取所述一维卷积网络的卷积核尺寸参数作为所述离散网络参数;

8、根据所述蛋白质结构数据选取连续卷积网络的卷积核空间半径参数作为所述连续网络参数。

9、在一实施例中,所述获取离散的蛋白质残基数据和连续的蛋白质结构数据,包括:

10、获取至少一个蛋白质对应的初始蛋白质数据,每个所述初始蛋白质数据包括蛋白质标识;

11、从所述初始蛋白质数据中获取残基初始信息和/或结构初始信息;

12、利用所述蛋白质标识将属于同一个所述初始蛋白质数据的所述残基初始信息和所述结构初始信息进行配对,得到至少一个数据对;

13、在每个所述数据对中,对所述残基初始信息进行编码得到所述蛋白质残基数据,以及对所述结构初始信息进行编码得到所述蛋白质结构数据。

14、在一实施例中,所述对所述残基初始信息进行编码得到所述蛋白质残基数据,包括:

15、获取所述残基初始信息中每个蛋白质主链原子的残基类型;

16、将所述残基类型进行整数编码,得到每个所述蛋白质主链原子对应的残基类型编码;

17、基于所述残基类型编码得到所述蛋白质残基数据,所述蛋白质残基数据为离散的一维数据。

18、在一实施例中,所述对所述结构初始信息进行编码得到所述蛋白质结构数据,包括:

19、从所述结构初始信息中获取每个蛋白质主链原子的三维坐标;

20、根据所述三维坐标得到所述蛋白质结构数据,所述蛋白质结构数据为连续的三维数据。

21、在一实施例中,所述利用所述连续离散卷积层根据所述离散网络参数和所述连续网络参数更新卷积核参数,包括:

22、根据所述卷积核空间半径参数确定至少一个三维偏移量,以及根据所述卷积核尺寸参数确定至少一个一维偏移量;

23、计算所述三维偏移量和所述卷积核空间半径参数的和得到第一中间值,计算所述第一中间值的倒数作为偏移参数;

24、获取所述一维偏移量对应的所述连续离散卷积层的模型参数;

25、根据所述偏移参数和所述模型参数的乘积得到更新的卷积核;

26、逐一改变所述一维偏移量和/或所述三维偏移量的值,得到多个偏移量组合,计算每个所述偏移量组合对应的所述卷积核参数。

27、在一实施例中,所述基于更新后的卷积核对所述初始输入数据进行特征提取,得到多维表征输出数据,包括:

28、从所述初始输入数据中逐一确定所述蛋白质主链原子的所述三维坐标作为当前坐标;

29、逐一获取所述三维偏移量作为当前三维偏移量,根据所述当前坐标和所述当前三维偏移量得到邻近坐标,获取所述邻近坐标对应的所述残基类型作为当前残基类型;

30、获取所述当前三维偏移量对应的至少一个所述卷积核参数,将对应的所述当前残基类型和所述卷积核参数相乘得到第二中间值,累加所有所述三维偏移量对应的所述第二中间值得到所述当前坐标对应的表征数据;

31、根据所有的所述表征数据得到所述多维表征输出数据。

32、为实现上述目的,本申请实施例的第二方面提出了一种多维数据特征提取装置,应用于连续离散卷积神经网络模型,所述连续离散卷积神经网络模型中至少包括连续离散卷积层,所述装置包括:

33、数据获取模块:用于获取离散的蛋白质残基数据和连续的蛋白质结构数据;

34、模型参数获取模块:用于根据所述蛋白质残基数据从至少一个离散卷积网络中确定离散网络参数,以及根据所述蛋白质结构数据确定连续网络参数;

35、连续离散卷积模块:用于将所述蛋白质残基数据和所述蛋白质结构数据作为初始输入数据输入所述连续离散卷积神经网络模型,利用所述连续离散卷积层根据所述离散网络参数和所述连续网络参数更新卷积核参数,基于更新后的卷积核参数对所述初始输入数据进行特征提取,得到多维表征输出数据。

36、为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。

37、为实现上述目的,本申请实施例的第四方面提出了一种存储介质,所述存储介质为存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。

38、本申请实施例提出的多维数据特征提取方法、装置、设备和存储介质,通过获取离散的蛋白质残基数据和连续的蛋白质结构数据,根据蛋白质残基数据从至少一个离散卷积网络中确定离散网络参数,以及根据蛋白质结构数据确定连续网络参数,将蛋白质残基数据和蛋白质结构数据作为初始输入数据输入连续离散卷积神经网络模型,利用连续离散卷积层根据离散网络参数和连续网络参数更新卷积核参数,基于更新后的卷积核参数对初始输入数据进行特征提取,得到多维表征输出数据。本申请实施例中得到离散网络参数和连续网络参数之后,利用连续离散卷积层根据这两种网络参数将连续卷积和离散卷积的特征提取过程进行融合。通过对卷积核参数的更新,利用更新后的卷积核参数对多维输入数据进行特征本文档来自技高网...

【技术保护点】

1.一种多维数据特征提取方法,其特征在于,应用于连续离散卷积神经网络模型,所述连续离散卷积神经网络模型中至少包括连续离散卷积层,所述方法包括:

2.根据权利要求1所述的多维数据特征提取方法,其特征在于,所述根据所述蛋白质残基数据从至少一个离散卷积网络中确定离散网络参数,以及根据所述蛋白质结构数据确定连续网络参数,包括:

3.根据权利要求2所述的多维数据特征提取方法,其特征在于,所述获取离散的蛋白质残基数据和连续的蛋白质结构数据,包括:

4.根据权利要求3所述的多维数据特征提取方法,其特征在于,所述对所述残基初始信息进行编码得到所述蛋白质残基数据,包括:

5.根据权利要求4所述的多维数据特征提取方法,其特征在于,所述对所述结构初始信息进行编码得到所述蛋白质结构数据,包括:

6.根据权利要求5所述的多维数据特征提取方法,其特征在于,所述利用所述连续离散卷积层根据所述离散网络参数和所述连续网络参数更新卷积核参数,包括:

7.根据权利要求6所述的多维数据特征提取方法,其特征在于,所述基于更新后的卷积核对所述初始输入数据进行特征提取,得到多维表征输出数据,包括:

8.一种多维数据特征提取装置,其特征在于,应用于连续离散卷积神经网络模型,所述连续离散卷积神经网络模型中至少包括连续离散卷积层,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的多维数据特征提取方法。

10.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的多维数据特征提取方法。

...

【技术特征摘要】

1.一种多维数据特征提取方法,其特征在于,应用于连续离散卷积神经网络模型,所述连续离散卷积神经网络模型中至少包括连续离散卷积层,所述方法包括:

2.根据权利要求1所述的多维数据特征提取方法,其特征在于,所述根据所述蛋白质残基数据从至少一个离散卷积网络中确定离散网络参数,以及根据所述蛋白质结构数据确定连续网络参数,包括:

3.根据权利要求2所述的多维数据特征提取方法,其特征在于,所述获取离散的蛋白质残基数据和连续的蛋白质结构数据,包括:

4.根据权利要求3所述的多维数据特征提取方法,其特征在于,所述对所述残基初始信息进行编码得到所述蛋白质残基数据,包括:

5.根据权利要求4所述的多维数据特征提取方法,其特征在于,所述对所述结构初始信息进行编码得到所述蛋白质结构数据,包括:

6.根据权利要求5所述的多维数...

【专利技术属性】
技术研发人员:任智祥汪铭庆田永鸿
申请(专利权)人:鹏城实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1