获取分子特征描述的方法、装置及存储介质制造方法及图纸

技术编号:33029751 阅读:25 留言:0更新日期:2022-04-15 09:05
本申请是关于一种获取分子特征描述的方法、装置及存储介质。该方法包括:获取目标分子的结构特征值;基于最小Slater基组和目标分子的结构特征值,求取重叠矩阵;基于重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数;根据波函数系数,求解目标分子作为量子系统时的密度矩阵;对最小Slater基组正则化,得到变换矩阵;根据密度矩阵和变换矩阵,获取目标分子的特征描述。本申请的技术方案能够快速获取分子特征描述,以用于对深度神经网络的训练。于对深度神经网络的训练。于对深度神经网络的训练。

【技术实现步骤摘要】
获取分子特征描述的方法、装置及存储介质


[0001]本申请涉及计算机辅助制药领域,尤其涉及一种获取分子特征描述的方法、装置及存储介质。

技术介绍

[0002]分子特征描述,通常指的是分子在某一方面性质的度量,包含分子的物理化学性质以及根据分子结构通过各种算法推导出来的数值指标,比如:分子质量、环个数、氢键供受体个数、分子形状表述等。分子特征描述需要预先设计,只有选择了与目标性质具有相关性的描述,才可能获得合理的模型。从数据属性上,分子特征描述通常难以直接用于深度神经网络的搭建。目前,尽管已经存在一些具有物理意义明确的分子特征描述,例如库伦矩阵(CM)、键包(BoB)、原子位置平滑重叠(SOAP)、原子中心对称函数(ACSF)和变形的径像函数等。然而,由于不仅可能存在经验性的超参数,而且由此建立的机器学习模型依然需要较大的参数空间以及与之对应的大量训练集数据,因此并不适合用于深度神经网络。

技术实现思路

[0003]为解决或部分解决相关技术中存在的问题,本申请提供一种获取分子特征描述的方法、装置及存储介质,该技术方案能够快速获取分子特征描述,以用于对深度神经网络的训练。
[0004]本申请第一方面提供一种获取分子特征描述的方法,包括:
[0005]获取目标分子的结构特征值;
[0006]基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;
[0007]基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;
[0008]根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;
[0009]对所述最小Slater基组正则化,得到变换矩阵;
[0010]根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述。
[0011]本申请第二方面提供一种获取分子特征描述的装置,包括:
[0012]第一获取模块,用于获取目标分子的结构特征值;
[0013]第一计算模块,用于基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;
[0014]第二计算模块,用于基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;
[0015]第三计算模块,用于根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;
[0016]正则化模块,用于对所述最小Slater基组正则化,得到变换矩阵;
[0017]第二获取模块,用于根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描
述。
[0018]本申请第三方面提供一种电子设备,包括:
[0019]处理器;以及
[0020]存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
[0021]本申请第四方面提供一种存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
[0022]从上述本申请提供的技术方案可知,在获取目标分子的结构特征值后,基于最小Slater基组求取重叠矩阵,并且基于求取的重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数。由于是基于最小Slater基组,而且采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数,其过程是非自洽的即仅需单轮的矩阵本征值求解进行计算,因此能够大幅降低计算消耗,快速目标分子的特征描述,从而在用于对深度神经网络进行训练时降低训练成本并提升训练效率。
[0023]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0024]通过结合附图对本申请示例性实施方式进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
[0025]图1是本申请实施例示出的获取分子特征描述的方法的流程示意图;
[0026]图2是本申请实施例示出的键长键角R
HOH
=100.04
°
的水分子结构示意图;
[0027]图3是本申请实施例示出的键长键角R
HOH
=103.49
°
的水分子结构示意图;
[0028]图4是本申请实施例示出的获取分子特征描述的装置的结构示意图;
[0029]图5是本申请实施例示出的电子设备的结构示意图。
具体实施方式
[0030]下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
[0031]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0032]应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,
在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0033]在进行计算机辅助药物设计的过程中,分子特征描述通常指的是分子在某一方面性质的度量,包含分子的物理化学性质以及根据分子结构通过各种算法推导出来的数值指标,例如分子质量、环个数、氢键供受体个数以及分子形状表述等。分子特征描述需要预先设计,只有选择了与目标性质具有相关性的描述,才可能获得合理的模型。从数据属性上,分子特征描述通常难以直接用于深度神经网络的搭建。相关技术中,尽管已经存在一些具有物理意义明确的分子特征描述,例如库伦矩阵(CM)、键包(BoB)、原子位置平滑重叠(SOAP)、原子中心对称函数(ACSF)和变形的径像函数等。然而,由于不仅可能存在经验性的超参数,而且由此建立的机器学习模型依然需要较大的参数空间以及与之对应的大量训练集数据,因此并不适合用于深度神经网络。
[0034]针对上述问题,本申请实施例提供一种获取分子特征描述的方法,能够速获取分子特征描述,在用于对深度神经网络进行训练时降低训练成本并提升训练效率。
[0035]以下结合附图详细描述本申请实施例的技术方案。
[0036]参见图1,是本申请实施例示出的获取分子特征描述的方法的流程示意图,该方法主要包括步骤S101至步骤S本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取分子特征描述的方法,其特征在于,所述方法包括:获取目标分子的结构特征值;基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;对所述最小Slater基组正则化,得到变换矩阵;根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述。2.根据权利要求1所述的获取分子特征描述的方法,其特征在于,所述目标分子的结构特征值包括位于第i个基函数χ
slater,i
和第j个基函数χ
slater,j
上属于所述目标分子的目标原子的电子之间的空间相对位置r
ij
,所述第i个基函数χ
slster,i
和第j个基函数χ
slster,j
为所述最小Slater基组的基函数。3.根据权利要求2所述的获取分子特征描述的方法,其特征在于,所述基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵,包括:以所述空间相对位置r
ij
为积分变量,对第i个基函数χ
slater,i
和第j个基函数χ
slater,j
的乘积进行积分,得到所述重叠矩阵的元素S
ij
。4.根据权利要求1所述的获取分子特征描述的方法,其特征在于,所述基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数,包括:按照公式计算所述半经验量子力学方法中单电子哈密顿矩阵H的元素H
ij
,所述K为经验参数,所述A为原子编号,所述S
ij
为所述重叠矩阵S的元素;按照公式HC=SCe求解所述目标分子作为量子系统时的波函数系数C,所述e为单电子哈密顿矩阵H的本征矩阵经对角化得到的本征矢对应能量矩阵。5.根据权利要求1所述的获取分子特征描述的方法,其特征在于,所述根据所述波函数系数,求解所述目标分子作为量子系...

【专利技术属性】
技术研发人员:曾群付文博袁久闯
申请(专利权)人:深圳晶泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1