一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法技术

技术编号:36575225 阅读:16 留言:0更新日期:2023-02-04 17:33
本发明专利技术公开了一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,其中所述方法包括:获取表征待预测的多肽序列氨基酸的属性的多维数据;将所述多维数据逐元素的取反正切,获得所述多维数据的量子门的旋转角;基于所述量子门的旋转角,将所述多肽序列氨基酸的属性的多维数据加载到所述第一量子门控循环神经网络模型;输出针对所述多肽序列氨基酸的预测结果。通过本发明专利技术提出的一种高效的量子计算机神经网络模型,可以高效的分类抗菌肽与非抗菌肽,并预测未知的多肽是否为抗菌肽。该模型可以大大加速抗菌肽药物的研发。该模型可以大大加速抗菌肽药物的研发。该模型可以大大加速抗菌肽药物的研发。

【技术实现步骤摘要】
一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法


[0001]本专利技术属于量子计算机
,尤其涉及一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法。

技术介绍

[0002]抗菌肽是一种具有抗菌活性的多肽,一般由不到50个氨基酸组成,广泛存在于所有的生命形式中。由于其具有高效的抗菌活性,近年来备受医学界的关于,其有望成为化学抗生素的替代品。由于多肽序列复杂多变,人们无法从序列结构简单地预测其是否是抗菌肽。计算机技术不断发展,人们逐渐尝试使用计算机去预测未知的抗菌肽。传统的预测方法一般使用人工智能模型,将多肽数据编码到计算机上,通过循环神经网络,预测其性质。这些人工智能模型使用经典计算机。而经典计算机处理信息的能力有限。多肽数据库数据庞大,经典计算机使用经典比特储存数据,效率不高,其处理氨基酸序列的能力也有限,很难找到序列中存在内禀关系。

技术实现思路

[0003]量子计算机储存信息的能力强大,并且量子计算机的计算单元量子比特本身具有纠缠性质,可以高效地处理这类信息。
[0004]针对上述现有技术中存在的缺陷,本专利技术提供一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,包括以下步骤:步骤S101、获取表征待预测的多肽序列氨基酸的属性的多维数据;步骤S103、将所述多维数据逐元素的取反正切,获得所述多维数据的量子门的旋转角;步骤S105、基于所述量子门的旋转角,将所述多肽序列氨基酸的属性的多维数据加载到所述第一量子门控循环神经网络模型;步骤S107、输出针对所述多肽序列氨基酸的预测结果。
[0005]其中,所述第一量子门控循环神经网络模型采用较少参数的多个门控循环单元。
[0006]其中,所述较少参数的门控循环单元包括复位门和更新门。
[0007]其中,步骤S103中所述多维数据的量子门的旋转角表示如下:, 表示氨基酸的某一固有属性。
[0008]其中,所述复位门,其用于控制上一个时间戳的状态对新输入的贡献,其量子实现如下:,其中s表示Sigmoid激活函数,为参数化的量子线路,表示当前时间戳输入的隐藏状态向量和输入的结合。
[0009]其中,所述新输入的量子实现如下:,其中,为参数化量子线路,t为激活函数tanh。
[0010]其中,所述更新门,其用于控制上一个时间戳的隐藏状态向量以及新输入对下一个时间戳的隐藏状态向量的影响程度,其量子实现为:,其中s表示Sigmoid激活函数,为参数化的量子线路,表示当前时间戳输入的隐藏状态向量和输入的结合。
[0011]其中,当前时间戳输出的隐藏状态向量其中,当前时间戳输出的隐藏状态向量,其中为当前时间戳输入的隐藏状态向量,为新输入。
[0012]其中,所述步骤S107包括:由当前时间戳输出的隐藏状态向量经过参数化的量子线路之后可以得到当前时间戳的输出实现如下:。
[0013]其中,每次将数据输入到当前门控循环单元之前,需要判断演化到当前时间戳的门控循环单元的长度是否达到了进行处理的多肽序列长度,如果达到了多肽序列长度则停止,将最后一个时间戳的输出作为最终多肽序列是否为抗菌肽的预测结果。
[0014]与现有技术相比,本专利技术基于角度编码方式将输入和隐藏状态向量输入到设计的单个参数化量子线路(PQC)中,使得我们新设计的量子门控循环神经网络的门控循环单元用于输出隐藏状态向量的参数化量子线路相比于之前提出的门控循环单元所需要的参数量减少了一半,且可结合不同的角度编码方式,在不增加量子比特数目的情况下可以根据需要改变隐藏向量的维度,以满足不同序列记忆的要求,此外我们在将隐藏状态向量输出之前采用了参数化量子线路QC进行处理,使最终的输出更加灵活多变,且可以满足不同的输出要求。
[0015]其次本门控循环单元可根据真实量子计算机可提供的保真度较好的量子比特数,结合不同的角度编码方式减少或增加门控循环单元中参数化量子线路的比特数,使得本算法能更灵活的适应目前的含噪声中尺度(NISQ)量子计算机。从模型本身的角度来说通过利用量子计算的非定域特性,使得我们的模型相比于经典的循环神经网络,攫取特征的能力以及收敛速度更强、更快。且就我们所知目前关于量子循环神经网络在多肽抗菌肽分类领域尚为空白。
[0016]通过本专利技术提出的一种高效的量子计算机神经网络模型,可以高效的分类抗菌肽与非抗菌肽,并预测未知的多肽是否为抗菌肽。该模型可以大大加速抗菌肽药物的研发。
附图说明
[0017]通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若
干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:图1是示出根据本专利技术实施例的一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法流程图;图2是示出根据本专利技术实施例的角度编码方式通过和旋转量子门作用在量子比特上将特征向量加载到量子态的振幅的示意图;图3是示出根据本专利技术实施例的较少参数的量子门控循环神经网络原理框架图;图4是示出根据本专利技术实施例的门控循环单元的原理框架示意图;图5是示出根据本专利技术实施例的参数化量子线路的原理示意图。
具体实施方式
[0018]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0019]在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
[0020]应当理解,尽管在本专利技术实施例中可能采用术语第一、第二、第三等来描述
……
,但这些
……
不应限于这些术语。这些术语仅用来将
……
区分开。例如,在不脱离本专利技术实施例范围的情况下,第一
……
也可以被称为第二
……
,类似地,第二
……
也可以被称为第一
……

[0021]应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0022]取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,其特征是,包括以下步骤:步骤S101、获取表征待预测的多肽序列氨基酸的属性的多维数据;步骤S103、将所述多维数据逐元素的取反正切,获得所述多维数据的量子门的旋转角;步骤S105、基于所述量子门的旋转角,将所述多肽序列氨基酸的属性的多维数据加载到所述第一量子门控循环神经网络模型;步骤S107、输出针对所述多肽序列氨基酸的预测结果。2.如权利要求1所述基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,其特征是,其中所述第一量子门控循环神经网络模型采用较少参数的多个门控循环单元。3.如权利要求2所述基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,其特征是,其中所述较少参数的门控循环单元包括复位门和更新门。4.如权利要求1或3所述基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,其特征是,其中步骤S103中所述多维数据的量子门的旋转角表示如下:,表示氨基酸的某一固有属性。5.如权利要求4所述基于较少参数的量子门控循环神经网络的抗菌肽的预测方法,其特征是,其中所述复位门,其用于控制上一个时间戳的状态对新输入的贡献,其量子实现如下:,其中s表示Sigmoid激活函数,为参数化的量子线路,表示当前时间戳输入的隐藏状态向量和输入的结合。6.如权利要求5所述基于较少参数的量子...

【专利技术属性】
技术研发人员:胡咏梅刘海建耿咏忠李宁杨昱升赵立祥崔国龙
申请(专利权)人:国药控股上海生物医药有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1