当前位置: 首页 > 专利查询>深圳大学专利>正文

噬菌体构造模型训练方法、噬菌体构造方法及终端设备技术

技术编号:38483392 阅读:8 留言:0更新日期:2023-08-15 17:00
本申请公开了一种噬菌体构造模型训练方法、噬菌体构造方法及终端设备,所述训练方法通过噬菌体样本训练噬菌体构造模型,以使得噬菌体构造模型学习噬菌体的序列状态与噬菌体的下一个元件信息之间的映射关系,从而使得在实际应用时,对于尾部蛋白缺失的噬菌体,能通过训练后的噬菌体构造模型,对噬菌体尾部蛋白的元件序列进行填充,从而构造出完整序列的噬菌体,实现了对噬菌体的高效构造。实现了对噬菌体的高效构造。实现了对噬菌体的高效构造。

【技术实现步骤摘要】
噬菌体构造模型训练方法、噬菌体构造方法及终端设备


[0001]本申请属于数据处理
,尤其涉及一种噬菌体构造模型训练方法、噬菌体构造方法及终端设备。

技术介绍

[0002]噬菌体构造方法是一种常用于生物医学研究和应用的技术,其基本原理是利用噬菌体的特殊寄生性,通过基因组编辑等方法改造噬菌体,使其具有更广泛的宿主范围和更强的感染能力。
[0003]现有的噬菌体构造方法大多是基于噬菌体的自然寄生性进行改造。基于噬菌体自然寄生性的改造方法包括自然选择和人工选择两种构造方法。自然选择方法是利用噬菌体自然进化过程中的随机突变和选择机制,通过多次传代培养和筛选,选出具有更强感染能力和更广泛宿主范围的噬菌体株系。人工选择方法则是利用特定宿主菌株的遗传特性,通过繁殖和筛选,选出对该宿主菌株有高度感染能力的噬菌体株系。
[0004]然而,上述的噬菌体构造方法需要进行大量的噬菌体培养和筛选,以寻找具有理想感染能力和宿主范围的噬菌体株系,费时费力。

技术实现思路

[0005]本申请的目的在于提供一种噬菌体构造模型训练方法、噬菌体构造方法、终端设备及存储介质,旨在解决现有的噬菌体构造方法效率低的问题,本申请实施例通过机器学习算法构建噬菌体构造模型,从而利用噬菌体构造模型高效构造噬菌体。
[0006]本申请实施例的第一方面提供一种噬菌体构造模型训练方法,包括:
[0007]获取噬菌体样本和待训练的噬菌体构造模型;其中,所述噬菌体样本包括所述噬菌体样本的序列状态;所述噬菌体样本的初始序列状态为尾部蛋白被挖空且待填充元件序列的噬菌体元件序列;
[0008]将所述噬菌体样本输入到所述噬菌体构造模型中,以由所述噬菌体构造模型根据所述噬菌体样本的当前序列状态,确定基于当前序列状态所选择填充的元件,直至构造出完整的噬菌体序列;
[0009]基于构造出的完整噬菌体序列,对所述噬菌体构造模型的参数进行更新,直至达到更新停止条件,完成对所述噬菌体构造模型的训练。
[0010]通过噬菌体样本训练噬菌体构造模型,以使得噬菌体构造模型学习噬菌体的当前序列状态与噬菌体的下一个元件信息之间的映射关系,从而使得在实际应用时,对于尾部蛋白缺失的噬菌体,能通过训练后的噬菌体构造模型,对噬菌体尾部蛋白的元件序列进行填充,从而构造出完整序列的噬菌体,实现了对噬菌体的高效构造。
[0011]在一种可能的实现方式中,所述菌体构造模型为基于强化学习网络的噬菌体构造模型;所述将所述噬菌体样本输入到所述噬菌体构造模型中,以由所述噬菌体构造模型根据所述噬菌体样本的当前序列状态,确定基于当前序列状态所选择填充的元件,直至构造
出完整的噬菌体序列,包括:
[0012]将所述噬菌体样本输入到所述噬菌体构造模型中,以基于所述噬菌体样本的初始序列状态以及所述噬菌体构造模型的当前策略参数,确定在当前策略参数训练轮中每一时间步所选择填充的元件,以构造出完整的噬菌体序列。
[0013]在一种可能的实现方式中,所述基于构造出的完整噬菌体序列,对所述噬菌体构造模型的参数进行更新,直至达到更新停止条件,包括:
[0014]确定在当前策略参数训练轮中执行多个时间步的元件填充动作后所获得的累积奖励;
[0015]基于完整噬菌体的序列状态和所述累积奖励,对所述噬菌体构造模型的策略参数进行更新,直至达到更新停止条件。
[0016]在一种可能的实现方式中,所述确定在当前策略参数训练轮中执行多个时间步的元件填充动作后所获得的累积奖励,包括:
[0017]根据预设的动作价值函数,确定在所述当前策略参数训练轮中最后一个时间步执行动作后所获得的奖励值;
[0018]通过蒙特卡洛搜索算法对多个策略参数训练轮中最后一个时间步执行动作后所获得的奖励值进行采样,以根据采样结果确定每一个策略参数训练轮中其他时间步执行动作所获得的奖励值;其中,所述其他时间步是指在每个策略参数训练轮中除最后一个时间步的其他时间步;
[0019]根据所述当前策略参数训练轮中所有时间步执行动作后获得的奖励值,确定所述当前策略参数所获得的累积奖励。
[0020]在一种可能的实现方式中,在所述将所述噬菌体样本输入到所述噬菌体构造模型之前,还包括:
[0021]获取预先训练的噬菌体拟合模型的网络参数;
[0022]将所述网络参数作为所述噬菌体构造模型的策略参数的初始值。
[0023]通过将噬菌体拟合模型的网络参数赋值给所述噬菌体构造模型的策略参数的初始值,以预训练所述噬菌体构造模型,能解决由于强化学习中策略模型可选择的噬菌体元件太多,导致噬菌体元件选择动作空间过大导致所述噬菌体构造模型在强化学习策略中面临的奖励稀疏问题,进而导致所述噬菌体构造模型难以收敛的问题。
[0024]在一种可能的实现方式中,所述噬菌体拟合模型通过如下方式训练:
[0025]构建生成对抗网络模型,并由所述生成对抗网络模型的生成模型根据输入的随机向量生成噬菌体拟合序列,以将所述噬菌体拟合序列作为拟合噬菌体样本;
[0026]获取天然噬菌体样本,并由所述生成对抗网络模型的判别模型对所述天然噬菌体样本和所述拟合噬菌体样本进行鉴别;
[0027]基于鉴别结果,对所述生成模型和所述判别模型进行交替训练,得到所述噬菌体拟合模型。
[0028]在一种可能的实现方式中,所述由所述生成对抗网络模型的生成模型根据输入的随机向量生成噬菌体拟合序列,包括:
[0029]将随机生成的向量输入到所述生成模型中,得到第一个噬菌体元件;
[0030]将第i个噬菌体元件输入到所述生成模型中,得到第i+1个噬菌体元件;
[0031]重复所述将第i个噬菌体元件输入到所述生成模型中,得到第i+1个噬菌体元件的步骤,直至所得的噬菌体元件个数等于T;其中,i和T为大于或等于1的整数。
[0032]本申请实施例的第二方面提供一种噬菌体构造方法,包括:
[0033]将尾部蛋白缺失且待填充元件序列的噬菌体输入到所述噬菌体构造模型中,得到完整的噬菌体序列;其中,所述噬菌体构造模型为利用上述第一方面提供的噬菌体构造模型训练方法训练得到的噬菌体构造模型。
[0034]本申请实施例的第三方面提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面提供的噬菌体构造模型训练方法,或者实现如上述第二方面提供的噬菌体构造方法。
[0035]本申请实施例的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面提供的噬菌体构造模型训练方法,或者实现如上述第二方面提供的的噬菌体构造方法。
[0036]可以理解的是,上述第二方面、第三方面和第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
[0037]图1是本申请一实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种噬菌体构造模型训练方法,其特征在于,包括:获取噬菌体样本和待训练的噬菌体构造模型;其中,所述噬菌体样本包括所述噬菌体样本的序列状态;所述噬菌体样本的初始序列状态为尾部蛋白被挖空且待填充元件序列的噬菌体元件序列;将所述噬菌体样本输入到所述噬菌体构造模型中,以由所述噬菌体构造模型根据所述噬菌体样本的当前序列状态,确定基于当前序列状态所选择填充的元件,直至构造出完整的噬菌体序列;基于构造出的完整噬菌体序列,对所述噬菌体构造模型的参数进行更新,直至达到更新停止条件,完成对所述噬菌体构造模型的训练。2.如权利要求1所述的噬菌体构造模型训练方法,其特征在于,所述噬菌体构造模型为基于强化学习网络的噬菌体构造模型;所述将所述噬菌体样本输入到所述噬菌体构造模型中,以由所述噬菌体构造模型根据所述噬菌体样本的当前序列状态,确定基于当前序列状态所选择填充的元件,直至构造出完整的噬菌体序列,包括:将所述噬菌体样本输入到所述噬菌体构造模型中,以基于所述噬菌体样本的初始序列状态以及所述噬菌体构造模型的当前策略参数,确定在当前策略参数训练轮中每一时间步所选择填充的元件,以构造出完整的噬菌体序列。3.如权利要求2所述的噬菌体构造模型训练方法,其特征在于,所述基于构造出的完整噬菌体序列,对所述噬菌体构造模型的参数进行更新,直至达到更新停止条件,包括:确定在当前策略参数训练轮中执行多个时间步的元件填充动作后所获得的累积奖励;基于完整噬菌体的序列状态和所述累积奖励,对所述噬菌体构造模型的策略参数进行更新,直至达到更新停止条件。4.如权利要求3所述的噬菌体构造模型训练方法,其特征在于,所述确定在当前策略参数训练轮中执行多个时间步的元件填充动作后所获得的累积奖励,包括:根据预设的动作价值函数,确定在所述当前策略参数训练轮中最后一个时间步执行动作后所获得的奖励值;通过蒙特卡洛搜索算法对多个策略参数训练轮中最后一个时间步执行动作后所获得的奖励值进行采样,以根据采样结果确定每一个策略参数训练轮中其他时间步执行动作所获得的奖励值;其中,所述其他时间步是指在每个策略参数训练轮中除最后一个时间步的其他时间步;根据所述当前策略参数训练轮中所有...

【专利技术属性】
技术研发人员:李坚强陈杰张家骏林子杰
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1