System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种平均核糖体负载预测系统的处理方法和装置。
技术介绍
1、平均核糖体负载(mean ribosome load,mrl)是一个关键的生物学参数,它反映了在给定时间内mrna分子上的平均核糖体数量。平均核糖体负载与mrna的翻译效率、翻译速率以及核糖体在其上发生翻译停滞的频率(也称核糖体滞留频率)等参数相关。通过分析和优化平均核糖体负载指标可以有助于改善mrna的翻译效率和蛋白质表达水平。也即是说,平均核糖体负载预测工程对深入理解蛋白质的合成与调控以及对疾病治疗策略的开发等都具有重要意义。而传统基于实验方法进行的平均核糖体负载预测工作,受实验条件限制其预测效率与预测质量都很难保障。
技术实现思路
1、本专利技术的目的,就是针对现有技术的缺陷,提供一种平均核糖体负载预测系统的处理方法、装置、电子设备及计算机可读存储介质,以rna序列预训练模型和核糖体负载预测模型为核心构建一个平均核糖体负载预测系统,并基于三类数据集(全类型rna序列数据集、非编码rna序列数据集、rna修饰序列数据集)对系统进行训练以提高系统的通用性、适用性和预测准确度;并基于该系统设计三种应用模式(单序列预测模式、多序列排序模式和单序列优化模式);在单序列预测模式下,基于该系统处理任意目标rna序列的平均核糖体负载预测任务;在多序列排序模式下,先基于该系统对多个目标rna序列进行平均核糖体负载预测,再结合预设的评估参数规则(rna翻译效率参数规则、rna翻译速率参数规则和rna核糖体
2、为实现上述目的,本专利技术实施例第一方面提供了一种平均核糖体负载预测系统的处理方法,所述方法包括:
3、预先构建平均核糖体负载预测系统记为对应的第一预测系统;并构建数据集记为对应的第一数据集;并基于所述第一数据集对所述第一预测系统进行训练;
4、在系统训练结束之后,接收用户输入的系统应用模式和对应的系统应用数据;所述系统应用模式包括单序列预测模式、多序列排序模式和单序列优化模式;所述系统应用模式为单序列预测模式时,所述系统应用数据为对应的第一目标rna序列;所述系统应用模式为多序列排序模式时,所述系统应用数据为对应的多个第二目标rna序列;所述系统应用模式为单序列优化模式时,所述系统应用数据为对应的第一目标mrna序列;
5、当所述系统应用模式为单序列预测模式时,基于所述第一预测系统对所述第一目标rna序列进行平均核糖体负载预测处理;
6、当所述系统应用模式为多序列排序模式时,基于所述第一预测系统对所述多个第二目标rna序列进行目标rna序列排序处理;
7、当所述系统应用模式为单序列优化模式时,基于所述第一预测系统对所述第一目标mrna序列进行序列优化处理。
8、优选的,所述第一预测系统包括rna序列预训练单元、rna序列特征降维单元、核糖体负载预测单元和平均核糖体负载预测单元;
9、所述rna序列预训练单元的输入端为所述第一预测系统的输入端,输出端与所述rna序列特征降维单元的输入端连接;所述rna序列特征降维单元的输出端与所述核糖体负载预测单元的输入端连接;所述核糖体负载预测单元的输出端与所述平均核糖体负载预测单元的输入端连接;所述平均核糖体负载预测单元的输出端为所述第一预测系统的输出端;
10、所述rna序列预训练单元用于对所述第一预测系统的输入序列进行特征编码并输出对应的特征张量;所述rna序列预训练单元基于预设的预训练模型实现;所述预设的预训练模型包括基于transformer结构的预训练模型、基于cnn结构的预训练模型、基于rnn结构的预训练模型、基于自编码器结构的预训练模型、基于变分自编码器结构的预训练模型和基于自回归模型结构的预训练模型;
11、所述rna序列特征降维单元用于对所述rna序列预训练单元输出的特征张量进行特征维度降维处理并输出对应的降维张量;所述rna序列特征降维单元基于一类线性神经网络实现;所述一类线性神经网络包括全连接神经网络;
12、所述核糖体负载预测单元用于根据所述rna序列特征降维单元输出的降维张量进行核糖体负载预测处理生成对应的预测张量;所述核糖体负载预测单元基于预设的预测模型实现;所述预设的预测模型包括基于多层resnet结构的预测模型、基于transformer结构的预测模型、基于cnn结构的预测模型和基于gnn结构的预测模型;
13、所述平均核糖体负载预测单元用于根据所述核糖体负载预测单元输出的预测张量进行平均核糖体负载估算处理并将得到的估算数据作为所述第一预测系统的平均核糖体负载预测结果输出;所述平均核糖体负载预测单元基于二类线性神经网络实现;所述二类线性神经网络包括全连接神经网络。
14、优选的,所述第一数据集包括一阶段数据集、二阶段数据集和三阶段数据集;
15、所述一阶段数据集为整合了rnacentral数据库、mg-rast数据库、genomewarehouse数据库、mgnify数据库和ncbi核酸序列数据库及其子集的rna序列数据库;所述一阶段数据集包括多个第一rna序列;
16、所述二阶段数据集包括多个第一非编码rna序列;
17、所述三阶段数据集包括多个第一rna修饰序列。
18、优选的,所述基于所述第一数据集对所述第一预测系统进行训练,具体包括:
19、将所述一阶段数据集作为对应的第一数据集;并将所述第一数据集的各个所述第一rna序列作为对应的第一序列;并按预设的训练-测试数据比将所述第一数据集划分成训练数据集和测试数据集,训练-测试数据比=训练数据集的第一序列数量:测试数据集的第一序列数量;并根据本次得到的所述训练数据集和所述测试数据集对所述第一预测系统进行一轮系统训练;
20、并在本轮系统训练结束时,将所述二阶段数据集作为新的所述第一数据集;并将新的所述第一数据集的各个所述第一非编码rna序列作为对应的所述第一序列;并按所述训练-测试数据比将新的所述第一数据集划分成新的所述训练数据集和所述测试数据集;并根据本次得到的所述训练数据集和所述测试数据集对所述第一预测系统进行一轮系统训练;
21、并在本轮系统训练结束时,将所述三阶段数据集作为新的所述第一数据集;并将新的所述第一数据集的各个所述第本文档来自技高网...
【技术保护点】
1.一种平均核糖体负载预测系统的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的平均核糖体负载预测系统的处理方法,其特征在于,
3.根据权利要求2所述的平均核糖体负载预测系统的处理方法,其特征在于,
4.根据权利要求3所述的平均核糖体负载预测系统的处理方法,其特征在于,所述基于所述第一数据集对所述第一预测系统进行训练,具体包括:
5.根据权利要求4所述的平均核糖体负载预测系统的处理方法,其特征在于,所述根据本次得到的所述训练数据集和所述测试数据集对所述第一预测系统进行一轮系统训练,具体包括:
6.根据权利要求2所述的平均核糖体负载预测系统的处理方法,其特征在于,所述基于所述第一预测系统对所述第一目标RNA序列进行平均核糖体负载预测处理,具体包括:
7.根据权利要求2所述的平均核糖体负载预测系统的处理方法,其特征在于,所述基于所述第一预测系统对所述多个第二目标RNA序列进行目标RNA序列排序处理,具体包括:
8.根据权利要求2所述的平均核糖体负载预测系统的处理方法,其特征在于,所述基于
9.一种用于执行权利要求1-8任一项所述的平均核糖体负载预测系统的处理方法的装置,其特征在于,所述装置包括:预测系统构建与训练模块、应用信息获取模块、一类应用处理模块、二类应用处理模块和三类应用处理模块;
10.一种电子设备,其特征在于,包括:存储器、处理器和收发器;
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-8任一项所述的方法。
...【技术特征摘要】
1.一种平均核糖体负载预测系统的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的平均核糖体负载预测系统的处理方法,其特征在于,
3.根据权利要求2所述的平均核糖体负载预测系统的处理方法,其特征在于,
4.根据权利要求3所述的平均核糖体负载预测系统的处理方法,其特征在于,所述基于所述第一数据集对所述第一预测系统进行训练,具体包括:
5.根据权利要求4所述的平均核糖体负载预测系统的处理方法,其特征在于,所述根据本次得到的所述训练数据集和所述测试数据集对所述第一预测系统进行一轮系统训练,具体包括:
6.根据权利要求2所述的平均核糖体负载预测系统的处理方法,其特征在于,所述基于所述第一预测系统对所述第一目标rna序列进行平均核糖体负载预测处理,具体包括:
7.根据权利要求2所述的平...
【专利技术属性】
技术研发人员:温翰,王喜,顾睿初,李永歌,张林峰,孙伟杰,
申请(专利权)人:北京深势科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。