System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,特别涉及一种基于自回归模型处理分子生成任务的系统。
技术介绍
1、基于结构的药物设计(structure-based drug design, sbdd)是一种通过分析目标蛋白质的三维结构来设计有效配体分子的设计方法。常规的sbdd设计主要通过分子运动模拟和量子化学计算来实现的,而通过实践应用我们发现这种常规实现方式的模拟/计算周期较长、设计效率并不高。
技术实现思路
1、本专利技术的目的,就是针对现有技术的缺陷,提供一种基于自回归模型处理分子生成任务的系统,该系统包括:任务调度模块、任务训练模块、任务执行模块、复合物数据库、自回归模型库和任务接口库;其中,任务调度模块用于在收到外部接口输入的分子生成任务数据之后,先根据任务数据进行模型训练参考数据准备得到对应参考数据向任务训练模块发送,再在任务训练模块确认模型训练结束时根据任务数据进行分子生成任务参考数据准备得到对应参考数据向任务执行模块发送,最后将任务执行模块回发的生成分子构象向外部接口反馈;任务训练模块用于根据参考数据和复合物数据库对自回归模型库的pocket2mol模型、graphbp模型、flag模型进行训练;任务执行模块用于根据参考数据和任务接口库的五类任务接口(配体生成任务接口、连接子生成任务接口、片段生长任务接口、侧链修饰任务接口和骨架跃迁任务接口)进行分子生成任务执行处理。通过本专利技术对常规基于分子运动模拟和量子化学计算实现的sbdd设计流程进行改善,可以缩短设计周期、提高设计效率。
>2、为实现上述目的,本专利技术实施例提供了一种基于自回归模型处理分子生成任务的系统,所述系统包括:任务调度模块、任务训练模块、任务执行模块、复合物数据库、自回归模型库和任务接口库;
3、所述任务调度模块分别与所述任务训练模块和所述任务执行模块连接;所述任务训练模块分别与所述复合物数据库和所述自回归模型库连接;所述任务执行模块与所述任务接口库连接;所述任务接口库与所述自回归模型库连接;
4、所述任务调度模块用于接收外部接口输入的分子生成任务数据作为对应的第一任务数据;并根据所述第一任务数据进行模型训练参考数据准备得到对应的第一参考数据向所述任务训练模块发送;并在收到所述任务训练模块发送的第一训练状态为模型训练结束时,根据所述第一任务数据进行分子生成任务参考数据准备得到对应的第二参考数据向所述任务执行模块发送;并将所述任务执行模块发送的第一生成分子构象向所述外部接口反馈;所述第一生成分子构象为一个生成分子的三维分子构象;所述三维分子构象由对应的原子对象集和化学键对象集组成;所述原子对象集由一个或多个原子对象组成;每个所述原子对象包括原子索引、原子类型和原子坐标;所述化学键对象集由一个或多个化学键对象组成;每个所述化学键对象包括化学键索引、化学键类型和化学键原子索引组;所述化学键原子索引组由当前化学键对象对应的两个所述原子对象的所述原子索引组成;
5、所述任务训练模块用于根据所述第一参考数据和所述复合物数据库对所述自回归模型库中的指定模型进行训练得到对应的所述第一训练状态向所述任务调度模块发送;
6、所述任务执行模块用于根据所述第二参考数据和所述任务接口库进行分子生成任务执行处理得到对应的所述第一生成分子构象向所述任务调度模块发送;
7、所述复合物数据库包括多个复合物数据集;每个所述复合物数据集对应一个数据集索引;每个所述复合物数据集由多个复合物记录组成;每个所述复合物记录对应一个蛋白质-配体复合物,该蛋白质-配体复合物由一个蛋白质口袋与一个配体分子结合而成;所述复合物记录包括复合物构象、蛋白质口袋构象和配体分子构象;所述复合物构象、所述蛋白质口袋构象和所述配体分子构象分别为当前记录对应的蛋白质-配体复合物、蛋白质口袋和配体分子的所述三维分子构象,所述蛋白质口袋构象和所述配体分子构象各为所述复合物构象的一个子构象;
8、所述自回归模型库包括pocket2mol模型、graphbp模型和flag模型;
9、所述任务接口库包括五类分子生成任务接口,分别为配体生成任务接口、连接子生成任务接口、片段生长任务接口、侧链修饰任务接口和骨架跃迁任务接口。
10、优选的,所述第一任务数据包括第一任务类型、第一模型类型、第一数据集索引和第一任务信息集;
11、所述第一任务类型包括配体生成任务、连接子生成任务、片段生长任务、侧链修饰任务和骨架跃迁任务;
12、所述第一模型类型包括第一类型、第二类型和第三类型;
13、所述第一任务类型为配体生成任务时,对应的所述第一任务信息集由第一蛋白质口袋构象组成;所述第一蛋白质口袋构象为一个蛋白质口袋的所述三维分子构象;
14、所述第一任务类型为连接子生成任务时,对应的所述第一任务信息集包括第一蛋白质-配体复合物构象、第一口袋原子集和第一配体原子集;所述第一蛋白质-配体复合物构象为一个蛋白质-配体复合物a的所述三维分子构象;所述蛋白质-配体复合物a由一个蛋白质口袋pa和一个配体分子ma组成,所述配体分子ma由至少两个及两个以上分子片段fa组成;所述第一口袋原子集和所述第一配体原子集分别为所述蛋白质口袋pa和所述配体分子ma的原子索引集;
15、所述第一任务类型为片段生长任务时,对应的所述第一任务信息集包括第二蛋白质-配体复合物构象、第二口袋原子集、第二配体原子集和第一待生长片段原子集;所述第二蛋白质-配体复合物构象为一个蛋白质-配体复合物b的所述三维分子构象;所述蛋白质-配体复合物b由一个蛋白质口袋pb和一个配体分子mb组成,所述配体分子mb上需要进行片段生长的分子片段记为待生长片段fb;所述第二口袋原子集、所述第二配体原子集和所述第一待生长片段原子集分别为所述蛋白质口袋pb、所述配体分子mb和所述待生长片段fb的原子索引集;
16、所述第一任务类型为侧链修饰任务时,对应的所述第一任务信息集包括第三蛋白质-配体复合物构象、第三口袋原子集和第三配体原子集;所述第三蛋白质-配体复合物构象为一个蛋白质-配体复合物c的所述三维分子构象;所述蛋白质-配体复合物c由一个蛋白质口袋pc和一个配体分子mc组成;所述第三口袋原子集和所述第三配体原子集分别为所述蛋白质口袋pc和所述配体分子mc的原子索引集;
17、所述第一任务类型为骨架跃迁任务时,对应的所述第一任务信息集包括第四蛋白质-配体复合物构象、第四口袋原子集、第四配体原子集和第一待跃迁片段原子集;所述第四蛋白质-配体复合物构象为一个蛋白质-配体复合物d的所述三维分子构象;所述蛋白质-配体复合物d由一个蛋白质口袋pd和一个配体分子md组成,所述配体分子md的主干骨架上需要进行跃迁的骨架片段记为待跃迁片段fd;所述第四口袋原子集、所述第四配体原子集和所述第一待跃迁片段原子集分别为所述蛋白质口袋pd、所述配体分子md和所述待跃迁片段fd的原子索引集。
18、优选的,所述任务调度模块具体用于在所述根据所述第一任本文档来自技高网...
【技术保护点】
1.一种基于自回归模型处理分子生成任务的系统,其特征在于,所述系统包括:任务调度模块、任务训练模块、任务执行模块、复合物数据库、自回归模型库和任务接口库;
2.根据权利要求1所述的基于自回归模型处理分子生成任务的系统,其特征在于,
3.根据权利要求2所述的基于自回归模型处理分子生成任务的系统,其特征在于,
4.根据权利要求3所述的基于自回归模型处理分子生成任务的系统,其特征在于,
5.根据权利要求3所述的基于自回归模型处理分子生成任务的系统,其特征在于,
6.根据权利要求5所述的基于自回归模型处理分子生成任务的系统,其特征在于,
7.根据权利要求5所述的基于自回归模型处理分子生成任务的系统,其特征在于,
8.根据权利要求5所述的基于自回归模型处理分子生成任务的系统,其特征在于,
9.根据权利要求5所述的基于自回归模型处理分子生成任务的系统,其特征在于,
10.根据权利要求5所述的基于自回归模型处理分子生成任务的系统,其特征在于,
【技术特征摘要】
1.一种基于自回归模型处理分子生成任务的系统,其特征在于,所述系统包括:任务调度模块、任务训练模块、任务执行模块、复合物数据库、自回归模型库和任务接口库;
2.根据权利要求1所述的基于自回归模型处理分子生成任务的系统,其特征在于,
3.根据权利要求2所述的基于自回归模型处理分子生成任务的系统,其特征在于,
4.根据权利要求3所述的基于自回归模型处理分子生成任务的系统,其特征在于,
5.根据权利要求3所述的基于自回归模型处理...
【专利技术属性】
技术研发人员:赵国江,林海涛,高志锋,吴立荣,柯国霖,张林峰,
申请(专利权)人:北京深势科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。