System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及生物,尤其涉及一种针对rna病毒关键变异位点的数据预测方法及装置。
技术介绍
1、病毒是自然界中一种较为独特的微生物,不能独立生存和繁殖,必须依赖宿主细胞才能完成生命活动。现阶段,绝大多数的病毒的寄生通常会对宿主造成一定程度的负面影响,比如造成宿主生理系统的运行紊乱,引发严重疾病等。
2、在不同宿主间进行传播和适应的过程中,病毒可以根据生存环境和条件的不同发生各种各样的基因突变,以保证自身在宿主细胞中的稳定生存。因此,针对病毒基因中突变位点进行分析和药物设计,对如何解决病毒引发的疾病问题有着重大帮助。
3、现阶段的传统技术中主要通过在实验室针对病毒进行大量反复的实验测试,来确定病毒基因序列中可能的突变位点。虽说通过此类方法一定程度上可以确定出病毒基因中较为重要的突变位点,但整体确定过程所需时间花费较多,效率较为低下,且大量的实验测试消耗的研发成本极为高昂。影响针对病毒的药物疫苗开发的同时,可能还会因时间消耗过久导致病毒出现新的未知突变,进而引发更为严重的疾病问题。
4、因此,如何能够高效率且精准确定出病毒基因序列中的关键变异基因位点,是至关重要的。
技术实现思路
1、本说明书提供一种针对rna病毒关键变异位点的数据预测方法及装置,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种针对rna病毒关键变异位点的数据预测方法,包括:
4、获取目标病毒对应的历史病毒
5、根据所述历史病毒进化数据,构建所述目标病毒对应的病毒进化分支树;
6、针对所述目标病毒的每一个核苷酸位点,基于所述病毒进化分支树,确定该核苷酸位点对应的第一突变概率和第二突变概率,所述第一突变概率用于表示该核苷酸位点发生固定突变的概率大小,所述第二突变概率用于表示该核苷酸位点发生平行突变的概率大小;
7、根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点。
8、可选的,根据所述历史病毒进化数据,构建所述目标病毒对应的病毒进化分支树,具体包括:
9、根据所述历史病毒进化数据中所述目标病毒的病毒基因序列数据,以及所述目标病毒对应的各历史进化病毒的病毒基因序列数据,构建所述目标病毒对应的基础进化树;
10、根据所述目标病毒的宿主信息和所述目标病毒对应的各历史进化病毒的宿主信息,对所述基础进化树进行宿主来源分类着色处理,并将着色处理后的基础进化树,作为所述目标病毒对应的病毒进化分支树。
11、可选的,基于所述病毒进化分支树,针对所述目标病毒的每一个核苷酸位点,确定该核苷酸位点对应的第一突变概率,具体包括:
12、根据预设的固定突变周期时长,对所述目标病毒的历史进化时长进行周期划分,确定所述目标病毒对应的各固定突变周期;
13、针对所述目标病毒对应的每个固定突变周期,根据所述病毒进化分支树,确定该固定突变周期对应的至少一个病毒进化分支,并根据该固定突变周期对应的至少一个病毒进化分支,确定在该固定突变周期内所述目标病毒对应的固定突变评估结果;
14、根据所述各固定突变周期的对应的固定突变评估结果,确定该核苷酸位点对应的第一突变概率。
15、可选的,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
16、针对所述目标病毒的每个核苷酸位点,将该核苷酸位点对应的第一突变概率和第二突变概率输入到预训练的位点预测模型中,以使得所述位点预测模型根据该核苷酸位点对应第一突变概率和第二突变概率,确定出该核苷酸位点对应的综合位点特征数据;
17、根据所述目标病毒的各核苷酸位点对应的综合位点特征数据,从所述目标病毒的各核苷酸位点中确定出关键变异位点。
18、可选的,训练位点预测模型,具体包括:
19、获取样本病毒的各核苷酸位点对应的第一突变概率和第二突变概率;
20、针对所述样本病毒的每个核苷酸位点,将该核苷酸位点对应的第一突变概率和第二突变概率输入到待训练的位点预测模型中,以使得所述待训练的位点预测模型根据所述该核苷酸位点对应的第一突变概率和第二突变概率,确定出该核苷酸位点对应的综合位点特征数据,并根据该核苷酸位点对应的综合位点特征数据和该核苷酸位点对应的标准综合位点特征数据,确定所述待训练的位点预测模型针对该核苷酸位点的损失值,所述损失值的大小与该核苷酸位点对应的综合位点特征数据和该核苷酸位点对应的综合标准位点特征数据之间的特征相似度呈负相关;
21、根据所述待训练的位点预测模型针对所述样本病毒的各核苷酸位点的损失值,确定所述待训练的位点预测模型对应的总损失值,并根据所述总损失值对所述待训练的位点预测模型进行模型训练。
22、可选的,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
23、针对所述目标病毒的每个核苷酸位点,根据预设的固定突变权重和平行突变权重,对该核苷酸位点对应的第一突变概率和第二突变概率进行加权求和处理,得到该核苷酸位点对应的变异位点综合概率;
24、根据预设的变异位点综合概率阈值和所述目标病毒的各核苷酸位点对应的变异位点综合概率,从所述目标病毒的各核苷酸位点确定出所述目标病毒对应的关键变异位点。
25、可选的,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
26、基于预设的位点筛选策略,根据所述目标病毒的各核苷酸位点的第一突变概率和第二突变概率,从所述目标病毒的各核苷酸位点确定出所述目标病毒对应的关键变异位点。
27、本说明书提供了一种针对rna病毒关键变异位点的数据预测装置,包括:
28、获取模块,用于获取目标病毒对应的历史病毒进化数据,所述历史病毒进化数据中至少包含有:所述目标病毒的病毒基因序列数据和宿主信息、所述目标病毒在历史上进化所得到的各历史进化病毒的病毒基因序列数据和宿主信息;
29、构建模块,用于根据所述历史病毒进化数据,构建所述目标病毒对应的病毒进化分支树;
30、概率确定模块,用于针对所述目标病毒的每一个核苷酸位点,基于所述病毒进化分支树,确定该核苷酸位点对应的第一突变概率和第二突变概率,所述第一突变概率用于表示该核苷酸位点发生固定突变的概率大小,所述第二突变概率用于表示该核苷酸位点发生平行突变的概率大小;
31、位点确定模块,用于根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点本文档来自技高网...
【技术保护点】
1.一种针对RNA病毒关键变异位点的数据预测方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,根据所述历史病毒进化数据,构建所述目标病毒对应的病毒进化分支树,具体包括:
3.如权利要求1所述的方法,其特征在于,基于所述病毒进化分支树,针对所述目标病毒的每一个核苷酸位点,确定该核苷酸位点对应的第一突变概率,具体包括:
4.如权利要求1所述的方法,其特征在于,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
5.如权利要求4所述的方法,其特征在于,训练位点预测模型,具体包括:
6.如权利要求1所述的方法,其特征在于,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
7.如权利要求1所述的方法,其特征在于,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
8.一种针对RNA病毒关键变异位点的数据预测装置,其特征在于,
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
...【技术特征摘要】
1.一种针对rna病毒关键变异位点的数据预测方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,根据所述历史病毒进化数据,构建所述目标病毒对应的病毒进化分支树,具体包括:
3.如权利要求1所述的方法,其特征在于,基于所述病毒进化分支树,针对所述目标病毒的每一个核苷酸位点,确定该核苷酸位点对应的第一突变概率,具体包括:
4.如权利要求1所述的方法,其特征在于,根据所述目标病毒的各核苷酸位点对应的第一突变概率和第二突变概率,确定所述目标病毒的关键变异位点,具体包括:
5.如权利要求4所述的方法,其特征在于,训练位点预测模型,具体包括:
6.如权利要求1所述的方法,其特征在于,根据所述目标...
【专利技术属性】
技术研发人员:吴爱平,周航宇,季承杨,
申请(专利权)人:苏州系统医学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。