【技术实现步骤摘要】
一种基于特征迁移元学习的培养基预测方法及系统
[0001]本专利技术属于生物
,更具体地,涉及一种基于特征迁移元学习的培养基预测方法及系统。
技术介绍
[0002]无血清无动物来源、化学成分限定培养基由碳源、氨基酸、维生素、微量金属离子、脂类、缓冲试剂和其他添加试剂组成,传统的培养基配方开发方式为以某一种或几种经典培养基为基础(比如DEME/F12),通过添加多种不同成分,采用单因素试验或DOE筛选试验找到关键组分,然后再用响应曲面等多种DOE实验设计,优化各组分浓度,以获得最佳配方;或根据细胞代谢分析、基因组学分析和蛋白组学分析找到各组分在细胞生长过程中变化情况及对目标产物产量和质量的影响来优化配方。
[0003]目前已经开发了一些基于人工智能的培养基开发方法,例如中国专利文献CN113450882A、以及CN113450868A等。基于人工智能的培养基开发方法,能够在一定程度上缩短培养基配方的开发试验周期时间、降低实验成本等问题。CN114121161A则通过迁移学习降低了对不同细胞的培养基开发过程中,样本数据库的样本量要求,从而降低了开发成本和训练时间。
[0004]然而上述基于人工智能的培养基开发方法,为了获得最初的智能学习模型,需要生成大量的供模型学习的培养基培养效果数据,即样本数据库。而样本数据库中,样本量大小直接决定了人工智能培养基开发方法的开发效果。仍然需要大量数据来建立人工智能模型,因此现有的基于智能学习的培养基开发方法,成本居高不下。
技术实现思路
[0005 ...
【技术保护点】
【技术特征摘要】
1.一种基于特征迁移元学习的培养基预测方法,其特征在于,包括以下步骤:(1)采用基于特征迁移的元学习器对用于预测培养基配方培养效果的基础学习器进行训练,得到培养基配方培养效果预测模型;其元学习样本数据按照如下方法获取:S1、从历史细胞株样本配方数据库中,筛选出培养效果指标包括目标指标的配方样本,形成参照配方样本数据库;所述配方样本,包括:适用的细胞株、培养基配方、以及包括目标指标在内的培养效果指标;S2、对于步骤S1中获得的参照配方样本数据库中的每一配方样本,采用其培养基配方接种培养目标细胞株,收集与该配方样本培养效果指标相同指标的培养效果值,组成目标细胞株样本配方数据库;S3、对于步骤S2获得的目标细胞株样本配方数据库和步骤S1获得的参照配方样本数据库,根据相同培养基配方对目标细胞株和参照配方样本数据库中包含的细胞株的不同培养效果或不同培养基配方对目标细胞株和参照配方样本数据库中包含的细胞株培养效果,判断目标细胞株和参照配方样本数据库中包含的细胞株的相似性,取相似性最高的细胞株作为参照细胞株;S4、将目标细胞株和参照细胞株共同接种的培养基配方、目标细胞株的目标指标培养效果向量、以及参照细胞株的目标指标培养效果向量组成经验样本,收集经验样本集合作为基于特征迁移的元学习经验池;S5、从步骤S4中获得的基于特征迁移的元学习经验池中随机抽样形成任务集合,并从任务集合中形成元训练集和元测试集将元训练集和元测试集作为元学习样本数据;(2)对于待预测的培养基配方,采用步骤(1)获得的培养基配方培养效果预测模型进行培养效果值预测。2.如权利要求1所述的基于特征迁移元学习的培养基预测方法,其特征在于,步骤(1)采用所述元学习样本数据进行监督训练,采用的损失函数Loss为:Loss=metaloss+λ*mmdloss其中metaloss为培养基配方培养效果预测模型对于目标细胞株的预测值和元学习样本数据目标细胞株的目标指标培养效果向量之间差异,mmdloss为培养基配方培养效果预测模型对于目标细胞株的预测值和元学习样本数据参照细胞株的目标指标培养效果向量之间的最大均值差异,λ为权重。3.如权利要求2所述的基于特征迁移元学习的培养基预测方法,其特征在于,培养基配方培养效果预测模型对于目标细胞株的预测值和元学习样本数据目标细胞株的目标指标培养效果向量之间的差异metaloss按照如下方法计算:
其中Y
′
object
为培养基配方培养效果预测模型预测所述元学习样本数据训练样本集合的培养基配方得到的培养效果向量,其长度为dim,其中第d元素,即第d目标指标的值为Y
′
object
[d];Y
object
为所述元学习样本数据训练样本集合的目标细胞株的目标指标培养效果向量,其长度为dim,其中第d元素,即第d目标指标的值为Y
object
[d],n为训练样本集合的大小。4.如权利要求1所述的基于特征迁移元学习的培养基预测方法,其特征在于,步骤S1所述配方样本其培养基配方,对于目标指标应具有良好的培养效果以及通用性,优选采用排序或阈值法进行筛选;所述培养效果良好的培养基配方,其培养效果指标或培养效果指标的加权值超过预设培养效果阈值;所述通用性良好的培养基配方,其对于超过预设比例的细胞株的培养效果超过预设的通用性阈值;所述培养效果阈值可以是培养效果指标的值或培养效果指标的加权值、或二者的排名;所述排名通用性阈值亦可为培养效果指标的值或培养效果指标的加权值、或二者的排名。5.如权利要求1所述的基于特征迁移元学习的培养基预测方法,其特征在于,步骤S3所述相似性确定包括以下步骤:对于一个或多个培养基配方,获取目标细胞株以及参照配方样本数据库中包含的细胞株的各培养效果指标值组成的指标值,评价上述关于目标细胞株和参照配方样本数据库中包含的各细胞株其一的两组值的相似性,得到关于该一个或多个培养基配方的相似性分值;或对于每一培养效果指标,获取目标细胞株样本配方数据库中所有培养基配方关于该培养效果指标的值、以及参照配方样本数据库中相应培养基配方对于其包含的各细胞株的培养效果指标的值,评价上述关于目标细胞株和参照配方样本数据库中包含的各细胞株其一的两组值的相似性,得到关于该培养效果指标的相似性分值;所述评价上述两组值的相似性,根据n维余弦相似度或n维欧几里得距离等指标进行评价;综合所有培养效果指标的相似性分值,作为目标细胞株与参照配方样本数据库中包含的各细胞株的相似性;所述目标细胞株与参照配方样本数据库中包含的各细胞株的相似性,为所有培养效果指标或培养基配方的相似性分值的平均值、累计值、或加权平均值或加权合。6.如权利要求1所述的基于特征迁...
【专利技术属性】
技术研发人员:陈亮,黄贺声,胡志鹏,张祥涛,梁国龙,
申请(专利权)人:深圳太力生物技术有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。