一种建模方法、建模的装置及存储装置制造方法及图纸

技术编号:28678717 阅读:19 留言:0更新日期:2021-06-02 02:56
本申请公开了一种建模方法、装置及存储装置。其中,该方法包括:接收数据信息,数据信息至少包括细胞系的数据信息和药物的数据信息;对数据信息进行处理,得到药物的敏感性分数;基于细胞系的多个基因表达量,得到相关性矩阵;基于高斯分布随机生成药物向量和细胞系向量,以将药物向量和细胞系向量乘积,得到药物和细胞系的向量矩阵;将药物和细胞系的向量矩阵与相关性矩阵乘积,得到模型;基于模型的参数对模型进行训练,以调整药物向量和细胞系向量,以使模型输出的结果靠近敏感性分数。上述方案,以将药物向量和细胞系向量投影到同一向量空间中,进而利用了细胞系和药物的共享信息特征,提高了模型的准确度和效率。

【技术实现步骤摘要】
一种建模方法、建模的装置及存储装置
本申请涉及数据处理的
,特别是涉及一种建模方法、建模的装置及存储装置。
技术介绍
在癌症的治疗过程,靶向的抗癌药物相对于其他的方法具有更好的杀死癌细胞的效率和更少的毒性。但是鉴于不同的病人不同的基因突变,受试者在使用抗癌药反应和效果也不相同。对于如何在不同的基因突变的癌症患者中使用合适的抗癌药物是精准医疗的巨大方向。目前而言,通过预测病人对某种抗癌药的反应情况,这是一种巨大的挑战。现有技术基于某一种药物和该药物在不同细胞系的试验数据构建模型,通过该模型预测病人对某种抗癌药的反应情况。由于仅仅针对某一种药物在不同细胞系的试验数据,导致被试验的细胞数目受限制,以使模型具有局限性。
技术实现思路
本申请提供一种建模方法、建模的装置及存储装置,以解决上述问题。本申请第一方面提供了一种建模方法,包括:接收数据信息,所述数据信息至少包括细胞系的数据信息和药物的数据信息;对所述数据信息进行处理,得到所述药物的敏感性分数;基于所述细胞系的多个基因表达量,得到相关性矩阵;基于高斯分布随机生成药物向量和细胞系向量,以将所述药物向量和所述细胞系向量乘积,得到药物和细胞系的向量矩阵;将所述药物和细胞系的向量矩阵与所述相关性矩阵乘积,得到模型;基于所述模型的参数对所述模型进行训练,以调整所述药物向量和所述细胞系向量,以使所述模型输出的结果靠近所述敏感性分数。其中,所述对所述数据信息进行处理,得到所述药物的敏感性分数,包括:对所述数据信息进行筛选;利用拟合贝叶斯函数曲线计算筛选后的数据信息,得到所述药物在每种所述细胞系的IC50值;将所述药物的IC50值乘于第一预设数值,得到所述药物的敏感性分数;以得到模型的目标值。其中,所述对所述数据信息进行筛选,包括:判断所述数据信息中的整行或整列是否为空;若是,删除所述整行或所述整列;判断所述数据信息中是否具有高毒性的药物数据;若是,则从所述数据信息删除所述具有高毒性的药物数据,以得到所述筛选后的数据信息;通过删除数据为空的整行或整列,减小运算量和提高准确度;通过删除具有高毒性的药物数据,以剔除具有高毒性的药物。其中,所述基于所述细胞系的多个基因表达量,得到相关性矩阵,包括:对所述细胞系的多个基因表达量取对数,得到第一对数;获取所述细胞系的多个基因表达量的中位数,以对所述中位数取对数,得到第二对数;将所述第一对数减去所述第二对数,得到所述细胞系的第一向量;基于所述第一向量利用皮尔森相关性系数计算,得到所述相关性矩阵;通过上述方式得到相关性矩阵,以得到两种细胞系之间的相关度。其中,所述基于高斯分布随机生成药物向量和细胞系向量,包括:基于所述高斯分布随机生成从0到1的均匀分布的数列;将所述数列除于第二预设值,得到所述药物向量和所述细胞系向量。其中,所述基于所述模型的参数对所述模型进行训练,包括:设置有多个预设参数;基于多个所述预设参数依次对所述模型进行训练,得到多个所述模型的结果;选取所述结果与所述敏感性分数最接近的预设参数,作为所述模型的参数;通过选取模型效果最好的预设参数,提高模型的准确度和效率。其中,所述方法还包括:基于五折交叉验证的方法,评估所述模型的结果。其中,所述方法还包括:将调整后的所述药物向量与调整后的所述细胞系向量点积,得到所述药物之间的反应;或者,将多种所述药物的调整后的药物向量相加,以与对应所述细胞系的向量进行皮尔森相似度的计算,得到所述药物的通路关系。其中,计算调整后的第一药物向量和调整后的第二药物向量点积,得到所述第一药物和所述第二药物之间的相似度;或者,将所有所述细胞系的调整后的细胞系向量进行聚类,以探索出两种所述细胞系之间的相似度。为解决上述问题,本申请第二方面提供了一种建模的装置,包括处理器以及与所述处理器耦接的通信电路和存储器,其中,所述处理器执行所述存储器存储的计算机程序以结合所述通信电路执行上述方法。为解决上述问题,本申请第三方面提供了一种存储装置,存储有能够被处理器运行以实现上述方法的计算机程序。本申请的有益效果是:区别于现有技术,本申请对所述数据信息进行处理,得到所述药物的敏感性分数,能够得到多种药物在不同细胞系下的敏感性分数,突破了单类药物的分类限制;将所述药物和细胞系的向量矩阵与所述相关性矩阵乘积,得到模型;基于所述模型的参数对所述模型进行训练,以调整所述药物向量和所述细胞系向量,以使所述模型的输出结果靠近所述敏感性分数,即基于药物向量和细胞系向量构建模型,以将药物向量和细胞系向量投影到同一向量空间中,进而利用了细胞系和药物的共享信息特征,提高了模型的准确度和效率。附图说明图1是本申请建模方法一实施例的流程示意图;图2是图1中步骤S102的流程示意图;图3是图1中步骤S103的流程示意图;图4是本申请建模方法另一实施例的流程示意图;图5是本申请建模的装置一实施例的结构示意图;图6是本申请建模的装置一实施例的框架示意图;图7是本申请存储装置一实施例的框架示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了解决仅仅针对某一种药物在不同细胞系的试验数据,导致被试验的细胞数目受限制,以使模型具有局限性的问题;本申请提供一种建模方法,能够突破了单类药物的分类限制,利用了细胞系和药物的共享信息特征,提高了模型的准确度和效率。请参阅图1,图1是本申请建模方法一实施例的流程示意图。本申请的建模方法应用于一种建模装置,该装置可以为例如笔记本电脑、电脑、智能手机、平板电脑或者可穿戴设备等终端设备。本实施例的方法包括以下步骤:步骤S101:接收数据信息。建模装置接收数据信息,数据信息至少包括细胞系的数据信息和药物的数据信息。具体地,细胞系的数据信息包括多种细胞系名称;药物的数据信息包括多种药物的名称和多种药物的试验数据,药物的试验数据可以包括N次试验对应的药物的剂量、N次试验对应的活动数据(即药物的反应时间,取中位数)以及对应细胞系的药物的第一IC50值(IC50值表示抑制率为50%的时候药物的浓度)。其中,N可以为大于10的整数;细胞系可以为癌症细胞系,药物可以为癌症药物。步骤S102:对数据信息进行处理,得到药物的敏感性分数。建模装置对接收的数据信息进行处理,得到药物的敏感性分数,以得到模型的目标值。其中,药物的敏感性分数可为每种药物在不同细胞系的敏感性分数。如图2所示,步骤S102具体包括以下步骤:步骤S201:对数据信息进行筛选。为了提高处理速度,建模装置对数据信息进行筛选,其中建模装置对数据信息进行缺失值处理,判断数据信息中的整行或者整列是否为空;若是本文档来自技高网...

【技术保护点】
1.一种建模方法,其特征在于,包括:/n接收数据信息,所述数据信息至少包括细胞系的数据信息和药物的数据信息;/n对所述数据信息进行处理,得到所述药物的敏感性分数;/n基于所述细胞系的多个基因表达量,得到相关性矩阵;/n基于高斯分布随机生成药物向量和细胞系向量,以将所述药物向量和所述细胞系向量乘积,得到药物和细胞系的向量矩阵;/n将所述药物和细胞系的向量矩阵与所述相关性矩阵乘积,得到模型;/n基于所述模型的参数对所述模型进行训练,以调整所述药物向量和所述细胞系向量,以使所述模型输出的结果靠近所述敏感性分数。/n

【技术特征摘要】
1.一种建模方法,其特征在于,包括:
接收数据信息,所述数据信息至少包括细胞系的数据信息和药物的数据信息;
对所述数据信息进行处理,得到所述药物的敏感性分数;
基于所述细胞系的多个基因表达量,得到相关性矩阵;
基于高斯分布随机生成药物向量和细胞系向量,以将所述药物向量和所述细胞系向量乘积,得到药物和细胞系的向量矩阵;
将所述药物和细胞系的向量矩阵与所述相关性矩阵乘积,得到模型;
基于所述模型的参数对所述模型进行训练,以调整所述药物向量和所述细胞系向量,以使所述模型输出的结果靠近所述敏感性分数。


2.根据权利要求1所述的方法,其特征在于,所述对所述数据信息进行处理,得到所述药物的敏感性分数,包括:
对所述数据信息进行筛选;
利用拟合贝叶斯函数曲线计算筛选后的数据信息,得到所述药物在每种所述细胞系的IC50值;
将所述药物的IC50值乘于第一预设数值,得到所述药物的敏感性分数。


3.根据权利要求2所述的方法,其特征在于,所述对所述数据信息进行筛选,包括:
判断所述数据信息中的整行或整列是否为空;
若是,删除所述整行或所述整列;
判断所述数据信息中是否具有高毒性的药物数据;
若是,则从所述数据信息删除所述具有高毒性的药物数据,以得到筛选后的所述数据信息。


4.根据权利要求2所述的方法,其特征在于,所述基于所述细胞系的多个基因表达量,得到相关性矩阵,包括:
对所述细胞系的多个基因表达量取对数,得到第一对数;
获取所述细胞系的多个基因表达量的中位数,以对所述中位数取对数,得到第二对数;
将所述第一对数减去所述第二对数,得到所述细胞系的第一向量;
基于所述第一向量利用皮尔森相关性系数计算,得到所述相关性矩阵。


5.根据权...

【专利技术属性】
技术研发人员:张捷
申请(专利权)人:上海商汤智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1