【技术实现步骤摘要】
【国外来华专利技术】相关申请的引用本申请依据35U.S.C.§119要求于2012年6月21日提交的标题为“Systems and Methods Relating to Network-Based Biomarker Signatures”的美国临时专利申请No.61/662,806和于2012年7月16日提交的标题为“Systems and Methods Relating to Network-Based Biomarker Signatures”的美国临时专利申请No.61/671,954的优先权,以上每篇申请的全部内容并入本文。
技术介绍
在过去的十年中,与传统的剂量相关的疗效和毒性测定相结合的对于核酸、蛋白质和代谢物水平的高吞吐量测量已经作为用于阐明许多生物过程的作用机制的手段出现。研究者试图将来自这些迥然不同的测量的信息与来自科学文献的关于生物路径的知识组合以组装有意义的生物模型。为此,研究者已经开始使用可以挖掘大量数据的数学和计算技术(诸如聚类和统计方法)来识别可能的生物作用机制。由于典型的基因表达数据中的信噪比很高、个体之间的基因型可变性、以及通常测量的基因的数量相对于患者的数量而言很多,找到对于诊断工具足够可靠的基因签名是非常具有挑战性的。以前的工作探讨了以下步骤的重要性:揭示由对于生物过程的一个或多个扰动而造成的基因表达变化的特征签名,随后作为对该过程的特定活动振幅的度量、对该签名在附加的数据集合中的存在进行评 ...
【技术保护点】
一种用于识别表示感兴趣表型的生物实体的计算机化方法,包括以下步骤:(a)在处理装置处提供计算因果网络模型,所述计算因果网络模型表示促成所述表型的生物系统,并且所述计算因果网络模型包括:多个节点,表示所述生物系统中的生物实体;和多个边,连接所述多个节点中的节点对,并且表示由节点表示的生物实体之间的关系;其中,一个或多个边与方向值相关联,所述方向值表示由节点表示的生物实体之间的因果激活关系或因果抑制关系,并且其中每个节点通过边连接到至少一个其他节点;(b)在所述处理装置处接收(i)与第一生物实体子集的在第一组条件下获得的活动相应的第一数据集合、以及(ii)与第一生物实体子集的在不同于第一组条件的第二组条件下获得的活动相应的第二数据集合,其中,所述第一组条件和所述第二组条件与所述表型相关;(c)用所述处理装置计算与所述第一生物实体子集相应的第一节点子集的活动度量集合,所述活动度量表示所述第一数据集合与所述第二数据集合之间的差别;(d)用所述处理装置基于所述计算因果网络模型和所述活动度量集合来产生第二节点子集的活动值集合,所述第二节点子集表示促成所述表型的、但是其活动未被测量的生物实体候选;( ...
【技术特征摘要】
【国外来华专利技术】2012.06.21 US 61/662,806;2012.07.16 US 61/671,9541.一种用于识别表示感兴趣表型的生物实体的计算机化方法,包
括以下步骤:
(a)在处理装置处提供计算因果网络模型,所述计算因果网络模型
表示促成所述表型的生物系统,并且所述计算因果网络模型包括:
多个节点,表示所述生物系统中的生物实体;和
多个边,连接所述多个节点中的节点对,并且表示由节点表
示的生物实体之间的关系;
其中,一个或多个边与方向值相关联,所述方向值表示由节
点表示的生物实体之间的因果激活关系或因果抑制关系,并且其中每
个节点通过边连接到至少一个其他节点;
(b)在所述处理装置处接收(i)与第一生物实体子集的在第一组条
件下获得的活动相应的第一数据集合、以及(ii)与第一生物实体子集的
在不同于第一组条件的第二组条件下获得的活动相应的第二数据集
合,其中,所述第一组条件和所述第二组条件与所述表型相关;
(c)用所述处理装置计算与所述第一生物实体子集相应的第一节
点子集的活动度量集合,所述活动度量表示所述第一数据集合与所述
第二数据集合之间的差别;
(d)用所述处理装置基于所述计算因果网络模型和所述活动度量
集合来产生第二节点子集的活动值集合,所述第二节点子集表示促成
所述表型的、但是其活动未被测量的生物实体候选;
(e)用所述处理装置使用机器学习技术来基于所述活动度量集合、
所述活动值集合或这两者来产生用于所述表型的分类器。
2.根据权利要求1所述的计算机化方法,其中,在步骤(e)产生
用于所述表型的分类器包括:
(e1)产生将关于所述第一生物实体子集的活动度量的信息转换为
关于所述第二节点子集的活动值的信息的算子;
(e2)使用所述算子识别所述第二节点子集的子集;和
(e3)将所识别的子集作为输入提供给所述机器学习技术。
3.根据权利要求1-2中的任何一个所述的计算机化方法,其中,
对于多个计算因果网络模型执行步骤(c)和(d),并且将与每个计算因果
网络模型相应的活动值集合聚集成在步骤(e)使用的活动值集合。
4.根据权利要求1-3中的任何一个所述的计算机化方法,其中,
对于多个计算因果网络模型执行步骤(c)、(d)和(e),并且还包括:
(h1)对于每个分类器,识别第二生物实体集合的具有高于阈值的
分类性能统计数据的一个或多个生...
【专利技术属性】
技术研发人员:弗洛里安·马丁,阿兰·塞韦尔,朱丽娅·亨格,曼纽尔·克劳德·派奇,
申请(专利权)人:菲利普莫里斯生产公司,弗洛里安·马丁,阿兰·塞韦尔,朱丽娅·亨格,曼纽尔·克劳德·派奇,
类型:发明
国别省市:瑞士;CH
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。