当前位置: 首页 > 专利查询>宝洁公司专利>正文

用于鉴定具有期望生物活性的剂的方法技术

技术编号:10564440 阅读:185 留言:0更新日期:2014-10-22 16:27
本发明专利技术提供了用于鉴定具有期望生物活性的剂的方法、系统和装置。具体地,所述方法、系统和装置鉴定多种剂之间和/或一种或多种剂与所关注状况之间的功能关系。多个实验批次的数据被归一化,导致批次效应,并且所述经调节的数据用于创建投射矩阵或函数。所述投射矩阵用于将所述数据投射到投射空间中,其中可确定在查询剂或查询状况和多种候选剂之间的距离。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术提供了、系统和装置。具体地,所述方法、系统和装置鉴定多种剂之间和/或一种或多种剂与所关注状况之间的功能关系。多个实验批次的数据被归一化,导致批次效应,并且所述经调节的数据用于创建投射矩阵或函数。所述投射矩阵用于将所述数据投射到投射空间中,其中可确定在查询剂或查询状况和多种候选剂之间的距离。【专利说明】
技术介绍
连接映射是一种熟知的假说产生和测试工具,在运筹学、计算机联网和电信领域 具有成功的应用。人类基因组计划(Human Genome Project)的进展和完成与平行发展的 极高通量的高密度DNA微阵列技术导致多个基因数据库的产生。同时,经由计算机方法如 分子建模和对接研究对于新药物活性物质的探索刺激了潜在的小分子活性物质大文库的 产生。关联疾病与遗传特征图、遗传特征图与药物、和疾病与药物的信息量以指数增加,并 且应用连接映射作为假说测试工具在药物科学中成熟了。 可精确地测定之前未表征的基因功能、和药剂的潜在靶标可通过连接映射在药物 处理细胞的基因表达谱数据库中鉴定的一般观念首先在2000年随着T. R. Hughes等人的开 创性论文("Functional discovery via a compendium of expression profiles,'Cell 102,109-126(2000))的公布而被提出,随后不久随着Justin Lamb和MIT的研究者的 The Connectivity Map Project ( ^Connectivity Map:Gene Expression Signatures to Connect Small Molecules,Genes,and Disease,,'Science,Vol 313(2006)而被提出。在 2006年,Lamb的团队开始公布"C-Map"构造的结构、用于创建第一代C-Map的基因表达谱 的参考集合的形成、和持续大规模C-Map项目的启动的详细摘要,其可用的支持材料超链 接为 http://www. sciencemag. org/content/313/5795/1929/suppl/DCl。 现代连接映射具有严密的数学支持并且受到现代计算机技术的辅助,已经产生了 得到证实的医学成就,鉴定了用于治疗多种疾病(包括癌症)的新剂。尽管如此,某些限 制性的假设挑战连接映射对于复合酶起源的疾病或特征在于各种不同的和常常明显不相 关的细胞表型表现的综合征状况的应用。根据Lamb,构建可用的连接映射的挑战在于输 入参考数据的选择,其允许在查询时生成临床显著的并且可用的输出。对于Lamb的药物 相关的C-Map,强结合包括引用结合,并且强结合是鉴定为hits的期望输出。尽管注意到 高通量、高密度表达谱平台的有益效果,Lamb仍警告说:"ven this much firepower is insufficient to enable the analysis of every one of the estimated 200 different cell types exposed to every known perturbagen at every possible concentration for every possible duration··· compromises are therefore required,'(第 54 页,第 3行,最后一段)。从而,Lamb将他的C-Map限制为来自非常少数量的确定细胞系的数据。 Lamb也强调如果参考连接是极其敏感的并且同时难以检测(弱),会遇到特别的困难,并且 Lamb对于最小化多个扩散的结合采取了妥协。 基于标记的C-Map查询通过鉴定对应于响应例如所关注状况的显著上调或下调 的基因的探针组列表而进行。将探针组的这种列表称为状况标记。该标记对于C-Map数据 库计分以鉴定最好地复制或逆反标记的剂。基于标记的查询方法已经被成功地用于鉴定许 多新技术。然而,所关注的状况可能涉及复杂的过程,其涉及多种已知的和未知的外部和内 部因素,并且对此类因素的响应可能随时间而变化。这与在药物筛选方法中通常观察到的 结果相反,其中研究特定的对象、基因、或机制。假定细胞的复杂性响应于刺激,产生生物状 况的准确标记并且区分可归于干扰原(perturbagen)或状况的基因表达数据与背景基因 表达数据可能是挑战性的。因此,对于基于标记的查询,查询标记应被仔细地溯源,因为预 测值可能取决于基因标记的质量。 能够影响查询标记的一个因素是标记中包括的基因数量。必须选择足够数量的基 因以反映与对干扰原或状况的细胞响应相关联的显著和关键生物学。然而,基因组优选地 不包括表现出统计意义上显著的表达波动(由于随机机率)的大量基因。对于一些数据架 构和连接映射,过少的基因(例如多于20, 000个测量探针组中的500个探针组)可能产生 对于最高计分实例不稳定的标记;查询标记小的改变可能导致最高计分实例中的显著差异 (即,查询标记中小的改变可能显著改变查询结果)。与基于标记的C-Map查询的探针的子 集的选择相关联的挑战限制了该技术在一些情况下的效果。
技术实现思路
本专利技术提供用于鉴定具有期望生物活性和/或作用机制的剂的新型方法、设备、 和系统。具体地,本公开提供一种工具,用于测试和产生关于剂(即,"干扰原")和基于经 多个批次收集的基因表达数据的生物状况的假说。本专利技术的方法、设备、和系统适于例如鉴 定在不同状况的处理中有效的剂。 本【具体实施方式】描述了多个实施例,它们广泛地包括用于确定多种干扰原之间的 关系的方法、设备、和系统。本【具体实施方式】也描述了多个实施例,它们广泛地包括用于确 定所关注的生物状况和一种或多种干扰原之间的关系的方法、设备、和系统。该方法可用于 鉴定干扰原,其影响在不详细了解造成该状况的生物过程情况下的生物状况的表现、与该 状况相关联的全部基因、或与该状况相关联的细胞类型。 用于构建数据架构的计算机实现的方法保存在计算机可读存储介质中,其以通信 方式联接至处理器。该方法包括从计算机可读介质的第一数据库中检索多个实例。每个实 例对应于多个批次之一且包括多个探针中的每个的表达值。多个批次中每个产生多个对照 实例和多个测试实例,所述多个对照实例对应于与对照相关的基因表达谱(GEP),所述多个 测试实例对应于与干扰原相关的GEP。该方法也包括从多个探针中选择探针的子集(其可 为全部探针)。该方法还包括利用处理器来确定每个批次的平均对照GEP。平均对照GEP 仅包括选择的探针的子集,并且对于每个探针的子集通过计算探针经多个对照实例的平均 表达值来确定。另外,该方法包括利用处理器确定批次中每个测试实例经调节的GEP。每个 经调节的GEP对于每个探针的子集通过确定每批测试实例中的表达值和对照实例中探针 的平均表达值之间的差异来确定。另外,该方法包括在计算机可读介质的第二数据库中存 储多个经调节的实例,每个经调节的实例对应于在全部多个批次中由全部测试实例确定的 经调节的GEP之一。 数据结构包括经调节的GEP矩阵。经调节的本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201380009808.html" title="用于鉴定具有期望生物活性的剂的方法原文来自X技术">用于鉴定具有期望生物活性的剂的方法</a>

【技术保护点】
一种计算机实现的方法,所述计算机实现的方法用于构建存储在计算机可读存储介质中的数据架构,所述计算机可读存储介质以通信方式联接至处理器,所述方法包括:从所述计算机可读介质的第一数据库中检索多个实例,每个实例对应于多个批次之一且包括多个探针中的每个的表达值,所述多个批次中的每个产生对应于与对照相关的基因表达谱(GEP)的多个对照实例和对应于与干扰原相关的GEP的多个测试实例;从所述多个探针中选择探针的子集;使用所述处理器来确定每个批次的平均对照GEP,所述平均对照GEP仅包括所选择的探针的子集且通过针对所述探针的子集中的每个计算在所述多个对照实例中探针的平均表达值来确定;使用所述处理器来确定在某一批次中每个测试实例的经调节的GEP,每个经调节的GEP通过针对所述探针的子集中的每个确定所述批次的所述测试实例中的探针的表达值与所述对照实例中的探针的平均表达值之间的差异来确定;以及在所述计算机可读介质的第二数据库中存储多个经调节的实例,每个经调节的实例对应于在全部所述多个批次中由全部所述测试实例确定的经调节的GEP之一。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:徐隽R·M·凯恩卡彦
申请(专利权)人:宝洁公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1