鉴定化合物的方法技术

技术编号:23194030 阅读:31 留言:0更新日期:2020-01-24 17:21
本公开提供了利用来自核苷酸编码文库(例如,DNA编码文库)的数据集的虚拟筛选方法。这些方法允许对候选化合物与用于开发治疗剂的感兴趣蛋白之间的结合相互作用进行高置信度预测。

Methods for identification of compounds

【技术实现步骤摘要】
【国外来华专利技术】鉴定化合物的方法背景虚拟筛选方法能够扩展给定目标的可用筛选选项,并且可以增加成功优化的可能性。虚拟筛选可以是鉴定将用作优化起点的多个支架的快速且廉价的方法。虚拟筛选的能力通常受限于所使用的实验确定数据集的大小,因为它依赖于与已知实验数据的比较来产生虚拟数据。因此,需要将稳健的计算方法与极大的数据集相结合以在计算预测中产生足够的置信度来代替传统的高通量筛选方法的方法。专利技术概述本公开提供了用于鉴定可用作治疗剂和/或可用作治疗剂开发中优化的起点的化合物的方法。这些方法将用于预测化合物与蛋白之间结合的计算方法与使用核苷酸编码文库(例如DNA编码文库)获得的实验数据的大数据集结合。用核苷酸编码文库产生的数据和计算方法的组合允许候选化合物与感兴趣蛋白之间的结合相互作用的高置信度预测。因此,在一个方面,本公开提供了一种方法,包括以下步骤:(a)在物理计算装置中提供靶蛋白的多个结合相互作用发现(例如,至少250,000个发现),所述物理计算装置具有一组候选化合物(例如,小分子化合物)的表现,其中所述多个结合相互作用发现中的至少50%(例如,至少60%、至少70%、至少80%、至少90%、至少95%、至少99%)代表所述靶蛋白与包含编码化合物身份的核苷酸标记的化合物(例如,DNA编码文库的成员)之间的结合相互作用;(b)使用所述多个结合相互作用发现使用所述计算装置产生所述候选化合物的估计的结合相互作用;和(c)输出能够由最高估计的结合相互作用显示和分级的候选化合物列表。在一些实施方案中,所述多个结合相互作用发现包括至少250,000(例如,至少500,000、至少一百万、至少两百万、至少五百万、至少一千万、至少二千五百万)个结合相互作用发现。在一些实施方案中,通过使包含编码化合物身份的核苷酸标记的多个(例如,至少250,000、至少500,000、至少一百万、至少两百万、至少五百万、至少一千万)化合物与靶蛋白同时(例如,在相同反应容器中同时)接触来确定所述多个结合相互作用发现中的至少50%。例如,在一些实施方案中,在单个实验中在单个反应容器中确定用于产生估计的结合相互作用的DNA编码文库成员的至少50%的结合相互作用发现。在一些实施方案中,所述方法还包括提供一种或多种另外的靶蛋白的一个或多个另外的多个结合相互作用发现,其中所述一个或多个另外的多个结合相互作用发现中的至少50%代表所述另外的靶蛋白与来自与步骤(a)的靶蛋白的所述多个结合相互作用发现的化合物之间的结合相互作用。在一些实施方案中,所述方法还包括提供一个或多个阴性对照实验的一个或多个另外的多个结合相互作用发现,其中所述多个结合相互作用发现中的至少50%代表来自与步骤(a)的靶蛋白的所述多个结合相互作用发现的化合物的阴性对照。在一些实施方案中,所述方法还包括提供一个或多个对照实验的一个或多个另外的多个结合相互作用发现,其中所述多个结合相互作用发现包括具有与步骤(a)的靶蛋白的已知结合相互作用的化合物(例如,已知的抑制剂或天然配体)的结合相互作用发现。在一些实施方案中,所述方法包括通过将化合物或候选化合物与靶蛋白的结合或估计结合与化合物或候选化合物与所述一种或多种另外的靶蛋白和/或阴性对照的结合或估计结合进行比较,产生选择性评分。在一些实施方案中,候选化合物列表能够通过选择性评分显示和分级。在一些实施方案中,所述一种或多种另外的靶蛋白包含所述靶蛋白的突变体。在一些实施方案中,使用化学结构比较例如利用分子表现产生估计的结合相互作用。分子表现包括但不限于基于原子、特征或官能团及其连接性的拓扑表现(例如,指纹、连接表、分子连接性和/或分子图形表现)、静电表现(例如,表面电子)、几何表现(例如,药效团、药效团指纹、基于形状的指纹和/或使用原子、特征或官能团的3D分子坐标)或量子化学表现。在一些实施方案中,使用基于原子、特征或官能团及其连接性的拓扑表现(例如,指纹、连接表、分子连接性和/或分子图形表现)产生估计的结合相互作用。在一些实施方案中,使用静电表现(例如,表面电子)产生估计的结合相互作用。在一些实施方案中,使用几何表现(例如,药效团、药效团指纹、基于形状的指纹和/或使用原子、特征或官能团的3D分子坐标)产生估计的结合相互作用。在一些实施方案中,使用量子化学表现产生估计的结合相互作用。在一些实施方案中,使用化学指纹产生估计的结合相互作用。化学指纹可用于聚集化合物的结构信息和结合相互作用数据,以鉴定指示与靶蛋白结合的结构模式。因此,在一些实施方案中,所述方法还包括(i)提供多种化合物的多个化学指纹(例如,化学指纹如ECFP6、FCFP6、ECFP4、MACCS或具有不同位数(例如,166、512、1024)的摩根/环形指纹);和(ii)在估计的结合相互作用的产生中利用所述多个化学指纹。在一些实施方案中,例如在训练集中,所述多个化学指纹包括包含编码化合物身份的核苷酸标记的化合物中的一种或多种的化学指纹,例如化学指纹是没有核苷酸标记的化合物的结构的表现。在一些实施方案中,例如在预测集中,所述多个化学指纹包括一种或多种候选化合物的化学指纹。在一些实施方案中,化学指纹是ECFP6指纹。在一些实施方案中,所述方法还包括提供这组候选化合物的一个或多个性质发现(例如,分子量和/或clogP)。在一些实施方案中,利用所述一个或多个性质发现产生估计的结合相互作用。在一些实施方案中,候选化合物列表能够由所述一个或多个性质发现显示和分级在一些实施方案中,所述方法还包括通过互联网或向显示设备发送候选化合物列表。在一些实施方案中,物理计算装置通过互联网访问和操作。在一些实施方案中,所述方法还包括对候选化合物的每个估计的结合相互作用产生可信度评分,其中所述可信度评分使用所述候选化合物与来自步骤(a)的靶蛋白的所述多个结合相互作用的一种或多种化合物之间的化学结构比较(例如,主成分分析)来产生。例如,在一些实施方案中,通过比较候选化合物与由来自步骤(a)的所述多个结合相互作用的化合物所定义的化学空间,通过确定候选化合物的化学空间的距离如由主组分分析定义的维度上的欧几里得距离,来产生可信度评分。在一些实施方案中,候选化合物列表能够由候选化合物的估计的结合相互作用的可信度评分显示和分级。在一些实施方案中,所述方法还包括(d)合成来自候选化合物列表的一种或多种所述候选化合物。在一些实施方案中,所述方法还包括(e)使一种或多种合成的候选化合物与靶蛋白接触以确定一种或多种实验性结合相互作用。在一方面,本公开提供了一种计算机可读介质,其上存储有用于指导物理计算装置以实施包括以下步骤的方法的可执行指令:(a)在物理计算装置中提供靶蛋白的多个结合相互作用发现,所述物理计算装置具有一组候选化合物的表现,其中所述多个结合相互作用发现中的至少90%代表所述靶蛋白与包含编码化合物身份的核苷酸标记的化合物之间的结合相互作用;(b)使用所述多个结合相互作用发现使用所述计算装置以产生所述候选化合物的估计的结合相互作用;和(c)输出能够由最高估计的结合相互作用本文档来自技高网...

【技术保护点】
1.一种方法,其包括以下步骤:/n(a)在物理计算装置中提供靶蛋白的多个结合相互作用发现,所述物理计算装置具有一组候选化合物的表现,/n其中所述多个结合相互作用发现中的至少90%代表所述靶蛋白与包含编码化合物身份的核苷酸标记的化合物之间的结合相互作用;/n(b)使用所述多个结合相互作用发现使用所述计算装置以产生所述候选化合物的估计的结合相互作用;和/n(c)输出能够由最高估计的结合相互作用显示和分级的候选化合物列表。/n

【技术特征摘要】
【国外来华专利技术】20170418 US 62/4866921.一种方法,其包括以下步骤:
(a)在物理计算装置中提供靶蛋白的多个结合相互作用发现,所述物理计算装置具有一组候选化合物的表现,
其中所述多个结合相互作用发现中的至少90%代表所述靶蛋白与包含编码化合物身份的核苷酸标记的化合物之间的结合相互作用;
(b)使用所述多个结合相互作用发现使用所述计算装置以产生所述候选化合物的估计的结合相互作用;和
(c)输出能够由最高估计的结合相互作用显示和分级的候选化合物列表。


2.根据权利要求1所述的方法,其中所述多个结合相互作用发现包括至少一百万个结合相互作用发现。


3.根据权利要求1或2所述的方法,其中所述多个结合相互作用发现中的至少95%代表所述靶蛋白与包含编码化合物身份的核苷酸标记的化合物之间的结合相互作用。


4.根据权利要求1至3中任一项所述的方法,其中所述多个结合相互作用发现中的至少99%代表所述靶蛋白与包含编码化合物身份的核苷酸标记的化合物之间的结合相互作用。


5.根据权利要求1至4中任一项所述的方法,其中所述多个结合相互作用发现中的至少50%通过使包含编码化合物身份的核苷酸标记的多个化合物同时与靶蛋白接触来确定。


6.根据权利要求1至5中任一项所述的方法,其中所述方法还包括提供一种或多种另外的靶蛋白的一个或多个另外的多个结合相互作用发现,其中所述多个结合相互作用发现中的至少50%代表所述另外的靶蛋白与来自与所述靶蛋白的所述多个结合相互作用的化合物之间的结合相互作用。


7.根据权利要求6所述的方法,其中所述候选化合物列表能够由候选化合物相对于所述一种或多种另外的靶蛋白对所述靶蛋白的选择性来显示和分级。


8.根据权利要求6或7所述的方法,其中所述一种或多种另外的靶蛋白包含所述靶蛋白的突变体。


9.根据权利要求1至8中任一项所述的方法,其中所述方法还包括提供一个或多个阴性对照实验的一个或多个另外的多个结合相互作用发现,其中所述多个结合相互作用发现中的至少50%代表来自与所述靶蛋白的所述多个结合相互作用的化合物的阴性对照实验。


10.根据权利要求1至9中任一项所述的方法,其中所述方法还包括通过互联网或向显示装置传送候选化合物列表。


11.根据权利要求1至10中任一项所述的方法,其中所述物理计算装置通过互联网访问和操作。


12.根据权利要求1至11中任一项所述的方法,其中所述估计的结合相互作用使用化学结构比较来产生。


13.根据权利要求12所述的方法,其中所述化学结构比较利用分子表现。


14.根据权利要求13所述的方法,其中所述分子表现包括化学指纹...

【专利技术属性】
技术研发人员:EA西格尔L薛CJ马尔赫恩DJ莫西亚
申请(专利权)人:X化学有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1