【技术实现步骤摘要】
【国外来华专利技术】二分图结构
本申请总体上涉及存储的数据的监管(curation)和结构及对其的高效使用。
技术介绍
通常,信息存储在关系数据库中,关系数据库详细描述了数据库中多个对象之间的关系。但是,该信息可以更高效地存储在二分图结构中。
技术实现思路
本文公开了用于高效地存储数据的二分图结构的描述。二分图结构的示例用途是用作表示生化信息的二分生化数据库,生化信息被组织为包含以下两类节点的二分图:分子和过程。每个分子节点表示分子或由一个或多个生化过程所利用的化学元素。分子节点可以表示小分子,例如水、二氧化碳、质子等,也可以表示大分子,例如DNA、RNA和蛋白质。分子节点包含描述该分子的多个元数据字段,包括但不限于分子名称、分子式、核酸序列、氨基酸序列、大分子结构、化学修饰(例如甲基化、磷酸化等)、电子电荷,化学或物理属性(pKa、熔点、溶解度等)以及组分分子。另外,一些非物理属性可以包括在分子节点的元数据中,包括途径信息、药物相互作用、3D结构等。分子节点不必包含每个前述元数据字段的信息。而是,使用在生化环境中与分子的相互作用有关的字段来描述每个分子。例如,小分子最好用其化学组成来描述,因此核酸序列和大分子结构的字段将不适用。另一方面,充当酶催化剂的蛋白质可能在大分子结构、氨基酸序列和结合位点字段中包含信息,但不包含组成信息,因为它在生化环境中对于分子的功能可能是可变的或不重要的。过程节点描述了生化环境中的分子作用,包括但不限于化学反应、调节相互作用、结合、转运或其他作用。如同分子节点,过程节点包括许多描 ...
【技术保护点】
1.一种用于存储生化信息的系统,包括:/n非暂时性计算机可读存储介质;/n处理器,执行指令以将所述非暂时性计算机可读存储介质配置为存储被结构化为二分图的数据库,该数据库包括:/n多个分子节点,其中,每个分子节点表示生化环境中的分子,并且其中,每个分子节点包括描述所述分子的多个分子元数据字段;/n多个过程节点,其中,每个过程节点表示在生化环境中发生的过程,并且其中,每个过程节点包括多个过程元数据字段,所述多个过程元数据字段至少包括角色字段,其中,所述角色字段定义在所述过程中分子的角色;和/n多个边,其中,每个边将分子节点与过程节点相关联,并且其中,每个边表征在由相关联的过程节点表示的过程中由相关联的分子节点表示的分子的角色,其中,所述边包括在所述过程中所述分子的化学计量系数。/n
【技术特征摘要】
【国外来华专利技术】20170901 US 15/694,5061.一种用于存储生化信息的系统,包括:
非暂时性计算机可读存储介质;
处理器,执行指令以将所述非暂时性计算机可读存储介质配置为存储被结构化为二分图的数据库,该数据库包括:
多个分子节点,其中,每个分子节点表示生化环境中的分子,并且其中,每个分子节点包括描述所述分子的多个分子元数据字段;
多个过程节点,其中,每个过程节点表示在生化环境中发生的过程,并且其中,每个过程节点包括多个过程元数据字段,所述多个过程元数据字段至少包括角色字段,其中,所述角色字段定义在所述过程中分子的角色;和
多个边,其中,每个边将分子节点与过程节点相关联,并且其中,每个边表征在由相关联的过程节点表示的过程中由相关联的分子节点表示的分子的角色,其中,所述边包括在所述过程中所述分子的化学计量系数。
2.根据权利要求1所述的系统,其中,所述分子元数据字段至少包括分子组成字段。
3.根据权利要求1所述的系统,其中,所述分子元数据字段包括以下中的一个或多个:
分子名称字段,
分子类型字段,
分子式字段,
序列字段,
电荷字段,
分子属性字段,或
组分分子字段。
4.根据权利要求1所述的系统,其中,所述角色被表征为以下之一:
底物,
反应物,
催化剂,
辅因子,或
产物。
5.根据权利要求1所述的系统,其中,所述多个分子节点、所述多个过程节点和所述多个边存储在非SQL图数据库中。
6.根据权利要求1所述的系统,其中,所述多个分子节点中的一个或多个表示一个或多个物理环境(settings)中的单个分子。
7.根据权利要求1所述的系统,其中,所述多个过程节点表示化学过程和物理过程。
8.一种非暂时性计算机可读存储介质,存储指令以配置被结构化为二分图的数据库,所述数据库包括:
多个分子节点,其中,每个分子节点表示生化环境中的分子,并且其中,每个分子节点包括描述所述分子的多个分子元数据字段;
多个过程节点,其中,每个过程节点表示在生化环境中发生的过程,并且其中,每个过程节点包括多个过程元数据字段,所述多个过程元数据字段至少包括角色字段,其中,所述角色字段定义在所述过程中分子的角色;和
多个边,其中,每个边将分子节点与过程节点相关联,并且其中,每个边表征在由相关联的过程节点表示的过程中由相关联的分子节点表示的分子的角色,其中,所述边包括在所述过程中所述分子的化学计量系数。
9.根据权利要求8所述的非暂时性计算机可读存储介质,其中,所述分子元数据字段...
【专利技术属性】
技术研发人员:J汤普森,F鲁索,
申请(专利权)人:X开发有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。