一种用于生物医学的全链条数据分析系统技术方案

技术编号:29590604 阅读:64 留言:0更新日期:2021-08-06 19:51
本发明专利技术涉及一种用于生物医学的全链条数据分析系统,包括与个人中心模块分别连接的用户管理系统、仓储管理系统和在线分析系统,仓储管理系统包括代码仓储模块、软件仓储模块和数据仓储模块,在线分析系统设有工作流应用发布子系统,调用代码仓储模块和软件仓储模块中的代码和软件,对数据仓储模块中储存的数据或接收到的在线上传的数据进行分析,并输出分析结果。与现有技术相比,本发明专利技术具有分析环节的纵向覆盖度广、分析对象的横向覆盖度广、开发复杂度低、良好的可扩展性以及可在线运行等优点。

【技术实现步骤摘要】
一种用于生物医学的全链条数据分析系统
本专利技术涉及数据分析
,尤其是涉及一种用于生物医学的全链条数据分析系统。
技术介绍
随着高通量组学技术在生命科学领域应用的兴起,人类在分子水平对疾病现象的认识得到了空前发展,“精准医学”概念的提出更加速了组学分析与临床研究的结合。如何高效地利用患者的分子组学和临床信息数据,个体化地进行精细疾病分类及精准医疗干预,已成为生物信息学领域的研究热点。为了对海量遗传资源进行存储、管理、共享与应用,开源生物医学数据分析系统应运而生。目前,生物医学分析系统根据其用途可分为三类:数据存储平台、生信工具平台和在线分析平台。数据存储平台的用途是存储海量多元异构的生物医学大数据,具有代表性的有美国国立生物技术信息中心(NCBI)的核酸序列数据库(SRA)和基因表达数据库(GEO),欧洲生物信息学研究所(EBI)的ENA数据库,以及中国生命与健康大数据中心(BIGD)的GSA数据库,生物信息资源存储平台是数据挖掘与整合分析的基础。工具平台则是生物医学数据分析领域内软件或代码的收录集合,通常提供功能分类、使用说明和下载链接等,且根据使用人数和影响力进行排名,如生物软件的集合网站Omictools和全领域的软件项目托管平台GitHub。在线分析平台是实现单一或集成特定功能的数据分析系统,分为面向普通用户的一键式分析平台和面向开发者的组合式流程搭建系统,操作难易程度不一,在一定程度上降低了分析人员的门槛,使得非生信专业的研究者或医生可以从数据中分析获得有价值的信息,如美国的Galaxy生物信息分析平台、中国华大基因的BGIonline平台,以及成百上千的轻量级网页端生信分析工具。虽然目前现有技术中已经有如上针对生物医学数据的全方位的系统,但是由于缺乏较为完善的医学信息和分子组学数据技术体系设计,以上平台往往无法同时兼备高效传输、存储、流程开发和在线计算分析,导致各个平台之间、与研究项目之间都是离断和孤立的,在目前在生物医学项目的工程应用性不高。因此仍需在关键架构体系上进行创新,在系统的开放性、标准化和信息流共享机制等方面获得突破。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种用于生物医学的全链条数据分析系统,通过调用相应ID实现跨平台互联,允许用户自由开发组合搭建,涵盖整个生物医学数据分析的各个环节。本专利技术的目的可以通过以下技术方案来实现:一种用于生物医学的全链条数据分析系统,包括与个人中心模块分别连接的用户管理系统、仓储管理系统和在线分析系统,所述仓储管理系统包括代码仓储模块、软件仓储模块和数据仓储模块,所述在线分析系统设有工作流应用发布子系统,调用代码仓储模块和软件仓储模块中的代码和软件,对数据仓储模块中储存的数据或接收到的在线上传的数据进行分析,并输出分析结果所述用户管理系统的功能包括对注册信息进行审核,审核通过后在个人中心模块添加所述注册信息对应的用户ID,所述数据分析系统的所有系统和模块对完成审核的用户ID全面开放。进一步地,所述注册信息包括邮箱、姓名和单位基本信息。所述仓储管理系统通过代码仓储模块和软件仓储模块将代码和软件进行封装分类管理。所述代码仓储模块包括用户上传的代码和代码基本信息,所述代码和代码基本信息通过工作流应用发布子系统发布后由在线分析系统进行在线运行。所述软件仓储模块包括用户上传的软件镜像和相应的镜像信息,通过所述软件镜像和镜像信息提供所述代码仓储模块的运行环境。所述数据仓储模块中储存的数据具体包括用户上传的待分析的原始数据和相应的数据描述信息。所述个人中心模块的功能包括对所述仓储管理系统和在线分析系统的分析结果进行管理操作。进一步地,所述个人中心模块中的管理操作具体包括增加操作、删除操作、查询操作和修改操作。所述在线分析系统支持高效传输和隐私保护。所述在线分析系统的分析模式包括组学数据分析、医学信息分析、多层次数据整合分析和可视化分析。所述在线分析系统的功能还包括对所述工作流应用发布子系统的参数进行调整。所述在线分析系统连接有高性能计算平台,通过所述高性能计算平台的高性能计算集群进行在线数据分析。与现有技术相比,本专利技术具有以下有益效果:1.本专利技术分析环节的纵向覆盖度广,涵盖了生物医学数据分析的所有环节,集合了分析所需的数据、代码、软件到同一系统,用户无需在每个环节分别寻找相应的平台去使用,因此相较于目前现有的生物医学数据分析系统,覆盖面更全,用户受众更广。2.本专利技术分析对象的横向覆盖度广,顶层架构设计的面向领域,除了现有平台所包括的生物信息相关资源外,还满足了医学信息学、医学影像分析的多层次数据分析需求,拓宽了分析对象的领域边界,覆盖了日益增长的医学数据分析模块。3.本专利技术对开发者用户友好,将生物医学数据分析领域的不同层面的数据、代码、软件统一集中在同一系统,各个系统既可独立分类管理,同时又在工作流模块实现串联互通,提供了一体化的开发环境,因此降低了用户的开发复杂度,同时减少了冗余开发。4.本专利技术采用了用户开放式开发架构理念,从根本上赋予了用户搭建流程的极高自由度,随着生物医学数据分析领域技术的发展,可以更灵活、迅速地应对多元的分析目的和资源,因此本系统在现有分类架构的基础上,具有良好的可扩展性和强大潜力。5.本专利技术所有收录的工作流均支持在线运行,由于其包装了代码和固定版本的软件运行环境,保障了工作流的可重复性,加上高性能计算平台的资源调度方案,因此可以更直接和客观地评价流程的速度、易用性等性质。附图说明图1为本专利技术的结构示意图;图2为本专利技术实施例中的操作流程示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。实施例如图1所示,一种用于生物医学的全链条数据分析系统,包括与个人中心模块分别连接的用户管理系统、仓储管理系统和在线分析系统,仓储管理系统包括代码仓储模块、软件仓储模块和数据仓储模块,在线分析系统设有工作流应用发布子系统,调用代码仓储模块和软件仓储模块中的代码和软件,对数据仓储模块中储存的数据或接收到的在线上传的数据进行分析,并输出分析结果本实施例中,数据分析系统由高性能计算平台作为支撑,底层资源支持包括云存储服务器、Web服务器和计算资源调度系统。用户管理系统的功能包括对注册信息进行审核,审核通过后在个人中心模块添加注册信息对应的用户ID,数据分析系统的所有系统和模块对完成审核的用户ID全面开放。注册信息包括邮箱、姓名和单位基本信息。本实施例中,用户管理系统基于Web服务器,由Web客户端作为与用户交互的最前端展示层,Web客户端的功能包括Http请求、获取数据、视图解析和返回页面。仓储管理系统通过代码仓储模块和软件仓储模块将代码和软件进行封本文档来自技高网
...

【技术保护点】
1.一种用于生物医学的全链条数据分析系统,其特征在于,包括与个人中心模块分别连接的用户管理系统、仓储管理系统和在线分析系统,所述仓储管理系统包括代码仓储模块、软件仓储模块和数据仓储模块,所述在线分析系统设有工作流应用发布子系统,调用代码仓储模块和软件仓储模块中的代码和软件,对数据仓储模块中储存的数据或接收到的在线上传的数据进行分析,并输出分析结果。/n

【技术特征摘要】
1.一种用于生物医学的全链条数据分析系统,其特征在于,包括与个人中心模块分别连接的用户管理系统、仓储管理系统和在线分析系统,所述仓储管理系统包括代码仓储模块、软件仓储模块和数据仓储模块,所述在线分析系统设有工作流应用发布子系统,调用代码仓储模块和软件仓储模块中的代码和软件,对数据仓储模块中储存的数据或接收到的在线上传的数据进行分析,并输出分析结果。


2.根据权利要求1所述的一种用于生物医学的全链条数据分析系统,其特征在于,所述用户管理系统的功能包括对注册信息进行审核,审核通过后在个人中心模块添加所述注册信息对应的用户ID。


3.根据权利要求2所述的一种用于生物医学的全链条数据分析系统,其特征在于,所述注册信息包括邮箱、姓名和单位基本信息。


4.根据权利要求1所述的一种用于生物医学的全链条数据分析系统,其特征在于,所述代码仓储模块包括用户上传的代码和代码基本信息,所述代码和代码基本信息通过工作流应用发布子系统发布后,由在线分析系统进行在线运行。


5.根据权利要求1所述的一种用于生物医学的全链条数据分析系统,其特征在...

【专利技术属性】
技术研发人员:吕晖张悦宁任永永程志伟李磊杰顾坚磊王晓雷
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1