基于病理及活体组织临床诊断大数据的疾病类型判别方法技术

技术编号:28628034 阅读:27 留言:0更新日期:2021-05-28 16:24
本发明专利技术公开了一种基于病理及活体组织临床诊断大数据的疾病类型判别方法,该方法包含:通过质谱仪厂家工作站或者数据转换功能完成质谱仪数据到质谱成像数据的转换,基于人体的内源性代谢物质谱数据以及化合物检索匹配算法,通过代谢物化合物数据库实现对质谱图中内源性化合物的自动化标注和定性分析,通过大数据方式对庞大、复杂的人体代谢组质谱成像样本进行有效管理和开展数据挖掘及建模,从而汇集人类疾病质谱成像数据,进行质谱成像的自动化数据处理及分析,采用不同类型的质谱成像数据,生成设计的机器学习算法,用于为用户完成样本分类、疾病标志物自动发现、疾病预测模型与分型模型训练及维护、模型训练算法筛选及优化、模型发布和应用。

【技术实现步骤摘要】
基于病理及活体组织临床诊断大数据的疾病类型判别方法
本专利技术涉及人工智能的大数据疾病分析
,具体来说,涉及一种基于病理及活体组织临床诊断大数据的疾病类型判别方法。
技术介绍
质谱分析技术是精密仪器分析领域的最前沿技术之一,近年来在临床检测领域也得到了快速发展,临床质谱应用范围广阔,可在生化免疫、药物代谢、微生物、病理诊断、分子等多领域对传统方法学进行替代,譬如与基因测序相比,质谱适用于各类分子的检测,包括核酸、多肽等生物大分子和代谢产物、激素、维生素等生物小分子,以及微量无机元素,能实现上千种标志物的同时定性和定量,与现有方法相比,具有检测效率高、标志物覆盖广、分析成本低,以及分析过程自动化程度高等优点,目前国内外质谱在临床检测的应用仍处于起步阶段,应用主要集中在基于液相色谱串联质谱的药物浓度监测、新生儿缺陷筛查、维生素和激素检测等项目上,从检测指标的深度和广度而言相对仍属于早期阶段。利用质谱实现分子成像最早是由范德堡大学(VanderbiltUniversity)的RichardCaprioli等在1997年提出的,分子成像(molecularimaging)是运用影像学手段显示组织水平、细胞和亚细胞水平的特定分子,反映活体状态下分子水平变化,对其生物学行为在影像方面进行定性和定量研究的科学,质谱成像技术在医学研究、生物学研究、药物研究等诸多领域有着巨大的价值,已经成为质谱研究的一大热点,基于MALDI、AP-MALDI、DESI、SIMS等离子源的质谱成像技术飞速发展,通过高分辨质谱仪所采集的单个MSI样品数据通常达到数GB乃至上百GB规模,如何针对携带着海量信息的质谱图像进行高通量、高精度的数据处理和人工智能识别变得愈发困难,此外,还存在各类商业化仪器所获得的原始数据兼容性较差,以及通用型高性能工作站软件的匮乏等问题,因此,相关数据处理软件技术已成为目前MSI以及MSI原位代谢组学分析技术发展和推广过程中亟待突破的热点领域。作为最新一代的分子诊断及精准医学检测技术,基于代谢组学的质谱成像技术可一次性获得与疾病发生、发展进程相关性的人体至少2000个生物标志物定性、定量信息及其空间分布信息,代谢组学数据量庞大且解析复杂,加之人群个体差异巨大,必须借助人类代谢组大数据挖掘和机器学习建模的方式,实现疾病早筛和早诊智能模型的系列化开发,谷歌公司认为,要攻克重大疾病如癌症、以及老龄化社会相关问题,必须利用大数据相关技术,谷歌的经验证明,在现有技术条件下,将样本数量扩大100倍甚至更高,则预测结果将发生质的改变,因此,建立人体代谢组大数据系统,通过标准化的数据采集、管理和挖掘模式扩大样本分析规模,实现围绕质谱成像数据的高精度机器学习模型的开发和应用,是当前本领域亟需突破的关键技术瓶颈之一。在质谱成像与临床医学诊断的结合研究中,对病理组织及活体组织的分子影像识别是质谱成像一个重要领域,随着现代医学科学技术的飞速发展,各种先进的设备在疾病诊断中广泛应用,但最终的诊断仍依靠病理诊断及病理学家的经验判别,其中苏木精-伊红(H&E)病理切片染色是目前主流的病理诊断方法,但组织内构成蛋白质的氨基酸的种类复杂,染色液的pH值、HE切片质量的好坏等因素也都会直接影响病理诊断结论,而依靠专业人员制备大量优质的切片非常困难,更遑论需要富有经验的病理学家对HE染色切片进行专业的病理信息解读,此外,手术中的冰冻病理诊断也是目前临床常用的肿瘤等的辅助诊断方式,同样存在结果不可靠,误诊率较高等缺点,以肿瘤等为代表的重大疾病的病理诊断为例,随着检查手段及方法的不断提高,癌症诊断的正确率逐渐提高,但仍有很大一部分肿瘤不具备典型的影像学特点,诊断困难,常规诊断需要临床、影像及病理三结合,其中,病理诊断对治疗方案的选择起着关键作用,穿刺活检是获取病理诊断的主要途径,但是穿刺以及手术中的冰冻病理取样不可避免的会造成患者潜在的出血及神经损伤等高危风险,因此利用质谱成像技术进行术前、术中、术后的病理及活体组织的辅助诊断,可较好的替代现有影像学及病理检查手段,因此基于(癌症)病理及活体组织大数据的质谱成像分析方法可发挥积极作用,因此利用质谱成像技术开展非染色的病理检测及组织活体检测,并结合疾病大数据建模的方式开展对于疾病分型的人工智能判别和预测,从而代替HE病理染色技术及术中冷冻病理诊断等方法,为医学临床的疾病与病理诊断提供最新的基于质谱成像技术的智能化解决方案。综上所述,基于病理及活体组织质谱成像大数据的分析机制和人工智能方法的缺乏,目前已成为制约其在疾病分型预测、数字化医疗和精准医疗中进一步发展的关键问题,本申请提出了通过对质谱成像分析对病理及活体组织信息的深度挖掘和特征提取,以大样本方式开展质谱成像数据的机器学习和模式识别,从而形成基于样本数据库的一站式、自动化的模型训练和预测机制,该预测机制将质谱成像分析和临床需求紧密结合,为以癌症为代表的重大疾病的分型预测,术前、术中、术后辅助分析,以及精准用药方案等人类健康领域的重要应用方向,提供大数据技术支撑和系统解决方案。
技术实现思路
针对相关技术中的上述技术问题,本专利技术提出一种基于病理及活体组织临床诊断大数据的疾病类型判别方法,能够解决现有技术中携带海量信息的质谱图处理困难的技术问题,以及填补本领域高性能质谱成像工作的空白。为实现上述技术目的,本专利技术的技术方案是这样实现的:一种基于病理及活体组织临床诊断大数据的疾病类型判别方法,该方法包含以下步骤:S1质谱仪器数据交换,通过质谱仪厂家工作站或者数据转换功能完成质谱仪数据到质谱成像数据的转换,支持导入各主流质谱仪器厂家的质谱数据;S2代谢物化合物数据库,基于人体的内源性代谢物质谱数据以及化合物检索匹配算法,通过代谢物化合物数据库实现对质谱图中内源性化合物的自动化标注和定性分析,其中,所述代谢物化合物数据库能够匹配多种化合物检索算法,进一步包含:分析条件精准匹配、动态加合离子匹配、质谱同位素匹配、保留时间匹配、一级质谱匹配、二级质谱匹配、离子淌度匹配、代谢通路匹配、非靶向匹配;S3质谱成像代谢组学组织样本数据库,该数据库由临床生物样本库及实验动物模型生物样本库组成,通过大数据方式对庞大、复杂的人体代谢组质谱成像样本进行有效管理和开展数据挖掘及建模,从而收载人类疾病质谱成像数据;S4质谱成像数据处理工作站,进行质谱成像的自动化数据处理及分析,该工作站用于数据导入预处理、质谱图像重建、质谱目标选区提取、光学图像匹配、质谱图像定量分析;S5质谱成像数据机器学习算法,采用不同类型的质谱成像数据,根据所设计的质谱成像数据机器学习算法,用于实现基于病理及活体组织样本分类、疾病标志物自动发现、疾病预测模型与疾病分型模型训练及维护、模型训练算法筛选及优化、未知样本预测、模型发布与应用。进一步地,所述S2中代谢物化合物数据库,进一步包含:通过标准代谢物质谱信息实物的检测结果,测定2000个代谢物的质谱信息,并排除外源性化合物的干扰,对代谢物化合物数据库进行动态编辑和扩充,运用大数据匹配的方式,提高代本文档来自技高网
...

【技术保护点】
1.一种基于病理及活体组织临床诊断大数据的疾病类型判别方法,其特征在于,该方法包括以下步骤:/nS1 质谱仪器数据交换,通过质谱仪厂家工作站或者数据转换功能完成质谱仪数据到质谱成像数据的转换,支持导入各主流质谱仪器厂家的质谱数据;/nS2 代谢物化合物数据库,基于人体的内源性代谢物质谱数据以及化合物检索匹配算法,通过代谢物化合物数据库实现对质谱图中内源性化合物的自动化标注和定性分析,其中,所述代谢物化合物数据库能够匹配多种化合物检索算法,进一步包含:分析条件精准匹配、动态加合离子匹配、质谱同位素匹配、保留时间匹配、一级质谱匹配、二级质谱匹配、离子淌度匹配、代谢通路匹配、非靶向匹配;/nS3 质谱成像代谢组学组织样本数据库,该数据库由临床生物样本库及实验动物模型生物样本库组成,通过大数据方式对庞大、复杂的人体代谢组质谱成像样本进行有效管理和开展数据挖掘及建模,从而汇集人类疾病质谱成像数据;/nS4 质谱成像数据处理工作站,进行质谱成像的自动化数据处理及分析,该工作站用于数据导入预处理、质谱图像重建、质谱目标选区提取、光学图像匹配、质谱图像定量分析;/nS5 质谱成像数据机器学习算法,采用不同类型的质谱成像数据,根据所设计的质谱成像数据机器学习算法,用于实现基于病理及活体组织样本分类、疾病标志物自动发现、疾病预测模型与疾病分型模型训练及维护、模型训练算法筛选及优化、未知样本预测、模型发布与应用。/n...

【技术特征摘要】
1.一种基于病理及活体组织临床诊断大数据的疾病类型判别方法,其特征在于,该方法包括以下步骤:
S1质谱仪器数据交换,通过质谱仪厂家工作站或者数据转换功能完成质谱仪数据到质谱成像数据的转换,支持导入各主流质谱仪器厂家的质谱数据;
S2代谢物化合物数据库,基于人体的内源性代谢物质谱数据以及化合物检索匹配算法,通过代谢物化合物数据库实现对质谱图中内源性化合物的自动化标注和定性分析,其中,所述代谢物化合物数据库能够匹配多种化合物检索算法,进一步包含:分析条件精准匹配、动态加合离子匹配、质谱同位素匹配、保留时间匹配、一级质谱匹配、二级质谱匹配、离子淌度匹配、代谢通路匹配、非靶向匹配;
S3质谱成像代谢组学组织样本数据库,该数据库由临床生物样本库及实验动物模型生物样本库组成,通过大数据方式对庞大、复杂的人体代谢组质谱成像样本进行有效管理和开展数据挖掘及建模,从而汇集人类疾病质谱成像数据;
S4质谱成像数据处理工作站,进行质谱成像的自动化数据处理及分析,该工作站用于数据导入预处理、质谱图像重建、质谱目标选区提取、光学图像匹配、质谱图像定量分析;
S5质谱成像数据机器学习算法,采用不同类型的质谱成像数据,根据所设计的质谱成像数据机器学习算法,用于实现基于病理及活体组织样本分类、疾病标志物自动发现、疾病预测模型与疾病分型模型训练及维护、模型训练算法筛选及优化、未知样本预测、模型发布与应用。


2.根据权利要求1所述的基于病理及活体组织临床诊断大数据的疾病类型判别方法,其特征在于,所述S2中代谢物化合物数据库,进一步包含:
通过标准代谢物质谱信息实物的检测结果,测定2000个代谢物的质谱信息,并排除外源性化合物的干扰,对代谢物化合物数据库进行动态编辑和扩充,运用大数据匹配的方式,提高代谢物化合物数据库与多种化合物检索算法精准匹配,以及精准化、自动化的化合物解析。


3.根据权利要求1所述的基于病理及活体组织临床诊断大数据的疾病类型判别方法,其特征在于,所述S3中临床生物样本库及实验动物模型生物样本库收载质谱成像数据进一步包含:
S3.1收载靶向及非靶向代谢组学质谱成像原始数据及标注结果,以及代谢组学的位置信息;
S3.2代谢组学质谱成像数据与代谢物化合物数据库进行无缝关联,进行便捷的自动化化合物标注;
S3.3质谱成像代谢组学组织样本数据库与质谱成像数据处理工作站建立无缝数据交换,完成一站式分析及数据建模的开展。


4.根据权利要求1所述的基于病理及活体组织临床诊断大数据的疾病类型判别方法,其特征在于,所述S4中质谱成像数据处理工作站进一步包含:
S4.1数据导入预处理,用于输入质谱图像导入文件序列,设置样品有关参数,所述质谱图像导入包含:图像分辨率、切片厚度、切片物理尺寸、质谱数据通道类型、连续型质谱数据类型峰检测、积分处理,其中积分处理参数包含:斜率、最小峰强度、强度积分方式、质荷比统计方式;
S4.2质谱图像重建,获取原始质谱成像数据中按照指定的离子提取范围和方式对2D及3D质谱图像进行空间重构,并进行可视化渲染;
S4.3质谱目标选区提取,提供多种提取工具,提取工具包含固定区域大小,以及手动自由选择套索工具、以流动蚂蚁线的形式动...

【专利技术属性】
技术研发人员:田润涛
申请(专利权)人:质美北京生物科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1