联邦式医疗大数据治理系统技术方案

技术编号:39598303 阅读:19 留言:0更新日期:2023-12-03 19:57
本发明专利技术公开了一种联邦式医疗大数据治理系统,包括联邦治理标准模块,用于在全局范围内约定通用治理标准与规则,为面向域的治理引擎模块的数据治理环节提供全局统一标准;治理引擎模块,用于构建面向本地化的数据治理能力,为部署在医疗各业务域数据治理基础设施集成环境;全局联动管理模块,用于域内

【技术实现步骤摘要】
联邦式医疗大数据治理系统


[0001]本专利技术涉及医疗大数据处理
,具体地,涉及一种联邦式医疗大数据治理系统


技术介绍

[0002]医疗大数据治理近年来在业界备受关注,被认为是医疗改革的重要推动力,也是实现
AI
辅助诊疗的关键基础

一方面,医疗数据有效共享一直是热点关注问题,但医疗数据异构性大,特别是对一些大体积的影像数据存储管理与共享难度大

同时,医疗领域对数据安全隐私保护要求高,往往又对及时性要求高,有效实现数据安全共享同样是一大挑战

另一方面,为提升医疗诊断水平的,人工智能与机器学习技术被广泛应用于医疗领域,但高效精准的
AI
辅助诊疗算法与模型往往建立在大型标准化训练数据集上,但目前,标准化数据集的不足或缺失是
AI
辅助诊疗研究的一大痛点

[0003]关于数据治理体系的研究,从面向主题的

集成的

相对稳定的

反映历史变化的数据集合构建,到实现任意来源

任意速度

任意规模

任意类型数据的全量获取

全量存储

多模式处理与全生命周期管理为主要内容特征的数据湖体系研究,围绕数据集成

大数据中心建设由大量的研究工作,大数据平台也在不断演进发展,并沉淀形成了数据质量管理

元数据管理

主数据管理

数据标准管理

数据资产管理

数据安全管理等固有内容

结合大数据处理需要,形成了以
Kappa、Apache Beam
等架构实现实时数据可用性的流式传输

统一批处理等诸多处理模式

[0004]独立寻址

独立访问

互联互通的模式在互联网领域取得了极大的成功,但在大数据领域建设思想仍是以数据集中为主流,大量的数据从网络各边缘处流入数据仓库或数据湖,随着大数据时代的发展,传统的数据架构暴露出来的弊病愈发突出,如数据隐私与数据所有权保护限制

大量的
ETL
作业难以维护

数据陈旧与数据不一致现象普遍

无处不在的数据和源扩散导致集成压力激增

新型联邦学习和群体学习的思想强调了模型下发本地训练和模型训练结果的上传,从而保证的原始数据无需集中传输

但是,本地化原始数据的标准

质量不一致性降低了联邦学习模型训练效果,同时也会导致训练成本的增加


技术实现思路

[0005]本专利技术的目的是提供一种联邦式医疗大数据治理系统,该联邦式医疗大数据治理系统能够实现医疗大数据按域完成联邦式治理,提供标准化治理模式方法和动态适配能力,降低了大量数据因汇聚集成需要而产生的大量网络资源开销及传输安全风险,加强了数据隐私与数据所有权保护,同时实现了域内

域间数据实时联动

[0006]为了实现上述目的,本专利技术提供了一种联邦式医疗大数据治理系统,该联邦式医疗大数据治理系统包括:
[0007]联邦治理标准模块,用于在全局范围内约定通用治理标准与规则,为面向域的治理引擎模块的数据治理环节提供全局统一标准;
[0008]治理引擎模块,用于构建面向本地化的数据治理能力,为部署在医疗各业务域数据治理基础设施集成环境;
[0009]全局联动管理模块,用于域内

域间治理引擎全局实时联动处理;
[0010]医学病理图像注释模块,用于增强
WSI
注释信息,结合机器学习模型和“人机共生”驱动模式,迭代式扩充与优化
WSI
注释信息;其中,
[0011]治理引擎模块分为通用型治理引擎模块和
WSI
型治理引擎模块,通用型治理引擎模块与域内各数据源相连,通过直读数据源视图获取业务主数据;
WSI
型治理引擎模块用于医疗领域全视野数字切片
WSI
标准化处理,以实现数据监听

处理

开放

编排和存储,形成该域的治理引擎

[0012]优选地,联邦治理标准模块包括:
[0013]数据编码标准单元,数据编码标准单元提供医疗元数据字段编码规则全局声明,并提供便捷化检索能力

版本维护能力,供各域治理引擎实时核对;
[0014]数据质量标准单元,数据质量标准单元提供医疗数据完整性

准确性

实效性

一致性和有效性方面的质量指标声明及相应的指标维护能力,供各域治理引擎实时核对;
[0015]数据摘要标准单元,数据摘要标准单元提供医疗数据以摘要形式编排标准,作为各域治理引擎构建数据摘要结构的标准;
[0016]语义语法标准单元,语义语法标准单元提供医疗数据域内

域间关联查询提供语义

语法规则声明;
[0017]医学图像标准单元提供医学图像数据在颜色

形态和尺寸方面的标准

[0018]优选地,治理引擎模块包括:
[0019]数据获取接口模块,数据获取接口模块用于根据源数据体积

时效

结构特征采用视图直读
、ETL
推送
、API
消息及文件同步任务模式获取源数据;
[0020]逻辑
/
贴源层模块,逻辑
/
贴源层模块依据数据获取接口模块采集数据类型以虚拟逻辑化形式或真实物理化形式存储源数据;
[0021]数据标准化模块,数据标准化模块用于输入逻辑
/
贴源层模块源数据,进行标准化流程处理,输出标准化数据;
[0022]标准层模块,标准层模块用于接收并管理经过数据标准化模块处理形成的标准化数据;
[0023]基础设施模块,基础设施模块用于提供治理引擎运行环境配置部署,包括数据存储

代码环境的基础设施部署;
[0024]API
服务模块,
API
服务模块面向其他域提供标准化数据

分析指标型数据及相关元数据,并使治理引擎中的数据按照统一标准进行访问;
[0025]数据目录模块,数据目录模块提供治理引擎中经过分解

融合及标准化后形成的元数据信息,并对其他域提供开放服务;同一医疗机构下所有域数据目录进一步融合,以形成该医疗机构的数据目录

...

【技术保护点】

【技术特征摘要】
1.
一种联邦式医疗大数据治理系统,其特征在于,所述联邦式医疗大数据治理系统包括:联邦治理标准模块,用于在全局范围内约定通用治理标准与规则,为面向域的治理引擎模块的数据治理环节提供全局统一标准;治理引擎模块,用于构建面向本地化的数据治理能力,为部署在医疗各业务域数据治理基础设施集成环境;全局联动管理模块,用于域内

域间治理引擎全局实时联动处理;医学病理图像注释模块,用于增强
WSI
注释信息,结合机器学习模型和“人机共生”驱动模式,迭代式扩充与优化
WSI
注释信息;其中,所述治理引擎模块分为通用型治理引擎模块和
WSI
型治理引擎模块,所述通用型治理引擎模块与域内各数据源相连,通过直读数据源视图获取业务主数据;所述
WSI
型治理引擎模块用于医疗领域全视野数字切片
WSI
标准化处理,以实现数据监听

处理

开放

编排和存储,形成该域的治理引擎
。2.
根据权利要求1所述的联邦式医疗大数据治理系统,其特征在于,所述联邦治理标准模块包括:数据编码标准单元,所述数据编码标准单元提供医疗元数据字段编码规则全局声明,并提供便捷化检索能力

版本维护能力,供各域治理引擎实时核对;数据质量标准单元,所述数据质量标准单元提供医疗数据完整性

准确性

实效性

一致性和有效性方面的质量指标声明及相应的指标维护能力,供各域治理引擎实时核对;数据摘要标准单元,所述数据摘要标准单元提供医疗数据以摘要形式编排标准,作为各域治理引擎构建数据摘要结构的标准;语义语法标准单元,所述语义语法标准单元提供医疗数据域内

域间关联查询提供语义

语法规则声明;医学图像标准单元提供医学图像数据在颜色

形态和尺寸方面的标准
。3.
根据权利要求1所述的联邦式医疗大数据治理系统,其特征在于,所述治理引擎模块包括:数据获取接口模块,所述数据获取接口模块用于根据源数据体积

时效

结构特征采用视图直读
、ETL
推送
、API
消息及文件同步任务模式获取源数据;逻辑
/
贴源层模块,所述逻辑
/
贴源层模块依据数据获取接口模块采集数据类型以虚拟逻辑化形式或真实物理化形式存储源数据;数据标准化模块,所述数据标准化模块用于输入逻辑
/
贴源层模块源数据,进行标准化流程处理,输出标准化数据;标准层模块,所述标准层模块用于接收并管理经过数据标准化模块处理形成的标准化数据;基础设施模块,所述基础设施模块用于提供治理引擎运行环境配置部署,包括数据存储

代码环境的...

【专利技术属性】
技术研发人员:刘超吴长义聂竹明陈付龙吴伟张钰漩
申请(专利权)人:安徽师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1