一种基于通用模型的医学标准术语管理系统及方法技术方案

技术编号：34985043 阅读：66 留言：0更新日期：2022-09-21 14:29

本发明专利技术公开了一种基于通用模型的医学标准术语管理系统及方法，包括术语信息处理模块，术语关系网络构建模块，术语库自扩增模块，可视化管理模块；步骤S1：通过术语信息处理模块对开源标准术语数据进行梳理整合，并通过构建的序列标注模型拆分得到所述细分属性名称对应的细分属性内容；步骤S2：建立标准化映射关系，完成术语关系网络的搭建；步骤S3：进行自增推荐，完成术语关系网络的扩展；步骤S4：利用可视化管理模块对所述术语库进行可视化管理。本发明专利技术所构建的医学标准术语库可满足不同的科研及业务使用场景，兼容或可溯源至不同平台及权威机构的医学标准术语，所设计的结构体可支持术语的各种组合扩展。支持术语的各种组合扩展。支持术语的各种组合扩展。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于通用模型的医学标准术语管理系统及方法

[0001]本专利技术涉及一种医学领域
，尤其涉及一种基于通用模型的医学标准术语管理系统及方法。

技术介绍

[0002]随着大数据时代的来临，医疗大数据在医学领域的应用价值也逐渐被挖掘与利用。然而，在这一过程中，由于多源的医学数据不具备统一的标准，在过去缺乏规范性的约束，致使各行业对现有的医疗数据无法进行最大化的合理利用，也成为医学信息化建设及医学研究发展的阻碍因素。
[0003]虽然当前，各大国内外权威机构发布的医学标准术语集已在不同的领域被广泛应用及认可，却仍缺乏一个，可兼容多种需求场景，能突破不同服务平台间壁垒的中文标准医学术语体系。致使现阶段，中文标准术语在真实世界的覆盖度仅低于40%，远不足以适应医疗人工智能的应用需求。
[0004]已有的中文医学术语管理方法中，一种是基于snowflake算法对同义医学术语进行标识，以概念为中心进行整合后，构建单分类下的树状数据结构医学词典；一种是对英文医学术语资源，如SNOMEDCT，进行机器翻译及大量人工校正。
[0005]第一种方式将不同来源获取的医学术语进行分类，得到不同含义的医学术语，以概念为中心实现同义汇聚和语义分类，再对不同含义的医学概念采用snowflake算法进行标识，根据不同的概念标识进行整合得到医学概念表，同时采用Jaccard相似度算法对相同来源的医学术语进行相似度计算以满足准确分类。通过这种方法实现自增ID，保证ID的唯一性和索引性能。其构建的术语体系结构单一，可拓展性低...

【技术保护点】

【技术特征摘要】
1.一种基于通用模型的医学标准术语管理系统，其特征在于，包括：术语信息处理模块，用于对开源标准术语数据进行梳理整合，对所述开源标准术语数据的定义及术语含义进行术语分类，得到术语类别以及术语类别对应的细分属性名称，并通过构建的序列标注模型对病历文本进行拆分得到病历文本细分属性名称对应的细分属性内容，每种所述术语类别都包含一种主要细分属性名称和多种次要细分属性名称；术语关系网络构建模块，用于在所述细分属性内容中寻找语义相似度最大的语义标准词建立标准化映射关系，并对所述标准化映射关系进行校正及补充，完成术语关系网络的搭建；术语库自扩增模块，用于对不同的所述术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库；可视化管理模块，用于对所述术语库进行可视化管理。2.如权利要求1所述的一种基于通用模型的医学标准术语管理系统，其特征在于，所述可视化管理模块包括：医学标准术语查询单元，用于提供用户预览数据，进行标准术语的可视化查询，基于不同维度的筛选条件，筛选出对应的术语，同时提供用户登陆界面入口和术语管理界面入口，展示包含以下维度的标准术语信息，包括：标准术语的顶级类别、同义词、父节点术语、子节点术语和/或属性信息，同时提供进入相关术语详情界面的入口；术语编辑单元，用于提供用户通过可视化界面进行术语实体编辑，包括：标准术语的新增、删除和/或修改，标准术语同义词的新增和/或删除，标准术语的属性信息修改；术语审核单元，用于提供术语审核人员进行第二方审核，提供审核人员进行术语审核结果判定；术语映射单元，用于提供用户对不同来源的医学数据进行标准化映射，对于无法映射的数据，构建推荐队列，保证术语管理人员进行术语的一键映射和推荐队列的形成。3.一种基于通用模型的医学标准术语管理方法，其特征在于，包括以下步骤：步骤S1：通过术语信息处理模块对开源标准术语数据进行梳理整合，对所述开源标准术语数据的定义及术语含义进行术语分类，得到术语类别以及术语类别对应的细分属性名称，并通过构建的序列标注模型拆分得到所述细分属性名称对应的细分属性内容，所述细分属性内容即为标准词，每种所述术语类别都包含一种主要细分属性名称和多种次要细分属性名称；步骤S2：通过所述序列标注模型对病历文本进行拆分得到病历文本细分属性，利用术语关系网络构建模块在所述标准词中寻找语义相似度最大的语义标准词建立标准化映射关系，并对所述标准化映射关系进行校正及补充，完成术语关系网络的搭建；步骤S3：通过术语库自扩增模块对不同的术语类别进行自增推荐，完成术语关系网络的扩展，得到完整的术语库；步骤S4：利用可视化管理模块对所述术语库进行可视化管理，所述可视化管理包括医学标准术语查询单元、术语编辑单元、术语审核单元和术语映射单元。4.如权利要求3所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S1具体包括以下子步骤：步骤S11：通过术语信息处理模块对开源标准术语数据进行梳理整合，对所述开源标准
术语数据的定义及术语含义进行术语分类，保留原始术语的层级关系、关联关系和/或编码信息，并打上来源标签，得到术语类别以及术语类别对应的细分属性名称；步骤S12：利用预训练语言模型构建序列标注模型，并通过所述序列标注模型将开源标准术语数据拆分得到细分属性内容。5.如权利要求4所述的一种基于通用模型的医学标准术语管理方法，其特征在于，所述步骤S12具体包括以下子步骤：步骤S121：利用预训练语言模型计算开源标准术语数据中每个字/词的向量表示；步骤S122：所述向量表示通过自注意力机制计算每个字/词的输出状态；步骤S123：所述输出状态经过全连接神经网络计算得到每个字/词属于每种细分属性类别的概率，完成序列标注模型的构建...

【专利技术属性】
技术研发人员：李劲松，俞紫怡，杨宗峰，田雨，周天舒，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人