System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 医学数据处理方法、系统、介质及设备技术方案_技高网

医学数据处理方法、系统、介质及设备技术方案

技术编号:44157623 阅读:8 留言:0更新日期:2025-01-29 10:28
本发明专利技术提供了一种医学数据处理方法、系统、介质及设备,方法包括:对医学文本信息进行实体识别,得到命名实体;使用预设的规则库将命名实体与标准化术语库中的标准化术语进行映射,得到映射结果;获取对所述映射结果进行审核的审核结果;用审核结果和映射结果训练神经网络模型,使用规则提取算法从训练后的神经网络模型中提取出映射规则,将提取出的映射规则更新至规则库。本发明专利技术使用机器学习算法对规则库的映射结果进行学习和优化,不断更新术语映射规则以更新标准化术语库,能够适应新的术语变化,提高了术语标准化的灵活性及可适应性。

【技术实现步骤摘要】

本专利技术涉及医疗信息,具体地,涉及一种医学数据处理方法、系统、介质及设备


技术介绍

1、医学术语是指医学领域的专业用语,其可以用于表示疾病、药物、手术操作和检查检验等各种事物、现象以及过程。随着医学科技的飞速发展,新疾病、新治疗方法以及新兴医疗技术的不断涌现,医学术语的数量急剧增加,且表达形式日益多样化。由于医学术语在临床信息系统表达医学信息时不可或缺,而各医院在实际使用过程中又具有差异性,这会造成同一个含义的医学术语表述多样化,为后续病历数据分析等工作带来很大困难,因此,对医学术语进行标准化是十分必要的。

2、目前,医学术语的标准化主要依赖于静态规则集,这些规则集通常由专业医学组织或标准化机构制定,并包含一系列关于术语定义、使用规范和分类的准则。静态规则集在初期确实为医学术语的规范使用提供了有力支持,但随着医学知识的爆炸性增长和术语的复杂变化,其适应性差、灵活性不足、准确性受限等局限性逐渐显现,难以适应医学术语的快速发展和多样化表达。


技术实现思路

1、针对现有技术中的缺陷,本专利技术的目的是提供一种医学数据处理方法、系统、介质及设备。

2、根据本专利技术提供的一种医学数据处理方法,所述方法包括:对医学文本信息进行实体识别,得到专命名实体;使用预设的规则库将命名实体与标准化术语进行映射,得到映射结果;获取对所述映射结果进行审核的审核结果;用审核结果和映射结果训练神经网络模型,使用规则提取算法从训练后的神经网络模型中提取出映射规则,将提取出的映射规则更新至规则库。

3、不难理解,本申请通过对医学文本的实体识别得到其中的命名实体,再将识别到的命名实体映射到标准化术语,实现了命名实体的初步标准化。然后使用机器学习算法对规则库的映射结果进行学习和优化,不断更新术语映射规则以更新标准化术语库,能够适应新的术语变化,提高了术语标准化的灵活性及可适应性。

4、进一步地,所述对医学文本信息进行实体识别,得到命名实体包括:将所述医学文本信息的每个字符转化为字向量以及每个字符所属的词向量,将所述字向量和所述词向量进行拼接得到拼接向量;通过对所述拼接向量进行特征提取,确定拼接特征向量,根据所述拼接特征向量得到每个字符对应不同标签的概率;根据所述每个字符对应不同标签的概率,确定医学文本信息的标签序列;基于所述医学文本信息的标签序列确定所述医学文本信息中的命名实体。

5、进一步地,所述使用预设的规则库将命名实体与标准化术语库中的标准化术语进行映射的方式包括以下至少一种:计算命名实体与标准术语库中的医学术语之间的字符串相似度,若其小于第一预设值,则将所述命名实体映射到所述医学术语上;计算命名实体与标准术语库中医学术语的关键词的相似度,若相似度满足第二预设值,则将所述命名实体映射到标准术语库中医学术语的关键词上;将命名实体与医学词汇表进行对照,若医学词汇表中存在对应的标准术语,则将所述命名实体映射到所述对应的标准术语上。

6、进一步地,所述字符串相似度规则的计算公式如下:

7、

8、其中,s(x,y)表示所述命名实体与所述标准术语库中的医学术语之间的距离,x\y表示在所述命名实体(x)中而不在所述标准术语库中的医学术语(y)的字符数量,y\x表示在标准术语库中的医学术语(y)而不在命名实体(x)中的字符数量,x∩y表示既在命名实体(x)中又在标准术语库中的医学术语(y)的字符数量,α、β为两个参数系数。

9、不难理解,本申请通过构建包含同义词、缩写和标准化表达的规则集,使用包括字符串相似度规则、关键词映射规则和词汇表规则的规则库将识别的术语与标准化术语库进行映射,利用字符串相似度算法(如levenshtein距离、jaccard相似度等)计算待识别术语与标准化术语库中术语的相似度;通过设置合适的阈值,可以识别出与标准化术语相似度较高的待识别术语,从而提高识别的准确率。

10、进一步地,训练神经网络模型的方法包括:将映射结果和审核结果划分为训练集和验证集,通过训练集训练神经网络模型,通过验证集验证训练好的神经网络模型,根据验证结果调整神经网络模型的参数。

11、进一步地,所述规则提取算法包括决策树算法。

12、进一步地,所述决策树算法包括:根据审核结果和映射结果构建决策树,以神经网络模型的输出作为决策树的训练目标,得到训练好的决策树;从决策树的根节点开始,递归地遍历决策树的各个子树,并通过连接子树的条件判断来得到映射规则。

13、不难理解,本申请在医学术语标准化的流程中融合了人工审核的专业精准高效筛查,不仅大幅提升了术语的标准化准确性,确保了术语使用的一致性和规范性,还显著优化了医学信息的流通效率与理解深度。这一过程有效降低了因术语差异导致的沟通障碍和医疗风险,促进了医疗质量的稳步提升与患者的更高满意度,为医学领域的进步与发展奠定了坚实的基础。

14、根据本专利技术提供的一种医学数据处理系统,包括:

15、术语识别模块,用于对医学文本信息进行实体识别,得到命名实体;

16、术语映射模块,用于使用预设的规则库将命名实体与标准化术语库中的标准化术语进行映射,得到映射结果;

17、反馈模块,用于获取对所述映射结果进行审核的审核结果;

18、学习优化模块,用审核结果和映射结果训练神经网络模型,使用规则提取算法从训练后的神经网络模型中提取出映射规则,将提取出的映射规则更新至规则库。

19、根据本专利技术提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现所述的医学数据处理方法的步骤。

20、根据本专利技术提供的一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现所述的医学数据处理方法的步骤。

21、与现有技术相比,本专利技术具有如下的有益效果:

22、本专利技术创新性地融合了机器学习算法于规则库之中,通过持续学习并优化术语映射结果,实现了术语映射规则的动态更新与标准化术语库的即时扩充;这一机制不仅能够敏锐捕捉并适应术语的最新变化,还显著增强了术语标准化的灵活性与适应性,为医学交流与科研探索作出了较大贡献。

23、本专利技术的其他有益效果,将在具体实施方式中通过具体技术特征和技术方案的介绍来阐述,本领域技术人员通过这些技术特征和技术方案的介绍,应能理解所述技术特征和技术方案带来的有益技术效果。

本文档来自技高网...

【技术保护点】

1.一种医学数据处理方法,其特征在于,包括:

2.根据权利要求1所述的医学数据处理方法,其特征在于,所述对医学文本信息进行实体识别,得到命名实体包括:

3.根据权利要求1所述的医学数据处理方法,其特征在于,所述使用预设的规则库将命名实体与标准化术语库中的标准化术语进行映射的方式包括以下至少一种:

4.根据权利要求3所述的医学数据处理方法,其特征在于,所述计算命名实体与标准术语库中的医学术语之间的字符串相似度的计算公式如下:

5.根据权利要求1所述的医学数据处理方法,其特征在于,训练神经网络模型的方法包括:

6.根据权利要求1所述的医学数据处理方法,其特征在于,所述规则提取算法包括决策树算法。

7.根据权利要求6所述的医学数据处理方法,其特征在于,所述决策树算法包括:

8.一种医学数据处理系统,其特征在于,包括:

9.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的医学数据处理方法的步骤。

10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的医学数据处理方法的步骤。

...

【技术特征摘要】

1.一种医学数据处理方法,其特征在于,包括:

2.根据权利要求1所述的医学数据处理方法,其特征在于,所述对医学文本信息进行实体识别,得到命名实体包括:

3.根据权利要求1所述的医学数据处理方法,其特征在于,所述使用预设的规则库将命名实体与标准化术语库中的标准化术语进行映射的方式包括以下至少一种:

4.根据权利要求3所述的医学数据处理方法,其特征在于,所述计算命名实体与标准术语库中的医学术语之间的字符串相似度的计算公式如下:

5.根据权利要求1所述的医学数据处理方法,其特征在于,训练神经网络模型的方法包括:

6.根据权...

【专利技术属性】
技术研发人员:姚娟娟
申请(专利权)人:上海明品医学数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1