一种检验数据标准化的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31486324 阅读:23 留言:0更新日期:2021-12-18 12:21
本发明专利技术公开了一种检验数据标准化的方法、装置、电子设备和存储介质。该方法包括:获取待确定标准化词条的待处理文本;根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条;和/或,基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条;根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条。本发明专利技术实施例解决了目前已有的检验术语匹配方法没有考虑语义层面的术语解释造成检验效果低的问题,提升了检验术语匹配的效果。提升了检验术语匹配的效果。提升了检验术语匹配的效果。

【技术实现步骤摘要】
一种检验数据标准化的方法、装置、电子设备和存储介质


[0001]本专利技术实施例涉及数据处理技术,尤其涉及一种检验数据标准化的方法、装置、电子设备和存储介质。

技术介绍

[0002]目前,医学领域中存在大量的非结构化文本和结构化文本数据,区域化医疗数据的数据差别越来越明显,对医学数据进行数据检验时,术语标准化问题成为亟待解决的首要问题。
[0003]目前已有的检验术语方法大部分是通过字面特征进行统计打分,仅仅依靠名称相似度获得与术语相匹配的数据信息,这种传统的仅利用字面特征获取的匹配结果丢失了检验文本中的有用信息,不能及时的反馈术语准确的信息,极大的耗费人力物力,并且耽误宝贵的治疗时间,还会给病人造成不必要的经济损失。

技术实现思路

[0004]本专利技术实施例提供一种检验数据标准化的方法、装置、电子设备和存储介质,以实现对数据进行标准化处理,输出具有可读性的标准化语句。
[0005]第一方面,本专利技术实施例提供了一种检验数据标准化的方法,包括:
[0006]获取待确定标准化词条的待处理文本;
[0007]根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条;和/或,
[0008]基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条;
[0009]根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条。
[0010]第二方面,本专利技术实施例还提供了一种检验数据标准化的装置,该装置包括:
[0011]文本获取模块,用于获取待确定标准化词条的待处理文本;
[0012]文本处理模块,用于根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条;和/或,基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条;
[0013]词条确定模块,用于根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条。
[0014]第三方面,本专利技术实施例还提供了一种检验数据标准化的电子设备,所述电子设备包括:
[0015]一个或多个处理器;
[0016]存储装置,用于存储一个或多个程序,
[0017]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例任一所述的检验数据标准化的方法。
[0018]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例任一所述的检验数据标准化的方法。
[0019]本专利技术实施例通过将预先设置的与待处理术语相对应的待配准术语信息,存储至检验术语知识库,将待处理文本利用描述逻辑标注以及知识表示拆解为待处理术语,根据检验术语知识库中的待配准术语查找到与待处理术语匹配的第一待确定标准词条。同时,通过提前利用训练样本训练对比学习模型,得到预设损失函数收敛的对比学习模型,将待处理术语与各待配准术语输入对比学习模型进行相似度匹配,输出待处理术语与各待配准术语的相似度值,取相似度值较高的术语信息作为第二待确定标准词条,通过第一待确定标准词条和/或第二待确定标准词条确定目标标准词条,解决了目前检验数据标准化仅靠外部输入信息与待处理文本直接进行名称的语义匹配,通过字面特征进行统计打分,不考虑语义的上下文信息,存在检验效率较低,以及人力成本较高的问题,保证了检验的精确度,同时提升了检验数据标准化的效果。
附图说明
[0020]为了更加清楚地说明本专利技术示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本专利技术所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
[0021]图1为本专利技术实施例一提供的一种检验数据标准化的方法的流程图;
[0022]图2为本专利技术实施例二提供的一种检验数据标准化的方法的流程图;
[0023]图3为本专利技术实施例三提供的一种检验数据标准化的方法的流程图;
[0024]图4为本专利技术实施例四提供的一种检验数据标准化的方法的流程图;
[0025]图5为本专利技术实施例五提供的一种检验数据标准化的装置的结构框图;
[0026]图6为本专利技术实施例六提供的一种检验数据标准化的电子设备的结构示意图。
具体实施方式
[0027]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0028]实施例一
[0029]图1为本专利技术实施例一提供的一种检验数据标准化的方法的流程图,本实施例可适用于在检验数据时,对数据进行标准化处理,输出标准化语句的情况,该方法可以由本专利技术实施例中的检验数据标准化的装置来执行,该装置可以采用软件和/或硬件的方式来实现,可选的,通过电子设备来实现,该电子设备可以是移动终端、PC端或服务端等。该装置可配置于计算设备中,本实施例提供的检验数据标准化的方法具体包括如下步骤:
[0030]S110、获取待确定标准化词条的待处理文本。
[0031]其中,词条可以是字、词,也可以由字、词等组成的数据信息,用于对各种概念、事
物、现象及最新发现等概念的解释。标准化词条可以理解为通过制订、发布和实施标准使复杂难懂的词条转换成标准化可读性强的词条。待处理文本是指需要进行标准化处理的文本,例如,在检验领域中,待处理文本可以是需要进行检验的数据,进一步的,可以将待处理文本利用标准化操作转化成为一个标准化词条,在实际应用中,可以通过将待确定的标准化词条中的数据存储在预设的数据库,通过提取数据库中的数据信息获取待处理文本,也可以是当服务器检测到上传的待确定的标准化词条的待处理数据时,可以认为获取到待处理数据,即获取到待处理文本。如,当检验科室在医院系统中上传患者的检验单时,可以认为服务器获取到了检验单上的数据信息,可以将这些数据信息作为待处理文本,即认为获取到了待处理文本。
[0032]S120、根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条,和/或基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条。
[0033]其中,术语可以是词,也可以是词组,用来正确标记生产技术、科学、艺术、社会生活等各个专门领域中的事物、现象、特性、关系和过程,表示概念称谓的集合。检验术语知识库是指根据计算机特有的功能,利用统一的科技语言存储大量用于检验术语的数据库,例如,通过输入计算机的术语,输出具本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检验数据标准化的方法,其特征在于,包括:获取待确定标准化词条的待处理文本;根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条;和/或,基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条;根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条。2.根据权利要求1所述的方法,其特征在于,所述根据预先确定的检验术语知识库对所述待处理文本进行处理,得到与所述待处理文本相对应的第一待确定标准词条,包括:对所述待处理文本进行标注处理,得到与所述待处理文本相对应的待处理术语;基于所述待处理术语和所述检验术语知识库中的各待配准术语,确定与所述待处理文本相对应的第一待确定标准词条。3.根据权利要求1所述的方法,其特征在于,所述基于预先训练得到的对比学习模型对所述待处理文本进行处理,得到与所述待处理文本相对应的第二待确定标准词条,包括:将所述待处理文本和各待配准标准术语输入至预先训练得到的对比学习模型中,得到各待配准标准术语与所述待处理文本之间的相似度值;基于各相似度值,确定与所述待处理文本相对应的第二待确定标准词条。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一待确定标准词条和/或第二待确定标准词条,确定与所述待处理文本相对应的目标标准化词条,包括:如果所述第一待确定标准词条和所述第二待确定标准词条中存在重复的待显示标准词条,则将所述待显示标准词条作为所述目标标准化词条;如果所述第一待确定标准词条与所述第二待确定标准词条中不存在重复的待显示标准词条,则将所述第一待确定标准词条作为所述目标标准化词条;如果仅包括第一待确定标准词条,将所述第一待确定标准词条作为所述目标标准词条;如果仅包括第二待确定标准词条,将相似度值最高的第二待确定标准词条作为所述目标标准词条。5.根据权利要求1所述的方法,其特征在于,还包括:确定检验术语知识库;所述确定检验术语知识库,包括:获取至少一条待处理检验术语语料,并基于预先确定的拆分规则,得到与每条待处理检验术语语料相对应的待处理术语;根据各待处理检验术语确定所述检验术语知识库。6.根据权...

【专利技术属性】
技术研发人员:刘霄晨罗永贵肖劲尹芳张晓璐马晶
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1