值域表匹配方法、装置、设备及存储介质制造方法及图纸

技术编号:35271142 阅读:29 留言:0更新日期:2022-10-19 10:42
本申请公开了一种值域表匹配方法、装置、设备及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:获取值域表集,值域表集中每个值域表包括至少两个值域;根据至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;预设值域索引表表征预设值域与预设值域表标识的对应关系;确定源值域表中源值域与预设值域索引表中预设值域的相似度结果;根据相似度结果,从预设值域索引表的预设值域中筛选出候选值域,得到候选值域集;根据预设值域索引表以及候选值域集,确定与源值域表相匹配的目标值域表。本申请提高了值域表的匹配准确率以及匹配效率。及匹配效率。及匹配效率。

【技术实现步骤摘要】
值域表匹配方法、装置、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种值域表匹配方法、装置、设备及存储介质。

技术介绍

[0002]数据标准值域表是医疗数据厂商在开发医疗数据应用或医疗人工智能应用中的关键组成元素,它主要定义了在某个具体项目中医学数据标准的值域表及相关信息,同时也提供了基准标准值域参考。这样的值域表在现实项目中可以起到帮助快速桥接多个项目数据表的作用,从而为人工智能算法或数据分析提供大量的对齐数据。另外,这样值域表也对某个项目中的数据进行了强约束,从而进一步提升业务数据质量。值域表匹配作为上述功能的重要算法基础,其计算的实效性以及准确性,很大程度上决定了该功能及产品的可用性。

技术实现思路

[0003]本申请提供了一种值域表匹配方法、装置、设备及存储介质,可以提高值域表匹配的准确率以及效率。
[0004]一方面,本申请提供了一种值域表匹配方法,所述方法包括:
[0005]获取值域表集,所述值域表集中每个值域表包括至少两个值域;所述值域表集包括第一应用对应的源值域表以及第二应用对应的至少两个预设值域表;
[0006]根据所述至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;所述预设值域索引表表征预设值域与预设值域表标识的对应关系;
[0007]确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果;
[0008]根据所述相似度结果,从所述预设值域索引表的预设值域中筛选出候选值域,得到候选值域集
[0009]根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表。
[0010]另一方面提供了一种值域表匹配装置,所述装置包括:
[0011]值域表集获取模块,用于获取值域表集,所述值域表集中每个值域表包括至少两个值域;所述值域表集包括第一应用对应的源值域表以及第二应用对应的至少两个预设值域表;
[0012]索引表构建模块,用于根据所述至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;所述预设值域索引表表征预设值域与预设值域表标识的对应关系;
[0013]相似度结果确定模块,用于确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果;
[0014]候选值域集确定模块,用于根据所述相似度结果,从所述预设值域索引表的预设
值域中筛选出候选值域,得到候选值域集;
[0015]目标值域表确定模块,用于根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表。
[0016]另一方面提供了一种值域表匹配设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上所述的值域表匹配方法。
[0017]另一方面提供了一种计算机存储介质,所述计算机存储介质存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如上所述的值域表匹配方法。
[0018]另一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行以实现如上所述的值域表匹配方法。
[0019]本申请提供的值域表匹配方法、装置、设备及存储介质,具有如下技术效果:
[0020]本申请获取值域表集,所述值域表集中每个值域表包括至少两个值域;所述值域表集包括第一应用对应的源值域表以及第二应用对应的至少两个预设值域表;根据所述至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;所述预设值域索引表表征预设值域与预设值域表标识的对应关系;确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果;根据所述相似度结果,从所述预设值域索引表的预设值域中筛选出候选值域,得到候选值域集;根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表。本申请通过至少两个预设值域表构建了预设值域索引表,构建了预设值域与预设值域表标识的对应关系,从而实现将多个值域表整合成一个值域索引表;而在构建预设值域索引表之后,对于各个预设值域表共有的值域,则只需要与源值域表中值域进行一次匹配,大大减少了值域表中值域的匹配次数;再通过源值域表中源值域与预设值域索引表中预设值域之间的相似度结果筛选出候选值域集,最后通过预设值域索引表以及所述候选值域集,快速、准确地确定出与所述源值域表相匹配的目标值域表,提高了值域表的匹配准确率以及匹配效率。
附图说明
[0021]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0022]图1是本申请实施例提供的一种值域表匹配系统的示意图;
[0023]图2是本申请实施例提供的一种值域表匹配方法的流程示意图;
[0024]图3是本申请实施例提供的一种确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果的方法的流程示意图;
[0025]图4是本申请实施例提供的一种根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表的方法的流程示意图;
[0026]图5是本申请实施例提供的根据所述每个候选值域表标识对应的出现频次,确定目标值域表标识的方法的流程示意图;
[0027]图6是本申请实施例提供的一种基于所述至少两个筛选值域表标识,确定所述目标值域表标识的方法的流程示意图;
[0028]图7是本申请实施例提供的两个应用中值域表的结构示意图;
[0029]图8是本申请实施例提供的值域表匹配过程中的表格示意图;
[0030]图9是本申请实施例提供的匹配成功的两个值域表的示意图;
[0031]图10是本申请实施例提供的一种值域表标识匹配结果示意图;
[0032]图11是本申请实施例提供的一种值域表匹配装置的结构示意图;
[0033]图12是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
[0034]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0035]首先,在对本申请实施例进行描述的过程中出现的部分名词或者术语作如下解释:
[0036]数据标准值域表(RangeTable):指某个医疗本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种值域表匹配方法,其特征在于,所述方法包括:获取值域表集,所述值域表集中每个值域表包括至少两个值域;所述值域表集包括第一应用对应的源值域表以及第二应用对应的至少两个预设值域表;根据所述至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;所述预设值域索引表表征预设值域与预设值域表标识的对应关系;确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果;根据所述相似度结果,从所述预设值域索引表的预设值域中筛选出候选值域,得到候选值域集;根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表。2.根据权利要求1所述的方法,其特征在于,所述根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表,包括:基于所述预设值域索引表,确定所述候选值域集中每个候选值域对应的候选值域表标识;根据每个候选值域表标识对应的候选值域的数量,确定所述每个候选值域表标识在所述预设值域索引表中的出现频次;根据所述每个候选值域表标识对应的出现频次,确定目标值域表标识;将所述目标值域表标识对应的预设值域表,确定为与所述源值域表相匹配的目标值域表。3.根据权利要求1所述的方法,其特征在于,所述确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果,包括:提取所述源值域表中各个源值域的语义特征,得到所述源值域表中每个源值域对应的第一值域特征;提取所述预设值域索引表中各个预设值域的语义特征,得到所述预设值域索引表中每个预设值域对应的第二值域特征;根据所述第一值域特征以及所述第二值域特征,确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一值域特征以及所述第二值域特征,确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果,包括:根据所述源值域表以及所述预设值域索引表各自对应的值域,确定相似度表格的结构;所述相似度表格包括表头,所述表头表征所述源值域表以及所述预设值域索引表中的值域;所述表头包括行表头和列表头,所述行表头与所述列表头表征不同表中的值域;根据所述源值域表对应的第一值域特征与所述预设值域索引表对应的第二值域特征的相似度,确定所述相似度表格的正文数据;所述正文数据表征所述正文数据对应的行表头、列表头各自表征的值域之间的相似度结果。5.根据权利要求2所述的方法,其特征在于,所述根据所述每个候选值域表标识对应的出现频次,确定目标值域表标识,包括:根据所述每个候选值域表标识对应的出现频次,确定至少两个筛选值域表标识;
基于所述至少两个筛选值域表标识,确定所述目标值域表标识。6.根据权利要求5所述的方法,其特征在于,所述根据所述每个候选值域表标识对应的出现频次,确定至少两个筛选值域表标识,包括:根据所述源值域表中源值域的数量,确定频次阈值;将出现频次大于或等于所述频次阈值的候选值域表标识,确定为筛选值域表标识,得到所述至少两个筛选值域表标识。7.根据权利要求5所述的方法,其特征在于,所述基于所述至少两个筛选值域表标识,确定所述目标值域表标识,包括:获取所述至少两个筛选值域表标识各自对应的筛选值域集;获取所述源值域表中的各个源值域,得到源值域集;根据...

【专利技术属性】
技术研发人员:张子恒李文琪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1