【技术实现步骤摘要】
值域表匹配方法、装置、设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种值域表匹配方法、装置、设备及存储介质。
技术介绍
[0002]数据标准值域表是医疗数据厂商在开发医疗数据应用或医疗人工智能应用中的关键组成元素,它主要定义了在某个具体项目中医学数据标准的值域表及相关信息,同时也提供了基准标准值域参考。这样的值域表在现实项目中可以起到帮助快速桥接多个项目数据表的作用,从而为人工智能算法或数据分析提供大量的对齐数据。另外,这样值域表也对某个项目中的数据进行了强约束,从而进一步提升业务数据质量。值域表匹配作为上述功能的重要算法基础,其计算的实效性以及准确性,很大程度上决定了该功能及产品的可用性。
技术实现思路
[0003]本申请提供了一种值域表匹配方法、装置、设备及存储介质,可以提高值域表匹配的准确率以及效率。
[0004]一方面,本申请提供了一种值域表匹配方法,所述方法包括:
[0005]获取值域表集,所述值域表集中每个值域表包括至少两个值域;所述值域表集包括第一应用对应的源值域表以及第二应用对应的至少两个预设值域表;
[0006]根据所述至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;所述预设值域索引表表征预设值域与预设值域表标识的对应关系;
[0007]确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果;
[0008]根据所述相似度结果,从所述预设值域索引表的预设值域中筛选出候选值域,得到候选值域集 ...
【技术保护点】
【技术特征摘要】
1.一种值域表匹配方法,其特征在于,所述方法包括:获取值域表集,所述值域表集中每个值域表包括至少两个值域;所述值域表集包括第一应用对应的源值域表以及第二应用对应的至少两个预设值域表;根据所述至少两个预设值域表各自对应的预设值域以及预设值域表标识,构建预设值域索引表;所述预设值域索引表表征预设值域与预设值域表标识的对应关系;确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果;根据所述相似度结果,从所述预设值域索引表的预设值域中筛选出候选值域,得到候选值域集;根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表。2.根据权利要求1所述的方法,其特征在于,所述根据所述预设值域索引表以及所述候选值域集,确定与所述源值域表相匹配的目标值域表,包括:基于所述预设值域索引表,确定所述候选值域集中每个候选值域对应的候选值域表标识;根据每个候选值域表标识对应的候选值域的数量,确定所述每个候选值域表标识在所述预设值域索引表中的出现频次;根据所述每个候选值域表标识对应的出现频次,确定目标值域表标识;将所述目标值域表标识对应的预设值域表,确定为与所述源值域表相匹配的目标值域表。3.根据权利要求1所述的方法,其特征在于,所述确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果,包括:提取所述源值域表中各个源值域的语义特征,得到所述源值域表中每个源值域对应的第一值域特征;提取所述预设值域索引表中各个预设值域的语义特征,得到所述预设值域索引表中每个预设值域对应的第二值域特征;根据所述第一值域特征以及所述第二值域特征,确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一值域特征以及所述第二值域特征,确定所述源值域表中源值域与所述预设值域索引表中预设值域的相似度结果,包括:根据所述源值域表以及所述预设值域索引表各自对应的值域,确定相似度表格的结构;所述相似度表格包括表头,所述表头表征所述源值域表以及所述预设值域索引表中的值域;所述表头包括行表头和列表头,所述行表头与所述列表头表征不同表中的值域;根据所述源值域表对应的第一值域特征与所述预设值域索引表对应的第二值域特征的相似度,确定所述相似度表格的正文数据;所述正文数据表征所述正文数据对应的行表头、列表头各自表征的值域之间的相似度结果。5.根据权利要求2所述的方法,其特征在于,所述根据所述每个候选值域表标识对应的出现频次,确定目标值域表标识,包括:根据所述每个候选值域表标识对应的出现频次,确定至少两个筛选值域表标识;
基于所述至少两个筛选值域表标识,确定所述目标值域表标识。6.根据权利要求5所述的方法,其特征在于,所述根据所述每个候选值域表标识对应的出现频次,确定至少两个筛选值域表标识,包括:根据所述源值域表中源值域的数量,确定频次阈值;将出现频次大于或等于所述频次阈值的候选值域表标识,确定为筛选值域表标识,得到所述至少两个筛选值域表标识。7.根据权利要求5所述的方法,其特征在于,所述基于所述至少两个筛选值域表标识,确定所述目标值域表标识,包括:获取所述至少两个筛选值域表标识各自对应的筛选值域集;获取所述源值域表中的各个源值域,得到源值域集;根据...
【专利技术属性】
技术研发人员:张子恒,李文琪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。