本申请涉及数据查询、人工智能及医疗健康技术领域,揭示了一种医疗数据标准化方法、装置、计算机设备及存储介质,所述方法包括:获取用户医疗数据以及标准化医疗词典;对所述用户医疗数据进行分词操作,得到各个短语;根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据。本发明专利技术能够通过分词后的用户医疗数据以及根据医疗数据库进行分词操作得到得第一关键字,进行快速查询,从而在标准化数组中查询得到用户医疗数据对应的目标标准化医疗数据,提高了将用户医疗数据标准化以及统一化的速度,减少了算力的浪费。费。费。
【技术实现步骤摘要】
医疗数据标准化方法、装置、计算机设备及存储介质
[0001]本专利技术涉及数据查询、人工智能及医疗健康
,尤其涉及一种医疗数据标准化方法、装置、计算机设备及存储介质。
技术介绍
[0002]医疗报告的解读与结构化在医疗文书趋向电子化的今天是智慧医疗健康领域收集基础数据的重要组成部分。在大数据的驱使下,收集医疗健康数据并不仅仅局限于市面上常见的医疗机构,更多的医院的医疗中心、高端定制化的医疗中心以及常见医疗机构旗下细分的医疗中心,还有更多的通过拍照、扫描等手段留存的影响资料,都是数据采集的一部分。
[0003]当程序采集到这部分数据时,不同机构间对同一个医疗项目的不同名称不同叫法,对数据分析人员来说及其复杂,简单的数据分析并不能满足同一种名称成百上千中叫法,如血常规中的“红细胞计数”,某些机构会叫“红细胞(HBC)”,而某些机构会叫“红细胞绝对值”。
[0004]目前,对不同机构的不同名称进行快速标准化成为亟待解决的问题。
技术实现思路
[0005]基于此,有必要针对现有技术的医疗数据的名称不统一,从而导致对医疗数据分析过于复杂的技术问题,提出了一种医疗数据标准化方法。
[0006]第一方面,提供了一种医疗数据标准化方法,所述方法包括:
[0007]获取用户医疗数据以及标准化医疗词典,其中,所述标准化医疗词典包括各个第一关键字以及标准化数组,所述标准化数组包括标准化医疗数据,所述第一关键字是根据医疗数据库进行分词操作得到;
[0008]对所述用户医疗数据进行分词操作,得到各个短语;
[0009]根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据。
[0010]第二方面,提供了一种医疗数据标准化装置,所述装置包括:
[0011]获取模块,用于获取用户医疗数据以及标准化医疗词典,其中,所述标准化医疗词典包括各个第一关键字以及标准化数组,所述标准化数组包括标准化医疗数据,所述第一关键字是根据医疗数据库进行分词操作得到;
[0012]分词模块,用于对所述用户医疗数据进行分词操作,得到各个短语;
[0013]查询模块,用于根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据。
[0014]第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述医疗数据标准化方法的步骤。
[0015]第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述医疗数据标准化方法的步骤。
[0016]本专利技术提供的医疗数据标准化方法,通过获取用户医疗数据以及标准化医疗词典,其中,所述标准化医疗词典包括各个第一关键字以及标准化数组,所述标准化数组包括标准化医疗数据,所述第一关键字是根据医疗数据库进行分词操作得到,而后对所述用户医疗数据进行分词操作,得到各个短语,接着根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据,能够通过分词后的用户医疗数据以及根据医疗数据库进行分词操作得到得第一关键字,进行快速查询,从而在标准化数组中查询得到用户医疗数据对应的目标标准化医疗数据,提高了将用户医疗数据标准化以及统一化的速度,减少了算力的浪费。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]其中:
[0019]图1为一个实施例中医疗数据标准化方法的应用环境图;
[0020]图2为一个实施例中医疗数据标准化方法的流程图;
[0021]图3为一个实施例中医疗数据标准化装置的结构框图;
[0022]图4为一个实施例中计算机设备的结构框图;
[0023]图5为另一个实施例中计算机设备的结构框图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]本专利技术实施例提供的医疗数据标准化方法,可应用在如图1的应用环境中,其中,客户端110通过网络与服务端120进行通信。服务端120可以通过客户端110接收用户医疗数据以及标准化医疗词典,其中,所述标准化医疗词典包括各个第一关键字以及标准化数组,所述标准化数组包括标准化医疗数据,所述第一关键字是根据医疗数据库进行分词操作得到,而后服务端120对所述用户医疗数据进行分词操作,得到各个短语,接着服务端120根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据,能够通过分词后的用户医疗数据以及根据医疗数据库进行分词操作得到得第一关键字,进行快速查询,从而在标准化数组中查询得到用户医疗数据对应的目标标准化医疗数据,提高了将用户医疗数据标准化以及统一化的速度,减少了算力的浪费。其中,客户端110可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端120可以用独立的服务器或者是多个服务器组
成的服务器集群来实现。下面通过具体的实施例对本专利技术进行详细的描述。
[0026]请参阅图2所示,图2为本专利技术第一实施例提供的医疗数据标准化方法的一个流程示意图,包括如下步骤:
[0027]S101:获取用户医疗数据以及标准化医疗词典,其中,所述标准化医疗词典包括各个第一关键字以及标准化数组,所述标准化数组包括标准化医疗数据,所述第一关键字是根据医疗数据库进行分词操作得到;
[0028]其中,用户医疗数据可以是个人健康档案、处方、检查报告等数据。用户医疗数据还可以是医疗文本,所述医疗文本可以是医疗电子记录(Electronic Healthcare Record),电子化的个人健康记录,包括病历、心电图分析文本、医学影像分析文本等一系列具备保存备查价值的电子化记录,标准化医疗词典可以采用哈希表(hashmap)的数据结构存储得到的字典。医疗数据库可以是采集大量用户医疗数据得到的数据库。
[0029]在本实施例中,首先,获取到用户医疗数据以及标准化医疗词典。标准化医疗词典包括各个第一关键字以及标准化数组,标准化数组包括标准化医疗数据,标准化医疗数据可以是经验总结出来的标准化的医疗数据,第一关键字是根据医疗数据库进行分词操作得到。
...
【技术保护点】
【技术特征摘要】
1.一种医疗数据标准化方法,所述方法包括:获取用户医疗数据以及标准化医疗词典,其中,所述标准化医疗词典包括各个第一关键字以及标准化数组,所述标准化数组包括标准化医疗数据,所述第一关键字是根据医疗数据库进行分词操作得到;对所述用户医疗数据进行分词操作,得到各个短语;根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据。2.根据权利要求1所述的医疗数据标准化方法,其特征在于,所述根据所述第一关键字以及所述短语,在所述标准化数组中进行标准化医疗数据查询,得到所述用户医疗数据对应的目标标准化医疗数据,包括:判断在所述第一关键字中是否存在与所述短语匹配的所述第一关键字,若存在,则根据与所述短语匹配的所述第一关键字,在所述标准化数组中进行所述标准化医疗数据查询,得到所述目标标准化医疗数据;若不存在,则计算所述短语与每个所述第一关键字的相似度,将所述相似度最高的所述第一关键字,作为第二关键字;根据所述第二关键字,在所述标准化数组中进行查询,得到所述标准化医疗数据。3.根据权利要求2所述的医疗数据标准化方法,其特征在于,所述计算所述短语与每个所述第一关键字的相似度,将所述相似度最高的所述第一关键字,作为第二关键字,包括:判断所述短语的字符串长度与每个所述第一关键字的字符串长度是否相等;若存在相等,则计算所述短语和所述字符串长度与所述短语相等的所述第一关键字之间的汉明距离,得到所述相似度;若存在不相等,则判断所述字符串长度与所述第一关键字不相等的所述短语的字符串长度是否小于或等于预设长度,若小于或等于所述预设长度,则计算所述字符串长度与所述第一关键字不相等的所述短语与所述短语对应的所述第一关键字的编辑距离,得到所述相似度;将所述相似度最高的所述第一关键字,作为所述第二关键字。4.根据权利要求3所述的医疗数据标准化方法,其特征在于,所述将所述相似度最高的所述第一关键字,作为所述第二关键字,包括:若所述字符串长度与所述第一关键字不相等的所述短语的字符串长度大于所述预设长度,则对所述字符串长度与所述第一关键字不相等的所述短语进行分词,得到各个分词数据;对各个所述分词数据与所述第一关键字之间进行相同词语的数量计算,并根据所述数量,确定所述相似度;将所述相似度最高的所述第一关键字,作为所述第二关键字。5.根据权利要求2所述的医疗数据标准化方法,其特征在于,所述标准化数组包括子标准化数组,所述根据与所述短语匹配的所述第一关键字,在所述标准化数组中进行所述...
【专利技术属性】
技术研发人员:李金泉,梅婧,王义,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。