System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智能医疗,尤其是涉及一种icd编码方法、装置、电子设备及介质。
技术介绍
1、国际疾病分类(international classification of diseases,icd)是世界卫生组织(who)制定的一种用于统计和跟踪各种疾病和健康相关问题的标准编码分类系统,致力于用统一的icd编码构建不同地区、不同时间段和不同人群中的医疗编码分类数据,使其可用于临床诊断、流行病学研究、政策制定,以及医疗保险的审核和付费依据,因此准确的icd编码在疾病识别过程中显得尤为重要。
2、智能icd编码是自然语言处理技术在医学领域的主要应用场景之一,该任务以往的目标是根据患者的电子病历(electronic medical record,emr)中患者的过往病史、症状、体征和主诉等文本数据,判断患者可能患有疾病的icd编码。然而智能icd编码长久以来受到多方面的挑战,使得icd编码效果不佳。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种icd编码方法、装置、电子设备及介质,以提高了icd编码的可解释性以及准确度。
2、为了实现上述目的,本专利技术实施例采用的技术方案如下:
3、第一方面,本专利技术实施例提供了一种icd编码方法,包括:获取用户输入的第一提问请求,并基于第一提问请求和预先构建的icd知识语料库进行词频检索和语义检索,得到词频检索的第一icd编码和语义检索的第二icd编码;基于第一icd编码和第二icd编码进行结果融合和
4、在一种实施方式中,icd知识语料库的构建,包括:获取icd编码标准文件,并对icd编码标准文件进行解析得到icd信息表,并将icd信息表保存至关系型数据库mysql中;其中,icd信息表至少包括:编号、icd编码、icd名称和icd疾病描述,icd疾病描述是通过大语言模型生成的;将icd信息表保存至elasticsearch得到icd索引表;其中,icd索引表至少包括:编号、icd名称和icd疾病描述;将icd信息表中的icd名称和icd疾病描述进行向量化,生成icd名称的词向量和icd疾病描述的词向量,并将icd名称的词向量和icd疾病描述的词向量保存至milvus库的向量集合中。
5、在一种实施方式中,基于第一提问请求和预先构建的icd知识语料库进行词频检索和语义检索,得到词频检索的第一icd编码和语义检索的第二icd编码,包括:基于第一提问请求,采用bm25算法对icd索引表中的icd名称和icd疾病描述进行词频检索,得到词频检索的第一icd编码;将第一提问请求进行向量化生成嵌入向量,并基于嵌入向量,分别对icd名称的词向量和icd疾病描述的词向量进行语义检索,得到语义检索的第二icd编码。
6、在一种实施方式中,基于第一icd编码和第二icd编码进行结果融合和重排序得到icd编码结果,包括:计算第一icd编码和第二icd编码的秩比融合得分值,并基于秩比融合得分值获取预设数量的融合后的icd编码;基于icd信息表获取融合后的icd编码对应的icd名称和icd疾病描述;计算融合后的icd编码、icd名称、icd疾病描述与第一提问请求之间的相似度,并基于相似度对融合后的icd编码进行过滤得到icd编码结果。
7、在一种实施方式中,基于icd编码结果,采用大语言模型得到第一提问请求对应的目标icd编码和目标icd名称,包括:将每个icd编码结果与第一提问请求进行拼接得到提示词;将提示词输入到大语言模型中,得到第一提问请求对应的目标icd编码和目标icd名称。
8、在一种实施方式中,还包括:获取用户的第二提问请求,并基于第二提问请求和目标icd编码,通过大语言模型生成第二提问请求对应的疾病说明。
9、第二方面,本专利技术实施例提供了一种icd编码装置,包括:检索模块,用于获取用户输入的第一提问请求,并基于第一提问请求和预先构建的icd知识语料库进行词频检索和语义检索,得到词频检索的第一icd编码和语义检索的第二icd编码;结果融合和重排序模块,用于基于第一icd编码和第二icd编码进行结果融合和重排序得到icd编码结果;编码模块,用于基于icd编码结果,采用大语言模型得到第一提问请求对应的目标icd编码和目标icd名称。
10、在一种实施方式中,还包括:icd知识语料库构建模块,用于:获取icd编码标准文件,并对icd编码标准文件进行解析得到icd信息表,并将icd信息表保存至关系型数据库mysql中;其中,icd信息表至少包括:编号、icd编码、icd名称和icd疾病描述,icd疾病描述是通过大语言模型生成的;将icd信息表保存至elasticsearch得到icd索引表;其中,icd索引表至少包括:编号、icd名称和icd疾病描述;将icd信息表中的icd名称和icd疾病描述进行向量化,生成icd名称的词向量和icd疾病描述的词向量,并将icd名称的词向量和icd疾病描述的词向量保存至milvus库的向量集合中。
11、第三方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面提供的任一项的方法的步骤。
12、第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面提供的任一项的方法的步骤。
13、本专利技术实施例带来了以下有益效果:
14、本专利技术实施例提供的上述icd编码方法、装置、电子设备及介质,首先获取用户输入的第一提问请求,并基于第一提问请求和预先构建的icd知识语料库进行词频检索和语义检索,得到词频检索的第一icd编码和语义检索的第二icd编码;然后基于第一icd编码和第二icd编码进行结果融合和重排序得到icd编码结果;最后基于icd编码结果,采用大语言模型得到第一提问请求对应的目标icd编码和icd名称。上述方法利用预先构建的icd知识语料库检索相关的icd编码,检索到的icd编码可以在icd知识语料库中进行溯源,从而提高了icd编码的可解释性;同时,上述方法通过词频检索和语义检索进行多路检索,能够准确地检索出相关的icd信息,并通过大语言模型对检索到的icd编码结果进行判断,进一步提高了icd编码的准确性。
15、本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
16、为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
本文档来自技高网...【技术保护点】
1.一种ICD编码方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述ICD知识语料库的构建,包括:
3.根据权利要求2所述的方法,其特征在于,基于所述第一提问请求和预先构建的ICD知识语料库进行词频检索和语义检索,得到词频检索的第一ICD编码和语义检索的第二ICD编码,包括:
4.根据权利要求1所述的方法,其特征在于,基于所述第一ICD编码和所述第二ICD编码进行结果融合和重排序得到ICD编码结果,包括:
5.根据权利要求1所述的方法,其特征在于,基于所述ICD编码结果,采用大语言模型得到所述第一提问请求对应的目标ICD编码和目标ICD名称,包括:
6.根据权利要求1所述的方法,其特征在于,还包括:
7.一种ICD编码装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,还包括:ICD知识语料库构建模块,用于:
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至6任一项所述的方法的步骤。
...【技术特征摘要】
1.一种icd编码方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述icd知识语料库的构建,包括:
3.根据权利要求2所述的方法,其特征在于,基于所述第一提问请求和预先构建的icd知识语料库进行词频检索和语义检索,得到词频检索的第一icd编码和语义检索的第二icd编码,包括:
4.根据权利要求1所述的方法,其特征在于,基于所述第一icd编码和所述第二icd编码进行结果融合和重排序得到icd编码结果,包括:
5.根据权利要求1所述的方法,其特征在于,基于所述icd编码结果,采用大语言模型得到所述第一提问请求对应的目标icd编码和目标...
【专利技术属性】
技术研发人员:虞明星,陈旭,洪平,刘宁,赵大平,黄智勇,孙前方,赵辉,王琪,黄克华,
申请(专利权)人:卫宁健康科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。