System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于心血管共病知识图谱更新医疗大模型的方法和装置制造方法及图纸_技高网

基于心血管共病知识图谱更新医疗大模型的方法和装置制造方法及图纸

技术编号:41678829 阅读:3 留言:0更新日期:2024-06-14 15:32
本发明专利技术实施例涉及一种基于心血管共病知识图谱更新医疗大模型的方法和装置,所述方法包括:获取医疗大模型的基座模型参数集;并基于基座模型参数集对医疗大模型进行参数配置得到对应的第一基座模型;采集心血管共病领域知识并结合第一基座模型的编码器网络为医疗大模型的各个下游模型任务构建对应的知识图谱记为对应的第一知识图谱;基于各个第一知识图谱对第一基座模型进行模型参数微调得到对应的第一下游任务大模型。通过本发明专利技术可以解决心血管共病细分领域的模型微调方案缺失问题,还能与各个下游模型任务相结合通过模型参数微调得到多个下游任务大模型。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种基于心血管共病知识图谱更新医疗大模型的方法和装置


技术介绍

1、生成式大语言模型(large l anguage mode l s,llm)可用于多种领域,将其应用在医疗领域就可被称为医疗大模型。医疗大模型在具体应用之前需要基于医疗领域知识对其进行预训练、预训练后得到的大模型也被称为基座模型。若要进一步将该医疗大模型应用在一个具体的细分领域、诸如心血管共病细分领域,则需要基于心血管共病细分领域的知识对基座模型进行进一步的微调。目前大模型的预训练技术方案都比较成熟,但基于心血管共病细分领域的模型微调方案却没有成熟的技术方案可供参考。本专利技术要解决的技术问题就是如何基于心血管共病细分领域的知识对完成预训练后的医疗大模型(也称为基座模型)进行模型参数微调(也称为模型更新)。


技术实现思路

1、本专利技术的目的,就是针对现有技术的缺陷,提供一种基于心血管共病知识图谱更新医疗大模型的方法、装置、电子设备及计算机可读存储介质。本专利技术基于基座模型参数集配置医疗大模型得到基座模型;并通过采集心血管共病领域知识为医疗大模型的各个下游模型任务(医学词汇查询任务、疾病分类预测任务、疾病治疗方案预测任务和危重症风险预测任务)构建对应的知识图谱;并基于各个下游模型任务对应的知识图谱对基座模型进行模型参数微调得到对应的下游任务大模型。通过本专利技术既可以解决心血管共病细分领域的模型微调方案缺失问题,还能与医疗大模型的各个下游模型任务相结合通过模型参数微调得到多个下游任务大模型。

2、为实现上述目的,本专利技术实施例第一方面提供了一种基于心血管共病知识图谱更新医疗大模型的方法,所述方法包括:

3、获取医疗大模型的基座模型参数集;并基于所述基座模型参数集对所述医疗大模型进行参数配置得到对应的第一基座模型;

4、采集心血管共病领域知识并结合所述第一基座模型的编码器网络为所述医疗大模型的各个下游模型任务构建对应的知识图谱记为对应的第一知识图谱;

5、基于各个所述第一知识图谱对所述第一基座模型进行模型参数微调得到对应的第一下游任务大模型。

6、优选的,所述医疗大模型为一类基于transformer模型结构实现的生成式大语言模型,由所述编码器网络、解码器网络和多个下游任务预测网络组成;每个所述下游任务预测网络对应一个所述下游模型任务;所述医疗大模型的所述编码器网络、所述解码器网络和一个所述下游任务预测网络组成一个对应的下游任务大模型;

7、所述下游模型任务包括医学词汇查询任务、疾病分类预测任务、疾病治疗方案预测任务和危重症风险预测任务;其中,所述医学词汇查询任务为基于输入的医学词汇名称进行词汇释义查询的模型处理任务;所述疾病分类预测任务为基于输入的检测信息和/或检验信息和/或症状表述信息进行疾病分类预测的模型处理任务;所述疾病治疗方案预测任务为基于模型输入的疾病类型信息和/或检测信息和/或检验信息和/或症状表述信息进行治疗方案预测的模型处理任务;所述危重症风险预测任务为基于模型输入的检测信息和/或检验信息和/或症状表述信息进行症疾病类型及其对应的危重症等级预测的模型处理任务;

8、所述医疗大模型的推理过程为:yi=mi(xi;ae,ad,api);i为下游模型任务索引,1≤i≤n,n为所述下游模型任务的总数;mi为一类所述下游任务大模型的模型推理表达式;xi、yi为与mi对应的所述下游任务大模型的输入目标信息和输出预测信息;ae为所述编码器网络的模型参数集;ad为所述解码器网络的模型参数集;api为与mi对应的所述下游任务预测网络的模型参数集;

9、所述基座模型参数集为对所述医疗大模型完成预训练后得到的全模型参数集,包括aepre、adpre和四个api,pre;aepre为完成预训练的所述医疗大模型的所述编码器网络的模型参数集;adpre为完成预训练的所述医疗大模型的所述解码器网络的模型参数集;api,pre为完成预训练的所述医疗大模型的各个所述下游任务预测网络的模型参数集。

10、优选的,所述第一知识图谱由多个第一节点和多个第一节点边组成;

11、所述第一节点包括第一节点标识、第一节点类型和第一节点属性集;

12、所述第一节点标识为每个所述第一节点的唯一标识编码;

13、所述第一节点类型包括目标节点和预测节点;

14、所述第一节点属性集包括一个或多个第一节点属性;

15、所述第一节点属性包括第一属性类型和第一属性数据;

16、所述第一属性类型包括词汇名称属性、检测属性、检验属性、症状描述属性、疾病类型属性、词汇释义属性、治疗方案属性和危重症类型及等级属性;所述第一属性类型为词汇名称属性时,对应的所述第一属性数据为一个医学词汇名称;所述第一属性类型为检测属性时,对应的所述第一属性数据为一项医学检测项目的检测记录;所述第一属性类型为检验属性时,对应的所述第一属性数据为一项医学检验项目的检验记录;所述第一属性类型为症状描述属性时,对应的所述第一属性数据为一个用于描述疾病症状表现的症状描述记录;所述第一属性类型为疾病类型属性时,对应的所述第一属性数据为一类具体的疾病类型;所述第一属性类型为词汇释义属性时,对应的所述第一属性数据为一段医学词汇释义文本;所述第一属性类型为治疗方案属性时,对应的所述第一属性数据为一个治疗方案记录;所述第一属性类型为危重症类型及等级属性时,对应的所述第一属性数据由一个疾病类型和一个危重症等级组成;

17、所述第一节点边为有向节点边、用于连接两个所述第一节点记为对应的第一起始节点和第一结束节点;所述第一起始节点为一个所述第一节点类型为目标节点的所述第一节点,所述第一结束节点为一个所述第一节点类型为预测节点的所述第一节点;所述第一节点边包括第一起始节点标识、第一结束节点标识和第一节点边特征量;所述第一起始节点标识和所述第一结束节点标识分别为对应的所述第一起始节点和所述第一结束节点的所述第一节点标识;所述第一节点边特征量为与所述第一起始节点的所述第一节点属性集对应的特征编码张量,由所述医疗大模型的所述编码器网络对所述第一起始节点的所述第一节点属性集进行编码得到;

18、所述第一知识图谱中,一个所述第一节点类型为目标节点的所述第一节点只与一个所述第一节点类型为预测节点的所述第一节点连接;但一个所述第一节点类型为预测节点的所述第一节点可与一个或多个所述第一节点类型为目标节点的所述第一节点连接。

19、优选的,在与所述医学词汇查询任务对应的所述第一知识图谱中,各个所述第一节点类型为目标节点的所述第一节点的所述第一节点属性集由一个所述第一属性类型为词汇名称属性的所述第一节点属性组成;各个所述第一节点类型为预测节点的所述第一节点的所述第一节点属性集由一个所述第一属性类型为词汇释义属性的所述第一节点属性组成;

20、在与所述疾病分类预测任务对应的所述第一知识图谱中,各个所述第一节点类型为目标节点的所述本文档来自技高网...

【技术保护点】

1.一种基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,

3.根据权利要求2所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,

4.根据权利要求3所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,

5.根据权利要求4所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述采集心血管共病领域知识并结合所述第一基座模型的编码器网络为所述医疗大模型的各个下游模型任务构建对应的知识图谱记为对应的第一知识图谱,具体包括:

6.根据权利要求5所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于所述第一名称释义记录集合和所述第一基座模型的所述编码器网络对所述下游模型任务之一的所述医学词汇查询任务对应的所述第一知识图谱进行构建,具体包括:

7.根据权利要求5所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于所述第一疾病诊断记录集合和所述第一基座模型的所述编码器网络对所述下游模型任务之一的所述疾病分类预测任务对应的所述第一知识图谱进行构建,具体包括:

8.根据权利要求5所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于所述第一疾病治疗方案记录集合和所述第一基座模型的所述编码器网络对所述下游模型任务之一的所述疾病治疗方案预测任务对应的所述第一知识图谱进行构建,具体包括:

9.根据权利要求5所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于所述第一危重症疾病评估记录集合和所述第一基座模型的所述编码器网络对所述下游模型任务之一的所述危重症风险预测任务对应的所述第一知识图谱进行构建,具体包括:

10.根据权利要求4所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于各个所述第一知识图谱对所述第一基座模型进行模型参数微调得到对应的第一下游任务大模型,具体包括:

11.一种用于执行权利要求1-10任一项所述的基于心血管共病知识图谱更新医疗大模型的方法的装置,其特征在于,所述装置包括:基座模型配置模块、知识图谱构建模块和模型参数微调模块;

12.一种电子设备,其特征在于,包括:存储器、处理器和收发器;

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-10任一项所述的方法。

...

【技术特征摘要】

1.一种基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,

3.根据权利要求2所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,

4.根据权利要求3所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,

5.根据权利要求4所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述采集心血管共病领域知识并结合所述第一基座模型的编码器网络为所述医疗大模型的各个下游模型任务构建对应的知识图谱记为对应的第一知识图谱,具体包括:

6.根据权利要求5所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于所述第一名称释义记录集合和所述第一基座模型的所述编码器网络对所述下游模型任务之一的所述医学词汇查询任务对应的所述第一知识图谱进行构建,具体包括:

7.根据权利要求5所述的基于心血管共病知识图谱更新医疗大模型的方法,其特征在于,所述基于所述第一疾病诊断记录集合和所述第一基座模型的所述编码器网络对所述下游模型任务之一的所述疾病分类预测任务对应的所述第一知识图谱进行构建,具体包括:

8.根据权利要求...

【专利技术属性】
技术研发人员:何昆仑尹成亮孙晓春陈媛媛王万玲乌日力格许嘉宇童越
申请(专利权)人:中国人民解放军总医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1