System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大模型的治疗方案生成方法及装置制造方法及图纸_技高网

一种基于大模型的治疗方案生成方法及装置制造方法及图纸

技术编号:40654280 阅读:20 留言:0更新日期:2024-03-13 21:30
本发明专利技术公开了一种基于大模型的治疗方案生成方法及装置,涉及计算辅助医疗技术领域,方法包括:对患者病症信息进行向量化处理;从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量,并获取参考病例向量对应的参考病例文本信息;按照提示词模版将患者病症信息和参考病例文本信息组合为提示词;将提示词输入至训练好的大模型中,得到患者病症对应的治疗方案。本发明专利技术将大模型与病例知识库结合,能够获得更加精准、有效、高质量的输入提示词,通过大量样本的微调训练,使大模型更加适用于输出治疗方案这一特定领域,也保证了模型输出结果的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机辅助医疗,特别涉及一种基于大模型的治疗方案生成方法及装置


技术介绍

1、在疾病治疗过程中,可供医生选择的药物种类繁多,医生要得到准确对应的药物或剂量,需要查询大量的历史病例,通过对历史病例进行研究分析才能得到合适的用药决策或治疗方案,整个过程中需要耗费较长的时间,准确性不高且效率低下。近年来,为了解决上述技术问题,计算机辅助治疗方案生成方法逐渐在医疗领域得到快速推广。

2、现有技术中通过计算机进行相似症状的治疗方案辅助生成往往通过以下三种方式:

3、方式一:信息化系统表单查询的方式。通过用户给定的格式化信息,例如基本信息、症状、饮食、工作信息、过往病史等,直接通过信息化系统表单的方式查询数据库进行精准匹配,推荐匹配结果。例如cn115394393a。

4、方式二:关键词检索的方式。通过对用户输入的信息进行分词,根据不同分词的权重进行全文检索,例如常见的tf-idf、bm25等。例如cn112116978a。

5、方式三:词槽+知识图谱方式。通过对用户输入的信息进行命名体识别词槽提取,根据提取结果进行实体关系映射,形成知识图谱,最后进行知识图谱查询。例如,cn116631643a、cn113450892a等。

6、然而,方式一操作过于繁琐,由于个人基本信息、饮食、工作环境、经历、过往病史都不一样,推荐倚重参数也不一样,不能充分利用所有因素,会出现匹配不到或匹配不准情况。方式二经常发生关键词提取不准确或关键词权重设置不合理,导致检索结果不理想,并且多通过文本相似度的方式进行推荐,没有考虑文本语义和整个上下文。方式三实现复杂度高,需要先设计顶层概念模型,再需要处理病例数据、个人信息、饮食、工作环境、经理、过往病史等数据,贯入到知识图谱中,才能进行图谱推荐,工作量大,特别是病例数据都是非结构化文字,需要人工整理、清洗成结构化数据,审核后才能入图谱,提取的信息比较零散,查询的结果比较片面。

7、因此,急需提供一种能够克服上述种种缺陷的计算机辅助治疗方案生成方法和装置。


技术实现思路

1、鉴于现有技术中的上述缺陷或不足,本专利技术提供了一种基于大模型的治疗方案生成方法及装置,以全部或部分的解决上述存在的技术问题。

2、本专利技术的一个方面,提供了一种基于大模型的治疗方案生成方法,包括:

3、对患者病症信息进行向量化处理;

4、将患者病症向量与病例查询向量库中的参考病例向量进行相似度匹配,从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量,并获取所述参考病例向量对应的参考病例文本信息,所述参考病例文本信息包括参考病症信息和参考治疗方案信息;

5、按照提示词模版将所述患者病症信息和所述参考病例文本信息组合为提示词;

6、将提示词输入至训练好的大模型中,得到患者病症对应的治疗方案。

7、进一步的,还包括病例查询向量库生成步骤:

8、将收集到的病例数据处理为文本信息,对所述文本信息进行分词处理,生成词汇表;

9、将单个病例按照词汇表中的分词获取对应的向量表示,计算全部分词对应的向量的平均值或加权平均值,得到单个病例文本的完整向量表示,将每个病例的完整向量表示存储至向量库,以构成病例查询向量库。

10、进一步的,还包括大模型微调步骤:

11、将收集到的病例数据中的病症数据作为训练样本中的提示词,

12、将收集到的病例数据中的治疗方案数据作为训练样本中的响应结果,

13、通过lora模式进行大模型的微调训练,得到训练好的大模型。

14、进一步的,对所述文本信息进行分词处理,生成词汇表的步骤还包括:过滤无效词并弃用停用词,按分词长度从小到大进行排序。

15、进一步的,所述将收集到的病例数据处理为文本信息的步骤,包括:对收集到的病例数据进行ocr处理和脚本处理,得到文本信息。

16、本专利技术的另一方面,还提供了一种基于大模型的治疗方案生成装置,包括:

17、向量化模块,被配置为对患者病症信息进行向量化处理;

18、相似度匹配模块,被配置为将患者病症向量与病例查询向量库中的参考病例向量进行相似度匹配,从病例查询向量库中筛选出与患者病症向量相似度最大的参考病例向量,并获取所述参考病例向量对应的参考病例文本信息,所述参考病例文本信息包括参考病症信息和参考治疗方案信息;

19、提示词获取模块,被配置为按照提示词模版将所述患者病症信息和所述参考病例文本信息组合为提示词;

20、治疗方案生成模块,被配置为将提示词输入至训练好的大模型中,得到患者病症对应的治疗方案。

21、进一步的,还包括:

22、病例查询向量库生成模块,被配置为将收集到的病例数据处理为文本信息,对所述文本信息进行分词处理,生成词汇表;将单个病例按照词汇表中的分词获取对应的向量表示,计算全部分词对应的向量的平均值或加权平均值,得到单个病例文本的完整向量表示,将每个病例的完整向量表示存储至向量库,以构成病例查询向量库。

23、进一步的,还包括:

24、大模型微调模块,被配置为将收集到的病例数据中的病症数据作为训练样本中的提示词,将收集到的病例数据中的治疗方案数据作为训练样本中的响应结果,通过lora模式进行大模型的微调训练,得到训练好的大模型。

25、进一步的,所述病例查询向量库生成模块被进一步配置为:过滤无效词并弃用停用词,按分词长度从小到大进行排序。

26、进一步的,所述病例查询向量库生成模块被进一步配置为:对收集到的病例数据进行ocr处理和脚本处理,得到文本信息。

27、本专利技术提供的基于大模型的治疗方案生成方法及装置,将大模型与病例知识库结合,能够获得更加精准、有效、高质量的输入提示词,通过大量样本的微调训练,使大模型更加适用于输出治疗方案这一特定领域,同时保证了模型输出结果的准确性。

本文档来自技高网...

【技术保护点】

1.一种基于大模型的治疗方案生成方法,其特征在于,包括:

2.根据权利要求1所述的一种基于大模型的治疗方案生成方法,其特征在于,还包括病例查询向量库生成步骤:

3.根据权利要求1所述的一种基于大模型的治疗方案生成方法,其特征在于,还包括大模型微调步骤:

4.根据权利要求2所述的一种基于大模型的治疗方案生成方法,其特征在于,对所述文本信息进行分词处理,生成词汇表的步骤还包括:过滤无效词并弃用停用词,按分词长度从小到大进行排序。

5.根据权利要求2所述的一种基于大模型的治疗方案生成方法,其特征在于,所述将收集到的病例数据处理为文本信息的步骤,包括:对收集到的病例数据进行OCR处理和脚本处理,得到文本信息。

6.一种基于大模型的治疗方案生成装置,其特征在于,包括:

7.根据权利要求6所述的一种基于大模型的治疗方案生成装置,其特征在于,还包括:

8.根据权利要求6所述的一种基于大模型的治疗方案生成装置,其特征在于,还包括:

9.根据权利要求7所述的一种基于大模型的治疗方案生成装置,其特征在于,所述病例查询向量库生成模块被进一步配置为:过滤无效词并弃用停用词,按分词长度从小到大进行排序。

10.根据权利要求7所述的一种基于大模型的治疗方案生成装置,其特征在于,所述病例查询向量库生成模块被进一步配置为:对收集到的病例数据进行OCR处理和脚本处理,得到文本信息。

...

【技术特征摘要】

1.一种基于大模型的治疗方案生成方法,其特征在于,包括:

2.根据权利要求1所述的一种基于大模型的治疗方案生成方法,其特征在于,还包括病例查询向量库生成步骤:

3.根据权利要求1所述的一种基于大模型的治疗方案生成方法,其特征在于,还包括大模型微调步骤:

4.根据权利要求2所述的一种基于大模型的治疗方案生成方法,其特征在于,对所述文本信息进行分词处理,生成词汇表的步骤还包括:过滤无效词并弃用停用词,按分词长度从小到大进行排序。

5.根据权利要求2所述的一种基于大模型的治疗方案生成方法,其特征在于,所述将收集到的病例数据处理为文本信息的步骤,包括:对收集到的病例数据进行ocr处理和脚本处...

【专利技术属性】
技术研发人员:李宇欣韩敏
申请(专利权)人:北京健康有益科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1