System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱检索增强生成的智能中医辅诊系统技术方案_技高网

一种基于知识图谱检索增强生成的智能中医辅诊系统技术方案

技术编号:43760123 阅读:3 留言:0更新日期:2024-12-24 16:03
本发明专利技术公开了一种基于知识图谱检索增强生成的智能中医辅诊系统,所述系统包括知识库和在线推理模块,知识库包括向量知识库和图谱知识库,图谱知识库是通过大语言模型LLM对中医原始文本数据集进行知识抽取与实体识别而得到的;将图谱知识库里的实体向量化得到向量知识库;在线推理模块采用大语言模型LLM对用户问题进行命名实体识别,得到与中医相关的实体,在图谱知识库里查询包含最相关的实体的三元组,将查询得到的三元组作为已知知识,与用户问题拼接在一起作为提示词输入给大语言模型LLM。上述系统以专业中医知识为知识库,以大模型为知识整理与总结的工具,通过人机交互的方式对用户的需求进行精准识别。

【技术实现步骤摘要】

本专利技术涉及中医辅诊系统,尤其涉及一种基于知识图谱检索增强生成(retrieval-argumented generation,rag)的智能中医辅诊系统。


技术介绍

1、中医拥有深厚的历史底蕴和独特的治疗理念,其诊疗方法如针灸、草药、推拿等,不仅在中国,也在世界范围内受到了广泛的认可和应用。中医强调整体观念和阴阳平衡,其个性化的治疗方案和对疾病预防的重视,为现代医疗体系提供了宝贵的补充。然而,中医诊疗过程的复杂性,如“望、闻、问、切”的传统诊断方法,以及对医生个人经验和直觉的依赖,使得其在现代社会追求高效率的医疗环境中显得格格不入。这种个性化和经验化的诊疗方式,虽然能够为患者提供细致入微的关怀,但也导致了治疗过程的耗时和资源的分散,难以满足现代社会对快速、标准化医疗服务的需求。此外,中医知识的传承和普及也面临着挑战,因为其深奥的理论和实践技能需要长时间的学习和实践才能掌握。

2、随着互联网技术和信息技术的飞速发展,中医领域的数据和信息资源得到了前所未有的增长。中医专业网站、在线数据库和电子书籍等资源的涌现,为中医知识的传播和应用提供了新的平台。这些数字化资源的建立,无疑为中医文化的传承和发展开辟了新的途径,使得更多的人能够方便地获取和学习中医知识。

3、但是,传统搜索引擎在处理这些中医专业信息时,却显示出了明显的局限性。基于关键词匹配的搜索机制,往往无法准确理解用户的查询意图,导致搜索结果中充斥着大量不相关或冗余的信息。用户在面对海量数据时,难以快速找到真正有价值的信息,这不仅增加了用户的认知负担,也降低了信息检索的效率。此外,互联网上虚假信息的泛滥,使得用户在获取中医信息时,难以辨别其真实性和可靠性,这对于专业性强、需要精确信息的中医领域来说,无疑是一个巨大的挑战。

4、综上所述,中医文化在现代社会中的重要性不言而喻,但其诊疗过程的复杂性和与现代医疗效率要求的矛盾,以及传统搜索引擎在处理中医信息时的局限性,都制约了中医适应现代社会的能力。为了克服这些挑战,我们需要探索更加高效和智能的信息检索技术,以及创新中医诊疗模式,使其能够更好地融入现代医疗体系,发挥其独特的价值和作用。


技术实现思路

1、本专利技术的目的是提供一种基于知识图谱检索增强生成的智能中医辅诊系统,该系统以专业中医知识为知识库,以大模型为知识整理与总结的工具,通过人机交互的方式对用户的需求进行精准识别,快速返回符合要求的答案,克服传统搜索引擎的缺陷。

2、本专利技术的目的是通过以下技术方案实现的:

3、一种基于知识图谱检索增强生成的智能中医辅诊系统,所述系统包括知识库和在线推理模块,其中:

4、所述知识库包括向量知识库和图谱知识库,图谱知识库是大语言模型llm通过提示工程对中医原始文本数据集进行知识抽取与实体识别而得到的;

5、其中,共包含13类实体:药品、药物成分、疾病、症状、证候、疾病分组、食物、食物分组、人群、药品分组、药物剂型、药物性味和中药功效;

6、大语言模型llm根据原始文本语料中相关实体之间的关系,输出三元组列表,三元组列表中每个元素包括一个实体、另一个实体以及两个实体之间的关系;

7、然后使用微调后的m3e-large向量嵌入模型,将所述图谱知识库里的实体向量化,并使用近似近邻搜索算法ann对向量进行聚类,以加快向量检索速度,最终得到向量知识库;其中,m3e-large是一种通用型向量嵌入模型;

8、所述在线推理模块采用大语言模型llm对用户问题进行命名实体识别,得到与中医相关的实体,使用微调后的m3e-large向量嵌入模型对提取出的中医相关实体进行向量化,再与所述向量知识库中的向量进行余弦相似度查询,得到与所述用户问题中的疾病最相关的top k个实体;然后在所述图谱知识库里查询包含这些实体的所有三元组,将这些三元组进行多尺度排序,将得分靠前的三元组作为已知知识,与用户问题拼接在一起作为指令输入给大语言模型llm,由大语言模型llm输出对应的查询结果。

9、由上述本专利技术提供的技术方案可以看出,上述系统以专业中医知识为知识库,以大模型为知识整理与总结的工具,通过人机交互的方式对用户的需求进行精准识别,快速返回符合要求的答案,克服传统搜索引擎的缺陷。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,所述系统包括知识库和在线推理模块,其中:

2.根据权利要求1所述基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,在所述在线推理模块的筛选三元组环节中,使用多尺度融合打分的方法,利用不同特征融合后的分数排序,筛选出得分靠前的三元组;

3.根据权利要求1所述基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,所述系统还包括通用意图识别模块,意图识别模块用于当检索到用户问题是与所述知识库内容无关的问题时,判断为通用意图问题,则直接跳过检索模块,由大语言模型LLM依靠预训练阶段学习到的语料回答,提高检索效率;

4.根据权利要求1所述基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,所述系统还包括自我反思模块,用于在单轮检索生成答案并不能包含回答用户问题的全部知识时,在大语言模型LLM输出答案前加入用于判断回答与用户问题的相关性判别器,如果判断不相关,则加入相似实体再做一次迭代检索,为实体列表做了一次动态扩充,增大候选三元组数量,具体来说:

【技术特征摘要】

1.一种基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,所述系统包括知识库和在线推理模块,其中:

2.根据权利要求1所述基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,在所述在线推理模块的筛选三元组环节中,使用多尺度融合打分的方法,利用不同特征融合后的分数排序,筛选出得分靠前的三元组;

3.根据权利要求1所述基于知识图谱检索增强生成的智能中医辅诊系统,其特征在于,所述系统还包括通用意图识别模块,意图识别模块用于当检索到用户问题是与所述知...

【专利技术属性】
技术研发人员:陈琪倪林
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1