System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于图Transformer的智能医疗问诊方法及系统技术方案_技高网

一种基于图Transformer的智能医疗问诊方法及系统技术方案

技术编号:41207212 阅读:25 留言:0更新日期:2024-05-07 22:33
本发明专利技术公开了一种基于图Transformer的智能医疗问诊方法及系统,该方法包括:获取医疗结构化数据构建初步的医疗知识图谱;通过实体识别模型与图Transformer模型对初步的医疗知识图谱进行实体消歧处理,构建医疗知识图谱;将医疗知识图谱进行存储并通过Cypher语言进行图数据查询,实现智能医疗问诊。通过使用本发明专利技术,能够通过完善知识图谱的信息完整性并降低知识图谱的冗余性,进而提高知识图谱的大规模数据计算效率与知识回答的准确率。本发明专利技术作为一种基于图Transformer的智能医疗问诊方法及系统,可广泛应用于自然语言处理技术领域。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种基于图transformer的智能医疗问诊方法及系统。


技术介绍

1、近年来,人工智能的爆炸式增长为医疗健康行业带来了一场全新革命。在相关政策的支持下,智能医疗的多个领域飞速发展,而实现智能医疗问诊系统的关键在于如何精确理解和处理问答过程中的自然语言文本,其中确保电子医疗数据的准确性以及采用恰当的文本嵌入表示技术对智能医疗问诊系统的有效运作至关重要,但是现有的研究在构建医疗知识图谱来表达医疗信息时,知识图谱的内容仍具有不完整性以及冗余性的缺点,且大多知识图谱仅提供单向查询功能,这意味着虽然可以输入“肺炎”查询到“咳嗽”,但无法通过“咳嗽”回溯到“肺炎”。目前,在利用图神经网络挖掘知识图谱语义信息时,常见做法是将知识图谱的节点和边映射到一维空间,然后通过图卷积运算融合邻居节点嵌入和中心节点嵌入,并在此过程中引入注意力机制以赋予邻居节点适当的权重。然而该方法未充分考虑在大规模图数据上应用时计算效率问题,并且由于对所有邻居节点赋予相同的权重,这种平均聚合的方法忽视了不同邻居节点对中心节点的潜在不同重要性。

2、综上,现有基于知识图谱的医疗问答技术仍存在信息不完整性以及高度冗余性,无法有效根据输入问题生成准确和专业的回答。


技术实现思路

1、为了解决上述技术问题,本专利技术的目的是提供一种基于图transformer的智能医疗问诊方法及系统,能够通过完善知识图谱的信息完整性并降低知识图谱的冗余性,进而提高知识图谱的大规模数据计算效率与知识回答的准确率。

2、本专利技术所采用的第一技术方案是:一种基于图transformer的智能医疗问诊方法,包括以下步骤:

3、获取医疗结构化数据构建初步的医疗知识图谱;

4、通过实体识别模型与图transformer模型对初步的医疗知识图谱进行实体消歧处理,构建医疗知识图谱;

5、将医疗知识图谱进行存储并通过cypher语言进行图数据查询,实现智能医疗问诊。

6、进一步,所述获取医疗结构化数据构建初步的医疗知识图谱这一步骤,其具体包括:

7、获取医疗结构化数据并定义医疗疾病问题文本数据;

8、对医疗结构化数据与医疗疾病问题文本数据进行数据划分处理,得到划分后的医疗知识图谱,所述划分后的医疗知识图谱包括医疗结构化数据实体、医疗结构化数据属性、医疗疾病问题文本数据实体、医疗疾病问题文本数据属性以及医疗结构化数据实体与医疗疾病问题文本数据实体之间的双向关系;

9、基于划分后的医疗知识图谱,构建初步的医疗知识图谱。

10、进一步,所述通过实体识别模型与图transformer模型对初步的医疗知识图谱进行实体消歧处理,构建医疗知识图谱这一步骤,其具体包括:

11、通过实体识别模型对初步的医疗知识图谱中的医疗疾病问题文本数据进行实体识别处理,得到医疗问题文本实体项;

12、通过bert预训练模型与图transformer模型对医疗问题文本实体项进行嵌入学习,构建医疗知识图谱。

13、进一步,所述通过实体识别模型对初步的医疗知识图谱中的医疗疾病问题文本数据进行实体识别处理,得到医疗问题文本实体项这一步骤,其具体包括:

14、将初步的医疗知识图谱中的医疗疾病问题文本数据输入至实体识别模型,所述实体识别模型包括输入层、bi-lstm层和crf解码模块;

15、基于实体识别模型的输入层,通过bio标注方法对医疗疾病问题文本数据进行标注处理,得到标注后的医疗文本问题序列;

16、基于实体识别模型的bi-lstm层,对标注后的医疗文本问题序列进行依赖关系捕获处理,得到具有上下文信息的字符向量;

17、基于实体识别模型的crf解码模块,通过相邻标注之间的约束关系对具有上下文信息的字符向量进行识别处理,得到医疗问题文本实体项。

18、进一步,所述通过bert预训练模型与图transformer模型对医疗问题文本实体项进行嵌入学习,构建医疗知识图谱这一步骤,其具体包括:

19、通过bert预训练模型对医疗问题文本实体项进行向量化表示与特征融合处理,得到特征融合后的实体特征项;

20、通过图transformer模型对医疗问题文本实体项进行特征节点表示处理,得到候选实体节点向量;

21、基于全连接层对特征融合后的实体特征项与候选实体节点向量进行拼接,得到拼接后的实体特征向量;

22、通过sigmoid激活函数对拼接后的实体特征向量进行相似度得分计算处理,得到若干实体特征向量对应的实体分数;

23、选取实体分数最高对应的实体特征向量构建医疗知识图谱。

24、进一步,通过图transformer模型对医疗问题文本实体项进行特征节点表示处理,得到候选实体节点向量这一步骤,其具体包括:

25、基于图卷积神经网络,引入transformer架构中的多头注意机制,构建图transformer模型,所述图transformer模型包括输入层、特征提取层和图transformer层;

26、基于图transformer模型的输入层,对医疗问题文本实体项进行文本信息提取处理,得到候选实体项语义信息;

27、基于图transformer模型的特征提取层,对候选实体项语义信息进行特征提取处理,得到候选实体项特征矩阵和候选实体项邻接矩阵;

28、基于图transformer模型的图transformer层,对候选实体项特征矩阵和候选实体项邻接矩阵进行图嵌入表示处理,得到候选实体节点向量。

29、进一步,所述基于图transformer模型的图transformer层,对候选实体项特征矩阵和候选实体项邻接矩阵进行图嵌入表示处理,得到候选实体节点向量这一步骤,其具体包括:

30、通过transformer架构中的多头注意力机制构建若干图transformer层;

31、基于图transformer层,获取候选实体项特征矩阵的多头注意力信息和候选实体项邻接矩阵的多头注意力信息;

32、将候选实体项特征矩阵的多头注意力信息和候选实体项邻接矩阵的多头注意力信息进行拼接处理,得到候选实体节点向量。

33、进一步,所述基于图transformer层,获取候选实体项特征矩阵的多头注意力信息和候选实体项邻接矩阵的多头注意力信息这一步骤,其具体包括:

34、基于图transformer层,获取候选实体项特征矩阵的实体节点和候选实体项邻接矩阵的实体节点;

35、引入权重矩阵与偏置项对候选实体项特征矩阵的实体节点进行转换处理,生成查询矩阵;

36、引入权重矩阵与偏置项对候选实体项邻接矩阵的实体节点进行转换处理,生成键矩阵;

37、计算候选实体项特征矩阵的实体节点和候选实体项邻接矩阵的实体节点之间的边本文档来自技高网...

【技术保护点】

1.一种基于图Transformer的智能医疗问诊方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述获取医疗结构化数据构建初步的医疗知识图谱这一步骤,其具体包括:

3.根据权利要求1所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述通过实体识别模型与图Transformer模型对初步的医疗知识图谱进行实体消歧处理,构建医疗知识图谱这一步骤,其具体包括:

4.根据权利要求3所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述通过实体识别模型对初步的医疗知识图谱中的医疗疾病问题文本数据进行实体识别处理,得到医疗问题文本实体项这一步骤,其具体包括:

5.根据权利要求3所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述通过Bert预训练模型与图Transformer模型对医疗问题文本实体项进行嵌入学习,构建医疗知识图谱这一步骤,其具体包括:

6.根据权利要求5所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述通过图Transformer模型对医疗问题文本实体项进行特征节点表示处理,得到候选实体节点向量这一步骤,其具体包括:

7.根据权利要求6所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述基于图Transformer模型的图Transformer层,对候选实体项特征矩阵和候选实体项邻接矩阵进行图嵌入表示处理,得到候选实体节点向量这一步骤,其具体包括:

8.根据权利要求7所述一种基于图Transformer的智能医疗问诊方法,其特征在于,所述基于图Transformer层,获取候选实体项特征矩阵的多头注意力信息和候选实体项邻接矩阵的多头注意力信息这一步骤,其具体包括:

9.根据权利要求7所述一种基于图Transformer的智能医疗问诊方法,其特征在于,还包括引入跨层残差串联分支,将若干图Transformer层进行叠加,其中,所述跨层残差串联分支的表达式为:

10.一种基于图Transformer的智能医疗问诊系统,其特征在于,包括以下模块:

...

【技术特征摘要】

1.一种基于图transformer的智能医疗问诊方法,其特征在于,包括以下步骤:

2.根据权利要求1所述一种基于图transformer的智能医疗问诊方法,其特征在于,所述获取医疗结构化数据构建初步的医疗知识图谱这一步骤,其具体包括:

3.根据权利要求1所述一种基于图transformer的智能医疗问诊方法,其特征在于,所述通过实体识别模型与图transformer模型对初步的医疗知识图谱进行实体消歧处理,构建医疗知识图谱这一步骤,其具体包括:

4.根据权利要求3所述一种基于图transformer的智能医疗问诊方法,其特征在于,所述通过实体识别模型对初步的医疗知识图谱中的医疗疾病问题文本数据进行实体识别处理,得到医疗问题文本实体项这一步骤,其具体包括:

5.根据权利要求3所述一种基于图transformer的智能医疗问诊方法,其特征在于,所述通过bert预训练模型与图transformer模型对医疗问题文本实体项进行嵌入学习,构建医疗知识图谱这一步骤,其具体包括:

6.根据权利要求5所述一种基于图tr...

【专利技术属性】
技术研发人员:李珍妮马睿谢侃谢胜利
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1