System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种疾病数据检索方法、装置、设备及介质制造方法及图纸_技高网

一种疾病数据检索方法、装置、设备及介质制造方法及图纸

技术编号:42046286 阅读:5 留言:0更新日期:2024-07-16 23:28
一种疾病数据检索方法、装置、设备及介质,包括获取待查询疾病;根据待查询疾病对应的疾病向量索引和预先构建的疾病向量数据库中疾病相关数据对应的向量索引进行相似度计算;疾病向量数据库基于疾病相关数据及疾病相关数据对应的向量索引构建;根据相似度计算得到的结果生成疾病检索结果。解决在临床医疗领域中进行疾病数据检索时,采用关系数据库进行检索时检索的准确度不够高的技术问题。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体涉及一种疾病数据检索方法、装置、设备及介质


技术介绍

1、在临床医疗领域中,通常会对临床疾病的疾病名、临床疾病相关描述以及临床疾病的一些医学特征进行总结和归纳,并采用传统关系数据库或者是单纯的文本形式进行存储处理。在采用传统关系数据库或者单纯的文本形式对临床疾病的相关数据进行存储时,虽然能够方便的嵌合到其业务系统中,但是基于该关系数据库进行检索时比较受限,从而导致进行疾病数据检索的准确度和效率不够高。

2、在基于关系数据库进行检索时,通常是基于一个单独的数值检索到具体的疾病数据,例如,根据疾病名称查询对应的数据库或者根据文件名查询对应的数据库,这种查询方式适合根据单个属性进行数据查询的场景,无法很好的适用于医学领域中关于疾病中文知识的诉求。同时,由于医疗临床领域疾病总结往往具有较强的专业导向性,同时,结合语言本身的复杂性,相同的词汇在不同的语境中可能有不同的含义,而关系数据库的查询是基于精准匹配实现的,因此无法很好的处理语义层次上的差异。


技术实现思路

1、本专利技术主要解决的技术问题是在临床医疗领域中进行疾病数据检索时,采用关系数据库进行检索时检索的准确度不够高。

2、根据第一方面,一种实施例中提供一种疾病数据检索方法,包括:

3、获取待查询疾病;

4、根据所述待查询疾病对应的疾病向量索引和预先构建的疾病向量数据库中疾病相关数据对应的向量索引进行相似度计算;所述疾病向量数据库基于疾病相关数据及所述疾病相关数据对应的向量索引构建;

5、根据相似度计算得到的结果生成疾病检索结果。

6、一些实施例中,所述疾病向量数据库基于疾病相关数据及所述疾病相关数据对应的向量索引构建,构建过程包括:

7、对所述疾病相关数据进行向量化处理,得到所述疾病相关数据对应的疾病向量;

8、利用预设最近邻搜索算法构建所述疾病向量对应的索引;其中,将所述疾病向量对应的索引作为所述疾病相关数据对应的向量索引;

9、以所述疾病相关数据和所述疾病向量对应的向量索引作为参考字段,以预获取的临床疾病数据集作为待写入数据,构建得到疾病向量数据库。

10、一些实施例中,所述对所述疾病相关数据进行向量化处理,包括:

11、根据预训练的语言模型或者深度学习模型对所述疾病相关数据进行向量化处理。

12、一些实施例中,所述相似度计算包括分别计算所述待查询疾病对应的疾病向量索引和所述疾病相关数据对应的向量索引之间的欧几里得距离对应的相似度分数、内积对应的相似度分数或余弦相似度对应的相似度分数。

13、一些实施例中,所述根据相似度计算得到的结果生成疾病检索结果,包括:

14、当所述相似度计算得到的结果包括欧几里得距离对应的相似度分数时,按照所述相似度分数从小到大的顺序对所述疾病相关数据进行排序,并将排序后的所述疾病相关数据中符合预设筛选要求的数据作为疾病检索结果;

15、当所述相似度计算得到的结果包括内积对应的相似度分数或者余弦相似度对应的相似度分数时,按照所述相似度分数从大到小的顺序对所述疾病相关数据进行排序,并将排序后的所述疾病相关数据中符合预设筛选要求的数据作为疾病检索结果。

16、一些实施例中,调整所述疾病相关数据对应的向量索引的索引参数,并根据调整后的所述索引参数生成新的疾病检索结果。

17、一些实施例中,当接收到数据更新请求时,构建接收到的临床疾病数据对应的向量索引,并基于所述向量索引和所述临床疾病数据对所述疾病向量数据库进行数据库更新。

18、根据第二方面,一种实施例中提供一种疾病数据检索装置,包括:

19、相似度计算模块,用于获取待查询疾病;根据所述待查询疾病对应的疾病向量索引和预先构建的疾病向量数据库中疾病相关数据对应的向量索引进行相似度计算;所述疾病向量数据库基于疾病相关数据及所述疾病相关数据对应的向量索引构建;

20、结果检索模块,用于根据相似度计算得到的结果生成疾病检索结果。

21、根据第三方面,一种实施例中提供一种疾病数据检索设备,包括:

22、存储器,用于存储程序;

23、处理器,用于通过执行所述存储器存储的程序以实现所述的疾病数据搜索方法。

24、根据第四方面,一种实施例中提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现所述的疾病数据搜索方法。

25、依据上述实施例的疾病数据检索方法、装置、设备及计算机可读存储介质,根据待查询疾病对应的疾病向量索引和预先构建的疾病向量数据库中疾病相关数据对应的向量索引进行相似度计算。其中,疾病向量数据库基于疾病相关数据及疾病相关数据对应的向量索引构建,疾病向量数据库中通过向量表示疾病相关数据,并通过向量索引来简化检索的过程。通过相似度计算得到的结果生成疾病检索结果,能够更好地满足相似度上的需求,并处理语义层次上的差异,从而更准确地理解待查询疾病的查询意图,进而提高疾病数据检索的准确度。

本文档来自技高网...

【技术保护点】

1.一种疾病数据检索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述疾病向量数据库基于疾病相关数据及所述疾病相关数据对应的向量索引构建,构建过程包括:

3.如权利要求2所述的方法,其特征在于,所述对所述疾病相关数据进行向量化处理,包括:

4.如权利要求1所述的方法,其特征在于,所述相似度计算包括分别计算所述待查询疾病对应的疾病向量索引和所述疾病相关数据对应的向量索引之间的欧几里得距离对应的相似度分数、内积对应的相似度分数或余弦相似度对应的相似度分数。

5.如权利要求1所述的方法,其特征在于,所述根据相似度计算得到的结果生成疾病检索结果,包括:

6.如权利要求1所述的方法,其特征在于,调整所述疾病相关数据对应的向量索引的索引参数,并根据调整后的所述索引参数生成新的疾病检索结果。

7.如权利要求1所述的方法,其特征在于,当接收到数据更新请求时,构建接收到的临床疾病数据对应的向量索引,并基于所述向量索引和所述临床疾病数据对所述疾病向量数据库进行数据库更新。

8.一种疾病数据检索装置,其特征在于,包括:

9.一种疾病数据检索设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述介质上存储有程序,所述程序能够被处理器执行以实现如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种疾病数据检索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述疾病向量数据库基于疾病相关数据及所述疾病相关数据对应的向量索引构建,构建过程包括:

3.如权利要求2所述的方法,其特征在于,所述对所述疾病相关数据进行向量化处理,包括:

4.如权利要求1所述的方法,其特征在于,所述相似度计算包括分别计算所述待查询疾病对应的疾病向量索引和所述疾病相关数据对应的向量索引之间的欧几里得距离对应的相似度分数、内积对应的相似度分数或余弦相似度对应的相似度分数。

5.如权利要求1所述的方法,其特征在于,所述根据相似度计算得到的结果生成疾病检索结...

【专利技术属性】
技术研发人员:蔡家伟刘永初李阳刘阳燕攀
申请(专利权)人:深圳雅济科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1