System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医疗,具体是一种医疗文本混合检索方法及系统。
技术介绍
1、在智慧医疗的背景下,医疗文本检索是一项关键的技术,它利用计算机技术和自然语言处理技术(nlp),使得海量的医疗文献、病历记录、诊断报告等文本信息能够被高效地检索和提取。
2、在繁忙的医疗工作中,医生们需要快速了解患者病情相关的病史以及相关的诊疗信息,以便做出准确的诊断和治疗决策。传统的病历查询和资料查阅方式不仅效率低下,而且容易出错。而医疗文本检索技术则能够通过关键词、疾病名称、症状描述等多种方式进行检索,帮助医生迅速定位到相关的医疗信息。通过医疗文本检索技术,患者可以自行查询相关的医疗文献和资料,了解自己的疾病类型、治疗方案以及预后情况等信息。这不仅有助于患者更加科学地了解自己的病情,也能够减少不必要的恐慌和焦虑,提高患者的治疗信心和满意度。
3、已有的实现方案是基于传统关键字的检索方法。这种方法它通过用户输入的关键字或短语来检索医疗相关的文本数据。然而,这种方法存在处理歧义性、词汇匹配、信息过载、复杂查询等方面存在一些缺点,限制了其在文本检索中的应用效果。
技术实现思路
1、本专利技术提供了一种医疗文本混合检索方法及系统,以解决上述至少一方面的问题。
2、本专利技术提供了一种医疗文本混合检索方法,方法包括:
3、获取用户输入的检索数据;
4、将所述检索数据转换为待检索向量;
5、将待检索向量输入到预先构建的向量数据库中进行相似度检索,
6、将用户输入的检索数据输入到预先构建的结构化数据库中进行关键字检索,得到第二查询结果;
7、利用倒序排序算法对第一查询结果和第二查询结果进行融合排序处理,得到相应融合排序结果,并返回所述融合排序结果。
8、进一步地,在构建向量数据库和结构化数据库之前:
9、收集医疗相关的文本数据,并对文本数据进行清洗,得到标准化医疗文本数据。
10、进一步地,向量数据库的构建方法为:
11、将标准化医疗文本数据转换为医疗文本向量,并将医疗文本向量映射到连续向量空间,利用映射后的医疗文本向量构建向量数据库。
12、进一步地,结构化数据库的构建方法为:
13、从标准化医疗文本数据中提取出医疗结构化数据,利用医疗结构化数据构建结构化数据库。
14、进一步地,对文本数据进行清洗包括:
15、去除文本数据中的html标记、停用词和特殊字符。
16、进一步地,从标准化医疗文本数据中提取出医疗结构化数据,包括:
17、对标准化医疗文本数据进行命名实体识别、关系抽取和事件抽取,对应得到标准化医疗文本数据的医疗结构化数据。
18、本专利技术还提供了一种医疗文本混合检索系统,系统包括:
19、获取模块,用于获取用户输入的检索数据;
20、检索向量转换模块,用于将所述检索数据转换为待检索向量;
21、向量数据库检索模块,用于将待检索向量输入到预先构建的向量数据库中进行相似度检索,得到第一查询结果;
22、结构化数据库检索模块,将用户输入的检索数据输入到预先构建的结构化数据库中进行关键字检索,得到第二查询结果;
23、混合检索计算排序模块,用于利用倒序排序算法对第一查询结果和第二查询结果进行融合排序处理,得到相应融合排序结果,并返回所述融合排序结果。
24、进一步地,系统还包括数据收集与清洗模块,
25、数据收集与清洗模块,用于收集医疗相关的文本数据,并对文本数据进行清洗,得到标准化医疗文本数据。
26、进一步地,系统还包括向量数据库构建模块,
27、向量数据库构建模块,用于将标准化医疗文本数据转换为医疗文本向量,并将医疗文本向量映射到连续向量空间,利用映射后的医疗文本向量构建向量数据库。
28、进一步地,系统还包括结构化数据库构建模块,
29、结构化数据库构建模块,用于从标准化医疗文本数据中提取出医疗结构化数据,利用医疗结构化数据构建结构化数据库。
30、与现有技术相比,本专利技术的优点在于:
31、本专利技术能够获取用户输入的检索数据;将所述检索数据转换为待检索向量,将待检索向量输入到预先构建的向量数据库中进行相似度检索,得到第一查询结果,将用户输入的检索数据输入到预先构建的结构化数据库中进行关键字检索,得到第二查询结果,利用倒序排序算法对第一查询结果和第二查询结果进行融合排序处理,得到相应融合排序结果,并返回所述融合排序结果。本专利技术通过两个数据库进行检索,并将两个数据库检索的结果进行融合,得到融合排序结果,能够提供更加准确的检索排序和推荐结果,帮助医生快速了解患者病情相关的病史以及相关的诊疗信息,以便做出准确的诊断和治疗决策;还能够帮助患者更加科学地了解自己的病情,减少不必要的恐慌和焦虑,提高患者的治疗信心和满意度。
32、由此可见,本专利技术与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
本文档来自技高网...【技术保护点】
1.一种医疗文本混合检索方法,其特征在于:方法包括:
2.根据权利要求1所述的医疗文本混合检索方法,其特征在于:在构建向量数据库和结构化数据库之前:
3.根据权利要求2所述的医疗文本混合检索方法,其特征在于:向量数据库的构建方法为:
4.根据权利要求2所述的医疗文本混合检索方法,其特征在于:结构化数据库的构建方法为:
5.根据权利要求2所述的医疗文本混合检索方法,其特征在于:对文本数据进行清洗包括:
6.根据权利要求4所述的医疗文本混合检索方法,其特征在于:从标准化医疗文本数据中提取出医疗结构化数据,包括:
7.一种医疗文本混合检索系统,其特征在于:系统包括:
8.根据权利要求7所述的医疗文本混合检索系统,其特征在于:系统还包括数据收集与清洗模块,
9.根据权利要求7所述的医疗文本混合检索系统,其特征在于:系统还包括向量数据库构建模块,
10.根据权利要求7所述的医疗文本混合检索系统,其特征在于:系统还包括结构化数据库构建模块,
【技术特征摘要】
1.一种医疗文本混合检索方法,其特征在于:方法包括:
2.根据权利要求1所述的医疗文本混合检索方法,其特征在于:在构建向量数据库和结构化数据库之前:
3.根据权利要求2所述的医疗文本混合检索方法,其特征在于:向量数据库的构建方法为:
4.根据权利要求2所述的医疗文本混合检索方法,其特征在于:结构化数据库的构建方法为:
5.根据权利要求2所述的医疗文本混合检索方法,其特征在于:对文本数据进行清洗包括:
6.根据权...
【专利技术属性】
技术研发人员:单保涛,金剑,王思涵,赵倩,华国,
申请(专利权)人:北方健康医疗大数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。