System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其是一种基于大语言模型的电子病历数据的错误检测方法及装置。
技术介绍
1、随着医疗数据的不断累积,医疗数据质量控制成为提高医疗数据质量、有效利用数据的重要手段。其中,数据错误检测是提高数据质量的关键步骤。在现实临床场景中,由于数据录入、拷贝等各种原因,电子病历文本中存在着许多矛盾冲突的内容,特别地,在病人的不同医疗文本中尤其明显。为了保证电子病历数据的准确性,通常在医疗机构设置了专门的机构或人员(质控医生)进行人工的审核。尽管人工审核能发现部分错误数据,但人工审核耗费大量的人力资源,同时人工审核也容易出现部分错误漏检的情况。
2、然而,现有的数据错误检测方法大部分针对的是结构化的数据,采用基于规则的方法进行检测。而针对电子病历文本的错误检测通常是利用信息抽取技术,首先进行实体抽取,然后基于结构化的数据进行错误检测。但由于现有的实体抽取技术无法抽取出所有的实体,从而大量的错误无法发现。特别当实体出现在不同文本中时,如果其中一个实体没有被准确的识别,那么错误就无法发现。另外,由于电子病历中错误种类多样性,规则仅覆盖部分错误,因此存在部分需要医学背景知识的错误无法被检测出,无法保证错误检测的准确性。
技术实现思路
1、有鉴于此,本专利技术实施例的主要目的在于提出一种基于大语言模型的电子病历数据的错误检测方法及装置,以提高错误检测的准确性。
2、为实现上述目的,本专利技术实施例的一方面提供了一种基于大语言模型的电子病历数据的错误检测方法,所
3、获取病历文本;
4、对所述病历文本进行清洗,得到清洗后的临床数据;
5、对所述清洗后的临床数据进行截断处理,得到截断文本;
6、对所述截断文本进行检测,得到错误字段;
7、对所述错误字段进行校正,得到治理文本。
8、在一些实施例中,所述对所述病历文本进行清洗,得到清洗后的临床数据,包括:
9、对所述病历文本中的长文本进行拆分,并对隐私信息进行匿名化处理,得到文本段落;
10、对所述文本段落进行拼接以及融合,得到所述清洗后的临床数据。
11、在一些实施例中,所述对所述清洗后的临床数据进行截断处理,得到截断文本,包括:
12、设置字段划分规则;
13、根据所述字段划分规则,对所述清洗后的临床数据的字段进行划分并截断,得到所述截断文本;
14、对每个所述截断文本设置截断标识符。
15、在一些实施例中,所述设置字段划分规则,包括:
16、根据字段值域,将字段划分为数值型字段、符号型字段以及文本型字段。
17、在一些实施例中,所述对所述截断文本进行检测,得到错误字段,包括:
18、输入所述截断文本;
19、基于大语言模型,对所述截断文本进行任务拆解,得到检测任务;
20、根据知识库以及自动生成提示技术构建检测模板;
21、根据所述检测模板以及所述大语言模型,对所述检测任务进行检测,得到所述错误字段。
22、在一些实施例中,所述基于大语言模型,对所述截断文本进行任务拆解,得到检测任务,包括:
23、将所述截断文本拆解为值域错误检测子任务、单位错误检测子任务、完整性错误检测子任务以及一致性错误检测子任务。
24、在一些实施例中,所述根据知识库以及自动生成提示技术构建检测模板之前,还包括:
25、根据医学术语以及prompt模板构建所述知识库。
26、在一些实施例中,所述对所述错误字段进行校正,得到治理文本,包括:
27、输入所述错误字段;
28、根据自动生成提示技术构建校正模板;
29、根据所述校正模板以及所述大语言模型,对所述错误字段进行校正,得到所述治理文本。
30、在一些实施例中,所述根据所述校正模板以及所述大语言模型,对所述错误字段进行校正,包括:
31、判断所述错误字段的错误类型;
32、若所述错误类型属于完整性错误,则根据没有错误字段的所述病历文本,对所述错误字段进行补充;
33、若所述错误类型属于一致性错误,则根据没有错误字段的所述病历文本,对所述错误字段进行修改。
34、在一些实施例中,所述一种基于大语言模型的电子病历数据的错误检测方法还包括:
35、根据知识库,设置评测模块;
36、基于大语言模型,通过所述评测模块对所述错误字段以及所述治理文本进行评估,得到评估结果;
37、判断所述评估结果是否达到所述知识库中预设置的标准,若达到则输出所述病历文本,并将所述评估结果存入知识库。
38、为实现上述目的,本专利技术实施例的另一方面提出了一种基于大模型的电子病历数据的错误检测装置,所述装置包括:
39、第一模块,获取病历文本;
40、第二模块,对所述病历文本进行清洗,得到清洗后的临床数据;
41、第三模块,对所述清洗后的临床数据进行截断处理,得到截断文本;
42、第四模块,对所述截断文本进行检测,得到错误字段;
43、第五模块,对所述错误字段进行校正,得到治理文本。
44、本专利技术实施例还提供了一种电子设备,该电子设备包括处理器以及存储器;存储器存储有程序;处理器执行程序以执行前述的一种基于大语言模型的电子病历数据的错误检测方法。
45、本专利技术实施例还提供了一种计算机可读存储介质,存储介质存储有程序,所述程序被处理器执行实现前述的一种基于大语言模型的电子病历数据的错误检测方法。
46、本专利技术实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前述的一种基于大语言模型的电子病历数据的错误检测方法。
47、本专利技术的实施例至少包括以下有益效果:本专利技术提供一种基于大语言模型的电子病历数据的错误检测方法及装置,该方法通过获取病历文本;对所述病历文本进行清洗,得到清洗后的临床数据;对所述清洗后的临床数据进行截断处理,得到截断文本;对所述截断文本进行检测,得到错误字段;对所述错误字段进行校正,得到治理文本。本专利技术的实施例基于大语言模型,采用端到端的生成方式,可以避免传统的信息抽取过程中引入的识别错误,提高了错误检测的准确性。
本文档来自技高网...【技术保护点】
1.一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述对所述病历文本进行清洗,得到清洗后的临床数据,包括:
3.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述对所述清洗后的临床数据进行截断处理,得到截断文本,包括:
4.根据权利要求3所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述设置字段划分规则,包括:
5.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述对所述截断文本进行检测,得到错误字段,包括:
6.根据权利要求5所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述基于大语言模型,对所述截断文本进行任务拆解,得到检测任务,包括:
7.根据权利要求5所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述根据知识库以及自动生成提示技术构建检测模板之前,还包括:
8
9.根据权利要求8所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述根据所述校正模板以及所述大语言模型,对所述错误字段进行校正,包括:
10.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,还包括:
11.一种基于大语言模型的电子病历数据的错误检测装置,其特征在于,包括:
12.一种电子设备,其特征在于,包括处理器以及存储器;
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至10中任一项所述的方法。
...【技术特征摘要】
1.一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述对所述病历文本进行清洗,得到清洗后的临床数据,包括:
3.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述对所述清洗后的临床数据进行截断处理,得到截断文本,包括:
4.根据权利要求3所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述设置字段划分规则,包括:
5.根据权利要求1所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述对所述截断文本进行检测,得到错误字段,包括:
6.根据权利要求5所述的一种基于大语言模型的电子病历数据的错误检测方法,其特征在于,所述基于大语言模型,对所述截断文本进行任务拆解,得到检测任务,包括:
7.根据权利要...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。