System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种医疗检验单的数据信息自动提取分析方法技术_技高网

一种医疗检验单的数据信息自动提取分析方法技术

技术编号:44894498 阅读:5 留言:0更新日期:2025-04-08 00:33
本申请提供一种医疗检验单的数据信息自动提取分析方法,涉及数据提取分析技术领域,通过文本识别框架对医疗检验单的数据文本信息进行语义分割,得到不同检验信息的描述子段,并依据各个描述子段中的离散型检验数据确定数据文本信息的模糊熵;进而基于模糊熵优化后的文本识别框架提取医疗检验单中的抛出数据,通过所有描述子段的描述向量确定医疗检验单中检验信息的隶属注意力匹配机制;再依据知识图谱构建基于双向长短期记忆神经网络的检验数据分析模型;检验数据分析模型基于隶属注意力匹配机制对抛出数据进行检验分析,得到医疗检验单的分析结果,本申请可对医疗检验单中的检验信息进行自适应隶属匹配分析,以提高医疗检验可靠性。

【技术实现步骤摘要】

本申请涉及数据提取分析,更具体地说,本申请涉及一种医疗检验单的数据信息自动提取分析方法


技术介绍

1、数据提取分析技术是从非结构化或半结构化的数据中自动提取出有价值的信息,在医疗领域中,数据提取分析技术通常是借助文本分析框架、自然语言处理技术以及深度学习模型来识别、提取和分析医疗检验单的数据信息。

2、随着医疗数据化进程的推进,医疗检验单的数据信息自动提取成为提升医疗服务效率和准确性的关键技术,传统的医疗检验单信息提取方法大多依赖人工录入或规则驱动的文本匹配技术,基于自然语言处理技术和机器学习模型的自动化提取方法,能够提高数据提取的准确性和效率,然而,现有的自然语言处理技术和机器学习模型无法自适应地根据检验数据间的隶属关系进行精确匹配和分析,导致医疗检验数据提取分析的可靠性低下,因此,如何对医疗检验单中的检验信息进行自适应隶属匹配分析,以提高医疗检验可靠性已成为业界面临的难题。


技术实现思路

1、本申请提供一种医疗检验单的数据信息自动提取分析方法,可对医疗检验单中的检验信息进行自适应隶属匹配分析,以提高医疗检验可靠性。

2、本申请提供一种医疗检验单的数据信息自动提取分析方法,所述提取分析方法包括如下步骤:

3、获取医疗检验单的数据文本信息;

4、对所述数据文本信息进行预处理,并通过文本识别框架对预处理后的数据文本信息进行语义分割,得到不同检验信息的描述子段,进而依据各个描述子段中的离散型检验数据确定所述数据文本信息的模糊熵;

5、基于所述模糊熵优化后的文本识别框架提取所述医疗检验单中的抛出数据,确定各个描述子段的描述向量,进而通过所有的描述向量确定所述医疗检验单中检验信息的隶属注意力匹配机制;

6、获取医疗检验时的知识图谱,依据所述知识图谱构建基于双向长短期记忆神经网络的检验数据分析模型;

7、所述检验数据分析模型基于所述隶属注意力匹配机制对所述抛出数据进行检验分析,进而得到所述医疗检验单的分析结果。

8、在本实施例中,通过扫描医疗检验单来获取医疗检验单的数据文本信息。

9、在本实施例中,对所述数据文本信息进行预处理具体包括:

10、确定所述数据文本信息中待提取的结构化检验数据,并判定所述结构化检验数据的数据类型及处理方式,再将所述结构化检验数据转换为纯文本格式。

11、在本实施例中,通过文本识别框架对预处理后的数据文本信息进行语义分割,得到不同检验信息的描述子段具体包括:

12、确定文本识别框架的模型结构;

13、基于所述模型结构确定文本识别框架的编码器,并通过所述编码器对预处理后的数据文本信息进行上下文语义分析,得到带有检验标签的文本序列;

14、从带有检验标签的文本序列中提取不同检验信息的描述子段。

15、在本实施例中,依据各个描述子段中的离散型检验数据确定所述数据文本信息的模糊熵具体包括:

16、提取每个描述子段中的离散型检验数据;

17、对所有的离散型检验数据进行标准化处理,进而得到标准化数据序列;

18、依据预设的相似性阈值和所述标准化数据序列确定所述数据文本信息的模糊熵。

19、在本实施例中,基于所述模糊熵优化后的文本识别框架提取所述医疗检验单中的抛出数据具体包括:

20、对于每个描述子段,依据描述子段中的所有检验数据确定描述子段的近似熵,进而得到每个描述子段的近似熵;

21、通过每个描述子段的近似熵和所述模糊熵确定文本识别框架的注意力分配结果;

22、基于所述注意力分配结果优化后的文本识别框架提取所述医疗检验单中的抛出数据。

23、在本实施例中,确定各个描述子段的描述向量具体包括:

24、提取每个描述子段中的语义特征、数值特征和结构特征;

25、分别对每个描述子段的语义特征、数值特征和结构特征分别执行特征融合以及归一化操作,得到所述每个描述子段的描述向量。

26、在本实施例中,通过所有的描述向量确定所述医疗检验单中检验信息的隶属注意力匹配机制具体包括:

27、对所有描述向量进行加权聚合,得到所述医疗检验单的全局描述向量;

28、基于所述全局描述向量和每个描述子段的描述向量确定所述每个描述子段的隶属度;

29、通过所有的隶属度确定所述医疗检验单中检验信息的隶属注意力匹配机制。

30、在本实施例中,从医疗检验的数据库中提取医疗检验时的实验数据,进而通过所述实验数据基于预训练的语言模型获取医疗检验时的知识图谱。

31、在本实施例中,所述文本识别框架为基于自然语言处理的自动化提取程序。

32、本申请公开的实施例提供的技术方案具有以下有益效果:

33、首先,获取医疗检验单的数据文本信息;其次,对所述数据文本信息进行预处理,并通过文本识别框架对预处理后的数据文本信息进行语义分割,得到不同检验信息的描述子段,进而依据各个描述子段中的离散型检验数据确定所述数据文本信息的模糊熵;接着,基于所述模糊熵优化后的文本识别框架提取所述医疗检验单中的抛出数据,确定各个描述子段的描述向量,进而通过所有的描述向量确定所述医疗检验单中检验信息的隶属注意力匹配机制;然后,获取医疗检验时的知识图谱,依据所述知识图谱构建基于双向长短期记忆神经网络的检验数据分析模型;最后,所述检验数据分析模型基于所述隶属注意力匹配机制对所述抛出数据进行检验分析,进而得到所述医疗检验单的分析结果。

34、由此可见本申请中,可对医疗检验单中的检验信息进行自适应隶属匹配分析;其中,通过模糊熵优化后的文本识别框架,便于从检验数据中提取出具有高价值的信息,同时去除冗余或不相关的数据,从而得到医疗检验单中的抛出数据;然后,可通过隶属度匹配机制自动识别每个描述子段在整个医疗检验单中的重要性,将注意力集中在对检验结果有重要影响的数据上,为模型提供了一种自适应学习方式,便于自适应调整对不同检验信息的提取权重,有利于提高检验数据系统的匹配识别能力;最后,通过知识图谱能构建基于双向长短期记忆神经网络的检验数据分析模型,并结合隶属注意力匹配机制,检验数据分析模型能够自动分析抛出数据,有利于提升数据处理的智能化水平,并确保分析结果的可靠性。

35、综上所述,本申请采用的技术方案可对医疗检验单中的检验信息进行自适应隶属匹配分析,以提高医疗检验可靠性。

本文档来自技高网
...

【技术保护点】

1.一种医疗检验单的数据信息自动提取分析方法,其特征在于,所述提取分析方法包括如下步骤:

2.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,通过扫描医疗检验单来获取医疗检验单的数据文本信息。

3.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,对所述数据文本信息进行预处理具体包括:

4.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,通过文本识别框架对预处理后的数据文本信息进行语义分割,得到不同检验信息的描述子段具体包括:

5.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,依据各个描述子段中的离散型检验数据确定所述数据文本信息的模糊熵具体包括:

6.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,基于所述模糊熵优化后的文本识别框架提取所述医疗检验单中的抛出数据具体包括:

7.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,确定各个描述子段的描述向量具体包括:>

8.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,通过所有的描述向量确定所述医疗检验单中检验信息的隶属注意力匹配机制具体包括:

9.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,从医疗检验的数据库中提取医疗检验时的实验数据,进而通过所述实验数据基于预训练的语言模型获取医疗检验时的知识图谱。

10.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,所述文本识别框架为基于自然语言处理的自动化提取程序。

...

【技术特征摘要】

1.一种医疗检验单的数据信息自动提取分析方法,其特征在于,所述提取分析方法包括如下步骤:

2.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,通过扫描医疗检验单来获取医疗检验单的数据文本信息。

3.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,对所述数据文本信息进行预处理具体包括:

4.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,通过文本识别框架对预处理后的数据文本信息进行语义分割,得到不同检验信息的描述子段具体包括:

5.如权利要求1所述的一种医疗检验单的数据信息自动提取分析方法,其特征在于,依据各个描述子段中的离散型检验数据确定所述数据文本信息的模糊熵具体包括:

6.如权利要求1所述的一种医疗检验单的...

【专利技术属性】
技术研发人员:吕涛
申请(专利权)人:西安市红会医院西安市骨科研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1