System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医学教育,具体涉及基于多模态技术的临床考试内容生成方法及系统。
技术介绍
1、随着医学教育的不断发展,临床考试在医学教学和临床人才培养中发挥着至关重要的作用。传统的临床考试内容生成主要依赖专家手动编写试题,存在试题生成效率低、内容重复、难以全面评估考生综合能力等问题。此外,随着医学知识的快速进步和临床病例的复杂性不断增加,单一的数据源和人工出题方式已难以满足日益增长的临床考试需求。
2、目前,现有的临床考试内容生成方法通常依赖于人工编写和计算机辅助设计,通常从临床案例库中提取病史、症状、诊断结果等关键信息来构建考试题目,考试内容以文字描述、图片展示或视频播放的形式呈现,考生根据给定情境进行作答。然而,这种方法不仅过程繁琐且耗时较长,还容易受到主观因素的影响,导致试题内容质量不一,同时难以及时更新。
3、综上,现有的医疗教育中自动生成考试内容的方法依赖于人工编写和计算机辅助设计,在考试内容的构建过程繁琐且耗时较长,并且受到人工的主观因素影响,导致考试内容构建过程中针对的知识点偏重和涵盖范围不同,构建的考试内容不够全面,并且难以对考试内容的生成逻辑进行更新。
技术实现思路
1、本专利技术的目的在于提供基于多模态技术的临床考试内容生成方法及系统,以解决现有技术中,由于现有的医疗教育中存在自动生成考试内容的方法依赖于人工编写和计算机辅助设计,在考试内容的构建过程繁琐且耗时较长,并且受到人工的主观因素影响,导致考试内容构建过程中针对的知识点偏重和涵盖范围
2、为解决上述技术问题,本专利技术具体提供下述技术方案:
3、基于多模态技术的临床考试内容生成方法,包括如下步骤:
4、步骤100、通过从多种数据源采集临床医学相关信息,所述的临床医学相关信息包括医学文本、临床病例数据、医学影像、病患语音以及视频记录;
5、步骤200、利用多模态大模型对采集的所述的临床医学相关信息进行清洗、去噪以及分类处理,抽取出有效医学知识和临床情境数据;
6、步骤300、利用文本嵌入模型对抽取的有效医学知识和临床情境数据向多模态大模型内嵌入,同时将抽取的有效医学知识和临床情境数据中不同类型的数据转化为便于多模态大模型处理与训练的统一的向量表示;
7、步骤400、根据预设的考试需求,利用向量检索算法在文本嵌入模型的存储单元中检索获得出题参考数据,并将经过整合的出题参考数据结合提示词工程作为多模态大模型的输入,由所述多模态大模型生成考试内容。
8、作为本专利技术的一种优选方案,通过清洗和去噪去除采集的所述的临床医学相关信息中的无关或重复信息,并修正缺失数据,随后根据医学领域的标准和规范,对数据进行标注和分类:
9、包括将所述的临床医学相关信息中的影像数据标注为不同的病灶类型和将语音数据分类为不同的临床对话场景,并标注出与临床对话场景相关的医学实体和关系,统计总结医学关键词。
10、作为本专利技术的一种优选方案,所述临床对话场景包括患者主诉采集、医生问诊查体、诊断讨论、治疗方案沟通及随访教育等典型诊疗环节;
11、标注出的所述医学实体包括疾病、症状、检查、药物以及肢体术中部位;并通过因果关系、治疗关联以及检查指征关系描述标注出的所述医学实体之间的逻辑;
12、基于标准术语库与词频分析统计获取医学关键词,所述医学关键词包括症状关键词、检查关键词及药物关键词。
13、作为本专利技术的一种优选方案,所述文本嵌入模型的构建方法包括:
14、将经过4bit量化的qwen大语言模型作为所述文本嵌入模型的底层预训练语言模型;
15、在所述底层预训练语言模型中接入simcse的对比学习机制,通过对同一条文本应用随机扰动生成正样本,以模拟同一条文本的不同表示;
16、以随机选择的其他文本作为负样本,通过对比学习的损失函数对比损失优化所述底层预训练语言模型,使所述底层预训练语言模型的学习具有判别性的语义表示。
17、作为本专利技术的一种优选方案,在负样本选择中结合动态挖掘与正样本的语义相关但内容存在差异的样本的硬负样本,具体包括:
18、利用初始训练的语义嵌入模型,计算语料库中每个样本与目标正样本的语义相似度,选择与目标样本语义相似但内容不完全一致的样本作为硬负样本;并通过定期重新计算语义相似度来更新硬负样本库。
19、作为本专利技术的一种优选方案,将所述硬负样本融入对比学习的损失函数中,并对所述的损失函数进行优化,优化后的函数如下:
20、;
21、其中,为当前样本,特征向量;为正样本,为硬负样本,为随机负样本,表示硬负样本的重要性更高,为温度参数;,表示样本和之间的相似性度量,为余弦相似度。
22、作为本专利技术的一种优选方案,根据预设的考试需求,包括题目类型设计、临床考试标准以及临床能力考核需求,通过向量检索算法快速检索与目标需求相关的出题参考数据,包括医学知识数据、病例实例数据以及影像资料数据;
23、对检索到的出题参考数据进行不同模态数据包括文本描述、医学影像、语音记录的整合和分类,并构建临床情境,结合提示词工程,将不同模态的数据融合为统一的文本格式,并将融合后的内容作为多模态大模型的输入,多模态大模型通过设置的出题指令和模板生成考试内容。
24、作为本专利技术的一种优选方案,构建文本嵌入模型的实时反馈机制,包括:
25、对融合后的同一文本格式进行识别,对识别出的语义不清或逻辑错误进行自动纠正;
26、对不同模态数据进行一致性检查,使不同模态数据内容之间的语义匹配;
27、对生成的考试内容与预设的考试需求进行关联性分析,具体包括先利用权威医学大纲构建疾病诊疗关系网络,结合模型提取考试需求的关键特征,再通过语义分析和认知层次分类,确定生成内容与考试目标紧密相关;
28、对生成的考试内容的考点在医学考试标准中的考点覆盖率的确定,具体包括基于医学标准术语库建立核心考点数据库,通过智能编码和动态权重计算匹配知识点,若覆盖率不足设定阈值则自动生成补充内容。
29、本实施方式提供了一种用于实现所述的基于多模态技术的临床考试内容生成方法的基于多模态技术的临床考试内容生成系统,包括:
30、多模态数据采集模块,所述多模态数据采集模块通过从多种数据源采集临床医学相关信息,所述的临床医学相关信息包括医学文本、临床病例数据、医学影像、病患语音以及视频记录;
31、数据处理和分类模块,所述数据处理和分类模块用于对所述多模态数据采集模块采集的临床医学相关信息进行清洗、去噪以及分类处理,抽取出有效医学知识和临床情境数据;
32、数据嵌入模块,所述数据嵌入模块用于对抽取的有效医学知识和临床情境数据向文本嵌入模型内嵌入,同时将抽取的有效医学知识和临床情境本文档来自技高网...
【技术保护点】
1.基于多模态技术的临床考试内容生成方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于多模态技术的临床考试内容生成方法,其特征在于,
3.根据权利要求2所述的基于多模态技术的临床考试内容生成方法,其特征在于,
4.根据权利要求1所述的基于多模态技术的临床考试内容生成方法,其特征在于,
5.根据权利要求4所述的基于多模态技术的临床考试内容生成方法,其特征在于,
6.根据权利要求5所述的基于多模态技术的临床考试内容生成方法,其特征在于,
7.根据权利要求1所述的基于多模态技术的临床考试内容生成方法,其特征在于,
8.根据权利要求1所述的基于多模态技术的临床考试内容生成方法,其特征在于,
9.一种用于实现权利要求1和8所述的基于多模态技术的临床考试内容生成方法的基于多模态技术的临床考试内容生成系统,其特征在于,包括在模态大模型中嵌入:
10.根据权利要求9所述的基于多模态技术的临床考试内容生成系统,其特征在于,
【技术特征摘要】
1.基于多模态技术的临床考试内容生成方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于多模态技术的临床考试内容生成方法,其特征在于,
3.根据权利要求2所述的基于多模态技术的临床考试内容生成方法,其特征在于,
4.根据权利要求1所述的基于多模态技术的临床考试内容生成方法,其特征在于,
5.根据权利要求4所述的基于多模态技术的临床考试内容生成方法,其特征在于,
6.根据权利要求5所述的基于多模态...
【专利技术属性】
技术研发人员:丁佳男,杨英,俞晖,延琦,邱磊,
申请(专利权)人:北京时医康科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。