本发明专利技术涉及数字医疗领域的人工智能技术,揭露了一种问诊症状识别方法,包括:构建原始症状识别模型,获取包含文本片段及所述文本片段对应症状的历史问诊对话集合,基于预设的示范学习格式对所述文本片段及所述文本片段对应症状进行示范文本构建,得到示范训练文本集合,利用所述示范训练文本集合对所述原始症状识别模型进行示范学习训练,得到标准症状识别模型,利用所述标准症状识别模型对待识别症状文本进行症状识别,得到识别症状。本发明专利技术还涉及区块链技术,所述识别症状可存储在区块链的节点中。本发明专利技术还提出一种问诊症状识别装置、电子设备以及可读存储介质。本发明专利技术可以提高问诊症状识别的准确率。诊症状识别的准确率。诊症状识别的准确率。
【技术实现步骤摘要】
问诊症状识别方法、装置、设备及存储介质
[0001]本专利技术涉及数字医疗及人工智能
,尤其涉及一种问诊症状识别方法、装置、电子设备及可读存储介质。
技术介绍
[0002]随着人工智能的发展,机器学习技术在医学领域成功落地的应用场景越来越多,比如,远程医疗、智能诊断、机器人问诊等。在智慧中医领域,机器人辅助问诊是比较常见的一种业务场景,机器人通过和患者对话,代替人工专家收集患者信息,需要正确理解每轮交互患者语义意图和症状信息,从而转缺进行症状识别。
[0003]现有技术中主要通过模型分类或检索的方法把问话中提及的文本映射到领域知识库中的实体。现有技术存在以下缺陷:1.需要人工标注大量症状实体,模型学习效率较低,模型训练效率及准确率都会受到影响;2.模型训练较为复杂,随着数据量的提高,占用大量计算空间及存储空间。
技术实现思路
[0004]本专利技术提供一种问诊症状识别方法、装置、电子设备及可读存储介质,其主要目的在于可以提高问诊症状识别的准确率。
[0005]为实现上述目的,本专利技术提供的一种问诊症状识别方法,包括:
[0006]构建原始症状识别模型,获取包含文本片段及所述文本片段对应症状的历史问诊对话集合;
[0007]基于预设的示范学习格式对所述文本片段及所述文本片段对应症状进行示范文本构建,得到示范训练文本集合;
[0008]利用所述示范训练文本集合对所述原始症状识别模型进行示范学习训练,得到标准症状识别模型;
[0009]利用所述标准症状识别模型对待识别症状文本进行症状识别,得到识别症状。
[0010]可选地,所述构建原始症状识别模型,包括:
[0011]将预设层数的神经网络进行串联,并将串联后的网络作为文本编码层;
[0012]在所述文本编码层后拼接两层全连接层,将拼接后的网络作为所述原始症状识别模型。
[0013]可选地,所述预设的示范学习格式包括文本片段、症状及特殊符号。
[0014]可选地,所述基于预设的示范学习格式对所述文本片段及所述文本片段对应症状进行示范文本构建,得到示范训练文本集合,包括:
[0015]对所述历史问诊对话集合中的问诊对话进行分词处理,得到分词片段集合;
[0016]将所述分词片段集合中包含识别症状的分词片段作为文本片段,利用所述示范学习格式中预设的第一特殊符号将所述文本片段及所述文本片段的对应症状进行拼接,得到文本
‑
症状文本对,汇总所有的文本
‑
症状文本对得到原始训练文本集合;
[0017]利用所述示范学习格式中预设的第二特殊符号及第三特殊符号对所述原始训练文本集合进行示范文本构建,得到示范训练文本集合。
[0018]可选地,所述利用所述示范学习格式中预设的第二特殊符号及第三特殊符号对所述原始训练文本集合进行示范文本构建,得到示范训练文本集合,包括:
[0019]依次从所述原始训练文本集合选择文本
‑
症状文本对作为目标文本对;
[0020]利用所述第三特殊符号替换所述目标文本对中的症状,得到替换文本对;
[0021]从非目标文本对中选择预设数量的文本
‑
症状文本对作为所述替换文本对的示范文本对;
[0022]利用所述第二特殊符号对所述替换文本对及所述替换文本对的示范文本对进行拼接,得到示范训练文本;
[0023]在所述原始训练文本集合中所有文本
‑
症状文本对均被选为目标文本对时,汇总所有示范训练文本,得到所述示范训练文本集合。
[0024]可选地,所述利用所述标准症状识别模型对待识别症状文本进行症状识别,得到识别症状,包括:
[0025]对所述待识别症状文本进行分词处理,得到分词文本集合;
[0026]利用所述第一特殊符号、第二特殊符号及所述第三特殊符号对所述分词文本集合中的分词文本进行拼接,得到待识别文本序列;
[0027]利用所述标准症状识别模型输出所述待识别文本序列中分词文本对应的识别症状。
[0028]可选地,所述利用所述示范训练文本集合对所述原始症状识别模型进行示范学习训练,得到标准症状识别模型,包括:
[0029]利用所述原始症状识别模型中的文本编码层对所述所述示范训练文本集合中的示范训练文本进行特征编码,得到编码向量;
[0030]利用所述原始症状识别模型中的全连接层输出所述编码向量的预测症状;
[0031]利用所述预测症状及预设的损失函数计算损失值,并在所述损失值大于等于预设损失阈值时,调整所述原始症状识别模型中的模型参数,返回所述利用所述原始症状识别模型中的文本编码层对所述所述示范训练文本集合中的示范训练文本进行特征编码的步骤,直至所述损失值小于预设损失阈值时,停止训练,得到所述标准症状识别模型。
[0032]为了解决上述问题,本专利技术还提供一种问诊症状识别装置,所述装置包括:
[0033]模型构建模块,用于构建原始症状识别模型,获取包含文本片段及所述文本片段对应症状的历史问诊对话集合;
[0034]示范文本构建模块,用于基于预设的示范学习格式对所述文本片段及所述文本片段对应症状进行示范文本构建,得到示范训练文本集合;
[0035]模型训练模块,用于利用所述示范训练文本集合对所述原始症状识别模型进行示范学习训练,得到标准症状识别模型;
[0036]症状识别模块,用于利用所述标准症状识别模型对待识别症状文本进行症状识别,得到识别症状。
[0037]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0038]存储器,存储至少一个计算机程序;及
[0039]处理器,执行所述存储器中存储的计算机程序以实现上述所述的问诊症状识别方法。
[0040]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的问诊症状识别方法。
[0041]本专利技术基于预设的示范学习格式对历史问诊对话集合中的文本片段及文本片段对应症状进行示范文本构建,通过示范训练文本,在不引入参数的前提下,用来自同一个训练集中的多个样本当做“示范标兵”,从而达到引导模型深度学习预测未知症状的能力,提高了症状识别的准确率。并且通过统一的示范学习格式,可以充分使用历史信息,不需要大量人工标注,提高了模型训练的效率,也降低了模型训练对计算能力、存储空间的依赖。因此本专利技术提出的问诊症状识别方法、装置、电子设备及计算机可读存储介质,可以提高问诊症状识别的准确率。
附图说明
[0042]图1为本专利技术一实施例提供的问诊症状识别方法的流程示意图;
[0043]图2为本专利技术一实施例提供的问诊症状识别装置的功能模块图;
[0044]图3为本专利技术一实施例提供的实现所述问诊症状识别方法的电子设备的结构示意图。...
【技术保护点】
【技术特征摘要】
1.一种问诊症状识别方法,其特征在于,所述方法包括:构建原始症状识别模型,获取包含文本片段及所述文本片段对应症状的历史问诊对话集合;基于预设的示范学习格式对所述文本片段及所述文本片段对应症状进行示范文本构建,得到示范训练文本集合;利用所述示范训练文本集合对所述原始症状识别模型进行示范学习训练,得到标准症状识别模型;利用所述标准症状识别模型对待识别症状文本进行症状识别,得到识别症状。2.如权利要求1所述的问诊症状识别方法,其特征在于,所述构建原始症状识别模型,包括:将预设层数的神经网络进行串联,并将串联后的网络作为文本编码层;在所述文本编码层后拼接两层全连接层,将拼接后的网络作为所述原始症状识别模型。3.如权利要求1所述的问诊症状识别方法,其特征在于,所述预设的示范学习格式包括文本片段、症状及特殊符号。4.如权利要求1中所述的问诊症状识别方法,其特征在于,所述基于预设的示范学习格式对所述文本片段及所述文本片段对应症状进行示范文本构建,得到示范训练文本集合,包括:对所述历史问诊对话集合中的问诊对话进行分词处理,得到分词片段集合;将所述分词片段集合中包含识别症状的分词片段作为文本片段,利用所述示范学习格式中预设的第一特殊符号将所述文本片段及所述文本片段的对应症状进行拼接,得到文本
‑
症状文本对,汇总所有的文本
‑
症状文本对得到原始训练文本集合;利用所述示范学习格式中预设的第二特殊符号及第三特殊符号对所述原始训练文本集合进行示范文本构建,得到示范训练文本集合。5.如权利要求4所述的问诊症状识别方法,其特征在于,所述利用所述示范学习格式中预设的第二特殊符号及第三特殊符号对所述原始训练文本集合进行示范文本构建,得到示范训练文本集合,包括:依次从所述原始训练文本集合选择文本
‑
症状文本对作为目标文本对;利用所述第三特殊符号替换所述目标文本对中的症状,得到替换文本对;从非目标文本对中选择预设数量的文本
‑
症状文本对作为所述替换文本对的示范文本对;利用所述第二特殊符号对所述替换文本对及所述替换文本对的示范文本对进行拼接,得到示范训练文本;在所述原始训练文本集合中所有文本
‑
症状文本对均被选为目标文本对时,汇...
【专利技术属性】
技术研发人员:吴信朝,阮晓雯,吴振宇,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。