【技术实现步骤摘要】
基于对话表征的分诊方法、装置、设备及存储介质
本专利技术涉及大数据领域,尤其涉及一种基于对话表征的分诊方法、装置、设备及存储介质。
技术介绍
我国人口基数巨大,就医人数因此也位居世界前列,但受限于有限的医疗资源,目前国民就医流程中还存在较多问题,其中之一发生在就诊初期分诊时。分诊是根据病情将患者分至不同科室进行就诊,对于提升就诊效率有重要意义。分诊是患者就医治疗的起始环节,选择恰当的科室,直接关系到治疗效果或能否得到有效治疗。然而随着医学研究的深入,医学分工也逐步细化,不同科室专精于某类疾病的诊治。而患者大都不具备深厚的医学知识,很难识别自己的病况并根据自己的状况选择最恰当的科室。医院分诊台工作人员数量有限,而医院接诊量又巨大,导致分诊台工作人员工作负荷大。此外分诊台面对的是全科就诊环境,进一步增大了误分诊的可能性,会产生较多二次转诊情况,影响就医效率。因此,如何提高分诊准确率成为了本领域技术人员需要面临的技术问题。
技术实现思路
本专利技术的主要目的是提高基于对话表征进行分诊的准确率,解决基于对话表征的分诊精准率低下的技术问题。本专利技术第一方面提供了一种基于对话表征的分诊方法,包括:获取待分诊对象在就诊时产生的多轮对话,并提取多轮对话中的问诊数据;对所述问诊数据进行数据清洗,得到目标问诊数据,其中,所述目标问诊数据包括所述用户的主诉信息;对所述目标问诊数据进行意图识别,得到所述目标问诊数据中包含的句对,其中,所述目标问诊数据中包含至少一个句对;调用预置目标BERT网络模型对所述 ...
【技术保护点】
1.一种基于对话表征的分诊方法,其特征在于,所述基于对话表征的分诊方法包括:/n获取待分诊对象在就诊时产生的多轮对话,并提取多轮对话中的问诊数据;/n对所述问诊数据进行数据清洗,得到目标问诊数据,其中,所述目标问诊数据包括所述用户的主诉信息;/n对所述目标问诊数据进行意图识别,得到所述目标问诊数据中包含的句对,其中,所述目标问诊数据中包含至少一个句对;/n调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取,得到所述句对的句对向量和所述主诉信息的主诉向量;/n计算所述主诉向量和所述句对向量之间的欧氏距离,并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量;/n将每轮对话的对话表征向量输入预置分诊模型进行识别,得到分诊信息。/n
【技术特征摘要】
1.一种基于对话表征的分诊方法,其特征在于,所述基于对话表征的分诊方法包括:
获取待分诊对象在就诊时产生的多轮对话,并提取多轮对话中的问诊数据;
对所述问诊数据进行数据清洗,得到目标问诊数据,其中,所述目标问诊数据包括所述用户的主诉信息;
对所述目标问诊数据进行意图识别,得到所述目标问诊数据中包含的句对,其中,所述目标问诊数据中包含至少一个句对;
调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取,得到所述句对的句对向量和所述主诉信息的主诉向量;
计算所述主诉向量和所述句对向量之间的欧氏距离,并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量;
将每轮对话的对话表征向量输入预置分诊模型进行识别,得到分诊信息。
2.根据权利要求1所述的基于对话表征的分诊方法,其特征在于,所述对所述目标问诊数据进行意图识别,得到所述目标问诊数据中包含的句对包括:
根据预设表征规则获取所述目标问诊数据中的所有问答句和与所述问答句对应对象的对象标识;
基于各所述对象标识,对所述目标问诊数据中的各问答句分别进行意图识别,得到对应所述问诊数据的意图标识序列;
根据所述意图标识序列,确定对应所述问句的目标答句意图标识;
基于所述目标答句意图标识,得到所述目标问诊数据中包含的句对。
3.根据权利要求1所述的基于对话表征的分诊方法,其特征在于,在所述调用预置目标BERT网络模型对所述句对和所述主诉信息进行特征提取,得到所述句对的句对向量和所述主诉信息的主诉向量之前,还包括:
建立预训练任务,调用预置向量化模型将历史用户问诊数据处理为若干个词向量,其中,所述词向量包括基于所述历史用户问诊数据词向量;
将所述若干个词向量输入初始BERT网络模型,获取所述初始BERT网络模型输出的训练表征向量;
根据所述训练表征向量计算所述初始BERT网络模型的损失值;
根据所述初始BERT网络模型的损失值,调整所述初始BERT网络模型的模型参数,得到目标BERT网络模型。
4.根据权利要求1-2中任一项所述的基于对话表征的分诊方法,其特征在于,所述计算所述主诉向量和所述句对向量之间的欧氏距离,并基于所述欧氏距离确定多轮对话中每轮对话对应的对话表征向量包括:
计算所述主诉向量和每轮对话中每个句对向量两两之间的欧氏距离;
基于所述欧氏距离,确定每个所述句对在对应的一轮对话中的权重;
基于所述权重,对每个所述句对向量对应的权重进行加权平均,得到多轮对话中每轮对话对应的对话表征向量。
5.根据权利要求1所述的基于对话表征的分诊方法,其特征在于,所述将每轮对话的对话表征向量输入预置分诊模型进行识别,得到分诊信息包括:
基于所述各轮对话对应的对话表征向量,确定所述目标问诊数据中的目标病症信息;
对所述目标病症信息和所述各轮对话对应的主诉信息进行编码,得到所述目标问诊数据的病症实体向量;
将所述病症实体向量输入预置分诊模型进行预测,得到不同科室的分诊概率;
对所述分诊概率进行排序...
【专利技术属性】
技术研发人员:孙行智,胡岗,朱昭苇,刘卓,唐蕊,姚海申,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。