基于问诊会话构建用户画像的方法、装置、设备和介质制造方法及图纸

技术编号:31087118 阅读:25 留言:0更新日期:2021-12-01 12:42
本申请公开了一种基于问诊会话构建用户画像的方法、装置、设备和介质,涉及机器学习技术领域。该方法包括:获取用户输入的主诉信息;对主诉信息进行特征提取,得到第一特征向量矩阵;将第一特征向量矩阵输入至预测网络模型中,得到与主诉信息匹配的问诊问题,预测网络模型是根据第一数据集训练得到的,第一数据集包括多个医疗问诊样本,其中,每个医疗问诊样本包括问诊问题与对应的病症;向用户呈现问诊问题,以得到用户输入的问诊信息;根据问诊信息构建用户画像。通过对用户输入的主诉信息进行识别,并通过预测网络模型得到与主诉信息相对应的问诊问题,以此快速的对用户进行自动问诊,提高了获取问诊信息的效率且降低了人工成本。本。本。

【技术实现步骤摘要】
基于问诊会话构建用户画像的方法、装置、设备和介质


[0001]本申请涉及机器学习
,尤其是涉及一种基于问诊会话构建用户画像的方法、装置、设备和介质。

技术介绍

[0002]相关技术中的根据医疗数据生成用户画像的方法中,大多通过人工在线问诊的方式来获取医患间的问诊信息,通过对问诊信息进行分词、筛查和标识后,根据标识结果来构建患者的用户画像。但此种以人工在线问诊的方式获取问诊信息,并构建用户画像的方式效率较低,且人工成本较高。

技术实现思路

[0003]本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种基于问诊会话构建用户画像的方法、装置、设备和介质,能够提高构建用户画像的效率且降低人工成本。
[0004]根据本申请的第一方面实施例的基于问诊会话构建用户画像的方法,包括:获取用户输入的主诉信息,其中,所述主诉信息为所述用户的病症描述信息;对所述主诉信息进行特征提取,得到第一特征向量矩阵;将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,其中,所述预测网络模型是根据第一数据集训练得到的,所述第一数据集包括多个医疗问诊样本,每个所述医疗问诊样本包括问诊问题与对应的病症;向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息;根据所述问诊信息构建用户画像。
[0005]根据本申请实施例的问诊会话构建用户画像的方法,至少具有如下有益效果:通过对用户输入的主诉信息进行识别,并对主诉信息进行特征提取后输入至预测网络模型中,通过预测网络模型得到与主诉信息相对应的问诊问题,通过问诊问题快速的对用户进行自动问诊,以获取用户的问诊信息,根据问诊信息构建用户画像,提高了构建用户画像的效率,且在收集问诊信息时不需要通过人工进行问诊,节省人工成本。通过构建好的用户画像,方便后续选择符合用户当前病症的治疗领域的医生进行进一步问诊,且通过用户画像可以更精确的向用户进行项目的推荐。
[0006]根据本申请的一些实施例,所述对所述主诉信息进行特征提取,得到第一特征向量矩阵,包括:对所述主诉信息进行自然语言预处理,得到多个第一分词;将所述多个第一分词输入至预先训练好的词向量模型中,以得到多个第一词向量;对所述多个第一词向量进行组合处理,得到所述第一特征向量矩阵。
[0007]根据本申请的一些实施例,所述对所述主诉信息进行自然语言预处理,得到多个第一分词,包括:对所述主诉信息进行繁体转简体处理,得到简体信息;对所述简体信息进行分词,得到预分词信息;对所述预分词信息进行去停用词处理,得到分词信息;对所述分词信息进行同义词归一化,得到所述多个第一分词。
[0008]根据本申请的一些实施例,所述将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,包括:将所述第一特征向量矩阵输入双向循环神经网络进行特征融合处理,得到第一融合特征向量矩阵;将所述第一融合特征向量矩阵输入高速神经网络进行深度处理,得到第一深度特征向量矩阵;通过卷积神经网络对所述第一深度特征向量矩阵进行特征提取,得到第一向量;根据所述第一向量得到与所述主诉信息匹配的问诊问题。
[0009]根据本申请的一些实施例,所述向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息,包括:向所述用户呈现所述问诊问题和结构化的答案选项;根据所述用户输入的所述答案选项,得到所述用户输入的问诊信息。
[0010]根据本申请的一些实施例,基于问诊会话构建用户画像的方法还包括:获取对所述用户进行人工问诊时的会话信息;对所述会话信息进行特征提取,得到第二特征向量矩阵;将所述第二特征向量矩阵输入至标签提取网络模型中,获取所述用户的健康类标签,其中,所述标签提取网络模型是根据第二数据集训练得到的,所述第二数据集中包括多个会话信息以及与所述多个会话信息对应的健康类标签;根据所述健康类标签更新所述用户画像。
[0011]根据本申请的一些实施例,所述将所述第二特征向量矩阵输入至标签提取网络模型中,获取所述用户的健康类标签,包括:将所述第二特征向量矩阵输入双向长短期记忆网络进行词性标注处理,得到标签得分概率;通过条件随机场对所述标签得分概率进行标签顺序修正,得到所述用户的健康类标签。
[0012]根据本申请的第二方面实施例的基于问诊会话构建用户画像的装置,包括:信息获取模块,所述信息获取模块用于获取用户输入的主诉信息,其中,所述主诉信息为所述用户的病症描述信息;特征提取模块,所述特征提取模块用于对所述主诉信息进行特征提取,得到第一特征向量矩阵;预测模块,所述预测模块用于将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,其中,所述预测网络模型是根据第一数据集训练得到的,所述第一数据集包括多个医疗问诊样本,每个所述医疗问诊样本包括问诊问题与对应的病症;问诊模块,所述问诊模块用于向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息;画像构建模块,所述画像构建模块用于根据所述问诊信息构建用户画像。
[0013]根据本申请的第三方面实施例的一种电子设备,包括:至少一个存储器;至少一个处理器;至少一个程序;所述程序被存储在所述存储器中,处理器执行所述至少一个程序以实现:如上述第一方面实施例所述的方法。
[0014]根据本申请的第四方面实施例的一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:如上述第一方面实施例所述的方法。
[0015]本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0016]下面结合附图和实施例对本申请做进一步的说明,其中:
[0017]图1为本申请实施例基于问诊会话构建用户画像的方法的流程图;
[0018]图2为本申请实施例获取第一特征向量矩阵的流程图;
[0019]图3为本申请实施例训练词向量模型的示意图;
[0020]图4为本申请实施例进行自然语言预处理的流程图;
[0021]图5为本申请实施例得到问诊问题的流程图;
[0022]图6为本申请实施例得到问诊信息的流程图;
[0023]图7为本申请另一实施例基于问诊会话构建用户画像的方法的流程图;
[0024]图8为本申请实施例获取用户的健康类标签的流程图;
[0025]图9为本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
[0026]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0027]需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于问诊会话构建用户画像的方法,其特征在于,包括:获取用户输入的主诉信息,其中,所述主诉信息为所述用户的病症描述信息;对所述主诉信息进行特征提取,得到第一特征向量矩阵;将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,其中,所述预测网络模型是根据第一数据集训练得到的,所述第一数据集包括多个医疗问诊样本,每个所述医疗问诊样本包括问诊问题与对应的病症;向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息;根据所述问诊信息构建用户画像。2.根据权利要求1所述的方法,其特征在于,所述对所述主诉信息进行特征提取,得到第一特征向量矩阵,包括:对所述主诉信息进行自然语言预处理,得到多个第一分词;将所述多个第一分词输入至预先训练好的词向量模型中,以得到多个第一词向量;对所述多个第一词向量进行组合处理,得到所述第一特征向量矩阵。3.根据权利要求2所述的方法,其特征在于,所述对所述主诉信息进行自然语言预处理,得到多个第一分词,包括:对所述主诉信息进行繁体转简体处理,得到简体信息;对所述简体信息进行分词,得到预分词信息;对所述预分词信息进行去停用词处理,得到分词信息;对所述分词信息进行同义词归一化,得到所述多个第一分词。4.根据权利要求1所述的方法,其特征在于,所述将所述第一特征向量矩阵输入至预测网络模型中,得到与所述主诉信息匹配的问诊问题,包括:将所述第一特征向量矩阵输入双向循环神经网络进行特征融合处理,得到第一融合特征向量矩阵;将所述第一融合特征向量矩阵输入高速神经网络进行深度处理,得到第一深度特征向量矩阵;通过卷积神经网络对所述第一深度特征向量矩阵进行特征提取,得到第一向量;根据所述第一向量得到与所述主诉信息匹配的问诊问题。5.根据权利要求1所述的方法,其特征在于,所述向所述用户呈现所述问诊问题,以得到所述用户输入的问诊信息,包括:向所述用户呈现所述问诊问题和结构化的答案选项;根据所述用户输入的所述答案选项,得到所述用户输入的问诊信息。...

【专利技术属性】
技术研发人员:赵建双
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1