【技术实现步骤摘要】
一种问答数据处理方法、装置以及计算机可读存储介质
本申请涉及数据处理的
,尤其涉及一种问答数据处理方法、装置以及计算机可读存储介质。
技术介绍
随着计算机网络的发展,计算机网络还可应用在医疗诊断领域中,用户足不出户就能在网络中搜索到病症相关的诊断数据。现有技术中,用户在通过终端设备搜索病症A相关的诊断数据时,是根据病症A的文本语义相关性来搜索用于答复病症A的诊断数据,并且往往可以搜索出多个用于答复病症A的诊断数据。终端设备是根据搜索出的多个诊断数据与病症A之间的文本语义相关性对该多个诊断数据进行排序显示,因此,用户很难从该多个诊断数据中选择出更可靠的诊断数据以采用,导致针对诊断数据的筛选效率低。申请内容本申请提供了一种问答数据处理方法、装置以及计算机可读存储介质,可提高针对关联答复数据的筛选效率。本申请一方面提供了一种问答数据处理方法,包括:获取询问数据,搜索询问数据的关联答复数据;获取询问数据所指示的询问领域,获取关联答复数据对应的答复用户的用户认证领域以及答复用户的擅长领域描述信息;根据询问领域、答复用户的用户认证领域以及答复用户的擅长领域描述信息,获取关联答复数据的答复可信度;根据关联答复数据的答复可信度,输出关联答复数据。其中,获取询问数据所指示的询问领域,包括:将询问数据输入词向量模型,基于词向量模型生成询问数据的询问向量;将询问向量输入领域分类模型,基于领域分类模型,确定询问向量对应的目标领域分类标签;< ...
【技术保护点】
1.一种问答数据处理方法,其特征在于,包括:/n获取询问数据,搜索所述询问数据的关联答复数据;/n获取所述询问数据所指示的询问领域,获取所述关联答复数据对应的答复用户的用户认证领域以及所述答复用户的擅长领域描述信息;/n根据所述询问领域、所述答复用户的用户认证领域以及所述答复用户的所述擅长领域描述信息,获取所述关联答复数据的答复可信度;/n根据所述关联答复数据的答复可信度,输出所述关联答复数据。/n
【技术特征摘要】
1.一种问答数据处理方法,其特征在于,包括:
获取询问数据,搜索所述询问数据的关联答复数据;
获取所述询问数据所指示的询问领域,获取所述关联答复数据对应的答复用户的用户认证领域以及所述答复用户的擅长领域描述信息;
根据所述询问领域、所述答复用户的用户认证领域以及所述答复用户的所述擅长领域描述信息,获取所述关联答复数据的答复可信度;
根据所述关联答复数据的答复可信度,输出所述关联答复数据。
2.根据权利要求1所述的方法,其特征在于,所述获取所述询问数据所指示的询问领域,包括:
将所述询问数据输入词向量模型,基于所述词向量模型生成所述询问数据的询问向量;
将所述询问向量输入领域分类模型,基于所述领域分类模型,确定所述询问向量对应的目标领域分类标签;
将用户认证领域集合中所述目标邻域分类标签对应的用户认证领域,确定为所述询问数据所指示的所述询问领域。
3.根据权利要求2所述的方法,其特征在于,还包括:
将样本询问数据输入初始领域分类模型;所述样本询问数据携带有询问领域标签;
基于所述初始领域分类模型,得到所述样本询问数据的预测询问领域;
根据所述预测询问领域和所述样本询问领域标签所指示的样本询问领域,修正所述初始领域分类模型的模型参数,得到所述领域分类模型。
4.根据权利要求1所述的方法,其特征在于,所述获取所述关联答复数据对应的答复用户的用户认证领域以及所述答复用户的擅长领域描述信息,包括:
获取所述答复用户的用户简介信息;
对所述用户简介信息进行信息结构化处理,得到至少两个结构化区域;每个结构化区域均携带有区域标签;所述区域标签包括认证领域区域标签和擅长领域区域标签;
从携带有所述认证领域区域标签的结构化区域中,获取认证领域字段信息,从携带有擅长领域区域标签的结构化区域中,获取擅长领域字段信息;
将所述认证领域字段信息确定为所述答复用户的用户认证领域,将所述擅长领域字段信息确定为所述答复用户的擅长领域描述信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述询问领域、所述答复用户的用户认证领域以及所述答复用户的擅长领域描述信息,获取所述关联答复数据的答复可信度,包括:
将所述询问数据和所述答复用户的所述擅长领域描述信息输入词向量模型;
基于所述词向量模型,生成所述询问数据对应的询问向量以及所述擅长领域描述信息对应的描述向量;
获取所述询问向量与所述描述向量之间的向量距离,根据所述向量距离确定所述关联答复数据的初始可信度;
根据所述询问领域以及所述答复用户的用户认证领域,对所述初始可信度进行加权,得到所述关联答复数据的答复可信度。
6.根据权利要求5所述的方法,其特征在于,所述基于所述词向量模型,生成所述询问数据对应的询问向量以及所述擅长领域描述信息对应的描述向量,包括:
基于所述词向量模型对所述询问数据进行分词,得到所述询问数据所包含的每个分词单词分别对应的单词向量;
基于所述词向量模型对所述擅长领域描述信息进行分词,得到所述擅长领域描述信息所包含的每个分词单词分别对应的单词向量;
根据所述询问数据所包含的每个分词单词分别对应的单词向量生成所述询问向量,根据所述擅长领域描述信息所包含的每个分词单词分别对应的单词向量生成所述描述向量。
7.根据权利要求5所述的方法,其特征在于,所述根据所述向量距离确定所述关联答复数据的初始可信度,包括:
将所述向量距离的倒数,确定为所述关联答复数据的所述初始可信度;或者,
将所述向量距离的倒数与标准可信度之间的乘积,确定为所述关联答复数据的所述初始...
【专利技术属性】
技术研发人员:康战辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。