一种问答数据处理方法、装置以及计算机可读存储介质制造方法及图纸

技术编号:25185429 阅读:13 留言:0更新日期:2020-08-07 21:13
本申请公开了一种问答数据处理方法、装置以及计算机可读存储介质,该方法包括:获取询问数据,搜索询问数据的关联答复数据;获取询问数据所指示的询问领域,获取关联答复数据对应的答复用户的用户认证领域以及答复用户的擅长领域描述信息;根据询问领域、答复用户的用户认证领域以及答复用户的擅长领域描述信息,获取关联答复数据的答复可信度;根据关联答复数据的答复可信度,输出关联答复数据。采用本申请,可提高针对关联答复数据的筛选效率。

【技术实现步骤摘要】
一种问答数据处理方法、装置以及计算机可读存储介质
本申请涉及数据处理的
,尤其涉及一种问答数据处理方法、装置以及计算机可读存储介质。
技术介绍
随着计算机网络的发展,计算机网络还可应用在医疗诊断领域中,用户足不出户就能在网络中搜索到病症相关的诊断数据。现有技术中,用户在通过终端设备搜索病症A相关的诊断数据时,是根据病症A的文本语义相关性来搜索用于答复病症A的诊断数据,并且往往可以搜索出多个用于答复病症A的诊断数据。终端设备是根据搜索出的多个诊断数据与病症A之间的文本语义相关性对该多个诊断数据进行排序显示,因此,用户很难从该多个诊断数据中选择出更可靠的诊断数据以采用,导致针对诊断数据的筛选效率低。申请内容本申请提供了一种问答数据处理方法、装置以及计算机可读存储介质,可提高针对关联答复数据的筛选效率。本申请一方面提供了一种问答数据处理方法,包括:获取询问数据,搜索询问数据的关联答复数据;获取询问数据所指示的询问领域,获取关联答复数据对应的答复用户的用户认证领域以及答复用户的擅长领域描述信息;根据询问领域、答复用户的用户认证领域以及答复用户的擅长领域描述信息,获取关联答复数据的答复可信度;根据关联答复数据的答复可信度,输出关联答复数据。其中,获取询问数据所指示的询问领域,包括:将询问数据输入词向量模型,基于词向量模型生成询问数据的询问向量;将询问向量输入领域分类模型,基于领域分类模型,确定询问向量对应的目标领域分类标签;<br>将用户认证领域集合中目标邻域分类标签对应的用户认证领域,确定为询问数据所指示的询问领域。其中,还包括:将样本询问数据输入初始领域分类模型;样本询问数据携带有询问领域标签;基于初始领域分类模型,得到样本询问数据的预测询问领域;根据预测询问领域和样本询问领域标签所指示的样本询问领域,修正初始领域分类模型的模型参数,得到领域分类模型。其中,获取关联答复数据对应的答复用户的用户认证领域以及答复用户的擅长领域描述信息,包括:获取答复用户的用户简介信息;对用户简介信息进行信息结构化处理,得到至少两个结构化区域;每个结构化区域均携带有区域标签;区域标签包括认证领域区域标签和擅长领域区域标签;从携带有认证领域区域标签的结构化区域中,获取认证领域字段信息,从携带有擅长领域区域标签的结构化区域中,获取擅长领域字段信息;将认证领域字段信息确定为答复用户的用户认证领域,将擅长领域字段信息确定为答复用户的擅长领域描述信息。其中,根据询问领域、答复用户的用户认证领域以及答复用户的擅长领域描述信息,获取关联答复数据的答复可信度,包括:将询问数据和答复用户的擅长领域描述信息输入词向量模型;基于词向量模型,生成询问数据对应的询问向量以及擅长领域描述信息对应的描述向量;获取询问向量与描述向量之间的向量距离,根据向量距离确定关联答复数据的初始可信度;根据询问领域以及答复用户的用户认证领域,对初始可信度进行加权,得到关联答复数据的答复可信度。其中,基于词向量模型,生成询问数据对应的询问向量以及擅长领域描述信息对应的描述向量,包括:基于词向量模型对询问数据进行分词,得到询问数据所包含的每个分词单词分别对应的单词向量;基于词向量模型对擅长领域描述信息进行分词,得到擅长领域描述信息所包含的每个分词单词分别对应的单词向量;根据询问数据所包含的每个分词单词分别对应的单词向量生成询问向量,根据擅长领域描述信息所包含的每个分词单词分别对应的单词向量生成描述向量。其中,根据向量距离确定关联答复数据的初始可信度,包括:将向量距离的倒数,确定为关联答复数据的初始可信度;或者,将向量距离的倒数与标准可信度之间的乘积,确定为关联答复数据的初始可信度。其中,根据询问领域以及答复用户的用户认证领域,对初始可信度进行加权,得到关联答复数据的答复可信度,包括:当询问领域与答复用户的用户认证领域相同时,根据升值权重对初始可信度进行加权,得到关联答复数据的答复可信度;当询问领域与答复用户的用户认证领域不相同时,根据降值权重对初始可信度进行加权,得到关联答复数据的答复可信度。其中,关联答复数据包括第一关联答复数据和第二关联答复数据;根据关联答复数据的答复可信度,输出关联答复数据,包括:当第一关联答复数据的答复可信度以及第二关联答复数据的答复可信度均大于或者等于答复可信度阈值时,根据第一关联答复数据的答复可信度与第二关联答复数据的答复可信度之间的数值大小,在客户端页面中依次显示第一关联答复数据和第二关联答复数据。其中,关联答复数据包括第一关联答复数据和第二关联答复数据;根据关联答复数据的答复可信度,输出关联答复数据,包括:当第一关联答复数据的答复可信度大于或者等于答复可信度阈值,且第二关联答复数据的答复可信度小于可信度阈值时,在客户端页面中对第一关联答复数据以及第一关联答复数据的答复可信度进行关联显示。本申请一方面提供了一种问答数据处理方法,包括:获取病症询问数据,搜索病症询问数据的关联诊断数据;获取病症询问数据所指示的询问科室,获取关联诊断数据对应的答复用户的用户认证科室以及答复用户的擅长领域描述信息;根据询问科室、答复用户的用户认证科室以及答复用户的擅长领域描述信息,获取关联诊断数据的诊断可信度;根据关联诊断数据的诊断可信度,输出关联诊断数据。本申请一方面提供了一种问答数据处理装置,包括:数据搜索模块,用于获取询问数据,搜索询问数据的关联答复数据;领域获取模块,用于获取询问数据所指示的询问领域,获取关联答复数据对应的答复用户的用户认证领域以及答复用户的擅长领域描述信息;可信度获取模块,用于根据询问领域、答复用户的用户认证领域以及答复用户的擅长领域描述信息,获取关联答复数据的答复可信度;输出模块,用于根据关联答复数据的答复可信度,输出关联答复数据。其中,领域获取模块,包括:输入单元,用于将询问数据输入词向量模型,基于词向量模型生成询问数据的询问向量;标签确定单元,用于将询问向量输入领域分类模型,基于领域分类模型,确定询问向量对应的目标领域分类标签;领域确定单元,用于将用户认证领域集合中目标邻域分类标签对应的用户认证领域,确定为询问数据所指示的询问领域。其中,问答数据处理装置,还包括:模型输入模块,用于将样本询问数据输入初始领域分类模型;样本询问数据携带有询问领域标签;预测领域获取模块,用于基于初始领域分类模型,得到样本询问数据的预测询问领域;修正模块,用于根据预测询问领域和样本询问领域标签所指示的样本询问领域,修正初始领域分类模型的模型参数,得到领域分类模型。其中,领域获取模块,包括:简介信息获取单元,用于获取本文档来自技高网...

【技术保护点】
1.一种问答数据处理方法,其特征在于,包括:/n获取询问数据,搜索所述询问数据的关联答复数据;/n获取所述询问数据所指示的询问领域,获取所述关联答复数据对应的答复用户的用户认证领域以及所述答复用户的擅长领域描述信息;/n根据所述询问领域、所述答复用户的用户认证领域以及所述答复用户的所述擅长领域描述信息,获取所述关联答复数据的答复可信度;/n根据所述关联答复数据的答复可信度,输出所述关联答复数据。/n

【技术特征摘要】
1.一种问答数据处理方法,其特征在于,包括:
获取询问数据,搜索所述询问数据的关联答复数据;
获取所述询问数据所指示的询问领域,获取所述关联答复数据对应的答复用户的用户认证领域以及所述答复用户的擅长领域描述信息;
根据所述询问领域、所述答复用户的用户认证领域以及所述答复用户的所述擅长领域描述信息,获取所述关联答复数据的答复可信度;
根据所述关联答复数据的答复可信度,输出所述关联答复数据。


2.根据权利要求1所述的方法,其特征在于,所述获取所述询问数据所指示的询问领域,包括:
将所述询问数据输入词向量模型,基于所述词向量模型生成所述询问数据的询问向量;
将所述询问向量输入领域分类模型,基于所述领域分类模型,确定所述询问向量对应的目标领域分类标签;
将用户认证领域集合中所述目标邻域分类标签对应的用户认证领域,确定为所述询问数据所指示的所述询问领域。


3.根据权利要求2所述的方法,其特征在于,还包括:
将样本询问数据输入初始领域分类模型;所述样本询问数据携带有询问领域标签;
基于所述初始领域分类模型,得到所述样本询问数据的预测询问领域;
根据所述预测询问领域和所述样本询问领域标签所指示的样本询问领域,修正所述初始领域分类模型的模型参数,得到所述领域分类模型。


4.根据权利要求1所述的方法,其特征在于,所述获取所述关联答复数据对应的答复用户的用户认证领域以及所述答复用户的擅长领域描述信息,包括:
获取所述答复用户的用户简介信息;
对所述用户简介信息进行信息结构化处理,得到至少两个结构化区域;每个结构化区域均携带有区域标签;所述区域标签包括认证领域区域标签和擅长领域区域标签;
从携带有所述认证领域区域标签的结构化区域中,获取认证领域字段信息,从携带有擅长领域区域标签的结构化区域中,获取擅长领域字段信息;
将所述认证领域字段信息确定为所述答复用户的用户认证领域,将所述擅长领域字段信息确定为所述答复用户的擅长领域描述信息。


5.根据权利要求1所述的方法,其特征在于,所述根据所述询问领域、所述答复用户的用户认证领域以及所述答复用户的擅长领域描述信息,获取所述关联答复数据的答复可信度,包括:
将所述询问数据和所述答复用户的所述擅长领域描述信息输入词向量模型;
基于所述词向量模型,生成所述询问数据对应的询问向量以及所述擅长领域描述信息对应的描述向量;
获取所述询问向量与所述描述向量之间的向量距离,根据所述向量距离确定所述关联答复数据的初始可信度;
根据所述询问领域以及所述答复用户的用户认证领域,对所述初始可信度进行加权,得到所述关联答复数据的答复可信度。


6.根据权利要求5所述的方法,其特征在于,所述基于所述词向量模型,生成所述询问数据对应的询问向量以及所述擅长领域描述信息对应的描述向量,包括:
基于所述词向量模型对所述询问数据进行分词,得到所述询问数据所包含的每个分词单词分别对应的单词向量;
基于所述词向量模型对所述擅长领域描述信息进行分词,得到所述擅长领域描述信息所包含的每个分词单词分别对应的单词向量;
根据所述询问数据所包含的每个分词单词分别对应的单词向量生成所述询问向量,根据所述擅长领域描述信息所包含的每个分词单词分别对应的单词向量生成所述描述向量。


7.根据权利要求5所述的方法,其特征在于,所述根据所述向量距离确定所述关联答复数据的初始可信度,包括:
将所述向量距离的倒数,确定为所述关联答复数据的所述初始可信度;或者,
将所述向量距离的倒数与标准可信度之间的乘积,确定为所述关联答复数据的所述初始...

【专利技术属性】
技术研发人员:康战辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1