System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于语料库的语音问答方法、装置、电子设备及存储介质制造方法及图纸_技高网

基于语料库的语音问答方法、装置、电子设备及存储介质制造方法及图纸

技术编号:43194493 阅读:3 留言:0更新日期:2024-11-01 20:15
本申请实施例公开了一种基于语料库的语音问答方法、装置、电子设备及存储介质,可解决在处理复杂或不标准化的用户查询时,表现出较低的准确性和效率的问题。获取待测语音数据;对待测语音数据进行分析,得到目标问题;在语料库中的预存信息中,对目标问题进行检索,得到检索结果;当检索结果指示目标问题属于第一问题类型时,从语料库中获取目标问题对应的目标答案;或,当检索结果指示目标问题属于第二问题类型时,通过数据流转方法获取与目标问题相关联的流转反馈信息,并根据预存信息和流转反馈信息,获取目标问题对应的目标答案;其中,第一问题类型为目标问题在语料库中存在对应答案;第二问题类型为目标问题需要其他部门协同反馈答案。

【技术实现步骤摘要】

本申请实施例涉及智能问答,尤其涉及一种基于语料库的语音问答方法、装置、电子设备及存储介质


技术介绍

1、智能问答系统在文化等领域的应用日益广泛,现有的智能问答系统大多基于规则驱动或简单的机器学习技术,例如,使用关键词匹配或者基础的自然语言处理(nlp,natural language processing)技术来理解和回答用户的问题。然而,传统系统往往依赖于固定的、预先编程的语言模式,对复杂语言的理解有限,知识更新缓慢,且缺乏有效的自适应学习能力,难以处理未预见的用户输入或自然语言中的复杂结构,使得系统在处理复杂或不标准化的用户查询时,表现出较低的准确性和效率。


技术实现思路

1、为了解决上述技术问题或者至少部分地解决上述技术问题,本申请实施例提供一种基于语料库的语音问答方法、装置、电子设备及存储介质,用以解决现有智能问答系统在处理复杂或不标准化的用户查询时,表现出较低的准确性和效率的问题。

2、为了实现上述目的,本申请实施例提供的技术方案如下:

3、第一方面,本申请实施例提供一种基于语料库的语音问答方法,所述基于语料库的语音问答方法包括:获取待测语音数据;

4、对所述待测语音数据进行分析,得到目标问题,所述目标问题用于指示用户的询问内容;

5、在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果;

6、当所述检索结果指示所述目标问题属于第一问题类型时,从所述语料库中获取所述目标问题对应的目标答案;或,>

7、当所述检索结果指示所述目标问题属于第二问题类型时,通过数据流转方法获取与所述目标问题相关联的流转反馈信息,并根据所述预存信息和所述流转反馈信息,获取所述目标问题对应的目标答案;

8、其中,所述第一问题类型为所述目标问题在所述语料库中存在对应答案;所述第二问题类型为所述目标问题需要其他部门协同反馈答案。

9、作为一种可选的实施方式,在本申请实施例的第一方面中,所述在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果,包括:

10、对所述目标问题进行拆分,得到所述目标问题对应的多个关键特征词汇;

11、在所述语料库中的所述预存信息中,搜索所述多个关键特征词汇,得到所述检索结果。

12、作为一种可选的实施方式,在本申请实施例的第一方面中,所述在所述语料库中的所述预存信息中,搜索所述多个关键特征词汇,得到所述检索结果,包括:

13、当检测到所述多个关键特征词汇与所述预存信息中的预存词汇之间的相似度大于等于预设阈值,则确定所述目标问题属于所述第一问题类型;

14、当检测到所述多个关键特征词汇与所述预存信息中的预存词汇之间的相似度小于所述预设阈值,则确定所述目标问题属于所述第二问题类型。

15、作为一种可选的实施方式,在本申请实施例的第一方面中,所述当所述检索结果指示所述目标问题属于第二问题类型时,通过数据流转方法获取与所述目标问题相关联的流转反馈信息,包括:

16、当所述检索结果指示所述目标问题属于所述第二问题类型时,创建数据流传任务,所述数据流转任务包括:所述目标问题以及所述预存信息中与所述目标问题对应的背景信息;

17、将所述数据流转任务发送给协同部门,并接收所述协同部门发送的与所述目标问题相关联的所述流转反馈信息。

18、作为一种可选的实施方式,在本申请实施例的第一方面中,所述在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果,包括:

19、将所述目标问题发送给所述用户,并指示所述用户针对所述目标问题的内容进行确认;

20、当接收到所述用户针对所述目标问题的确认信息时,在所述语料库中的预存信息中,对所述目标问题进行检索,得到所述检索结果。

21、作为一种可选的实施方式,在本申请实施例的第一方面中,所述对所述待测语音数据进行分析,得到目标问题,包括:

22、根据情绪感知算法,对所述待测语音数据进行情绪分析,得到所述用户的情绪评分;

23、当所述情绪评分符合预设评分标准时,对所述待测语音数据进行分析,得到所述目标问题。

24、作为一种可选的实施方式,在本申请实施例的第一方面中,所述获取所述目标问题对应的目标答案之后,所述方法还包括:

25、将所述目标答案输出给所述用户,并指示所述用户确认所述目标问题是否已解决。

26、作为一种可选的实施方式,在本申请实施例的第一方面中,所述获取所述目标问题对应的目标答案之后,所述方法还包括:

27、采集多个所述待测语音数据以及每个待测语音数据对应的所述目标答案,得到样本数据集;

28、根据所述样本数据集,对初始语言模型进行模型训练,并通过微调算法进行模型微调,得到目标智能问答模型。

29、作为一种可选的实施方式,在本申请实施例的第一方面中,所述获取所述目标问题对应的目标答案之后,所述方法还包括:

30、将所述目标问题和所述目标问题对应的所述目标答案存储到所述语料库中,以更新所述语料库。

31、第二方面,本申请实施例提供一种基于语料库的语音问答装置,所述基于语料库的语音问答装置包括:获取模块,用于获取待测语音数据;

32、处理模块,用于对所述待测语音数据进行分析,得到目标问题,所述目标问题用于指示用户的询问内容;

33、所述处理模块,还用于在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果;

34、所述处理模块,还用于当所述检索结果指示所述目标问题属于第一问题类型时,从所述语料库中获取所述目标问题对应的目标答案;或,

35、所述处理模块,还用于当所述检索结果指示所述目标问题属于第二问题类型时,通过数据流转方法获取与所述目标问题相关联的流转反馈信息,并根据所述预存信息和所述流转反馈信息,获取所述目标问题对应的目标答案;

36、其中,所述第一问题类型为所述目标问题在所述语料库中存在对应答案;所述第二问题类型为所述目标问题需要其他部门协同反馈答案。

37、作为一种可选的实施方式,在本申请实施例的第二方面中,所述处理模块,具体用于对所述目标问题进行拆分,得到所述目标问题对应的多个关键特征词汇;

38、所述处理模块,具体用于在所述语料库中的所述预存信息中,搜索所述多个关键特征词汇,得到所述检索结果。

39、作为一种可选的实施方式,在本申请实施例的第二方面中,所述处理模块,具体用于当检测到所述多个关键特征词汇与所述预存信息中的预存词汇之间的相似度大于等于预设阈值,则确定所述目标问题属于所述第一问题类型;

40、所述处理模块,具体用于当检测到所述多个关键特征词汇与所述预存信息中的预存词汇之间的相似度小于所述预设阈值,则确定所述目标问题属于所述第二问题类型。

41、作为一种本文档来自技高网...

【技术保护点】

1.一种基于语料库的语音问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述在所述语料库中的所述预存信息中,搜索所述多个关键特征词汇,得到所述检索结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述当所述检索结果指示所述目标问题属于第二问题类型时,通过数据流转方法获取与所述目标问题相关联的流转反馈信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述待测语音数据进行分析,得到目标问题,包括:

7.根据权利要求1所述的方法,其特征在于,所述获取所述目标问题对应的目标答案之后,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述获取所述目标问题对应的目标答案之后,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述获取所述目标问题对应的目标答案之后,所述方法还包括:

10.一种基于语料库的语音问答装置,其特征在于,所述基于语料库的语音问答装置包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,包括:所述计算机可读存储介质上存储计算机指令,所述计算机指令被处理器执行时实现如权利要求1至9任一项所述的基于语料库的语音问答方法。

...

【技术特征摘要】

1.一种基于语料库的语音问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述在所述语料库中的所述预存信息中,搜索所述多个关键特征词汇,得到所述检索结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述当所述检索结果指示所述目标问题属于第二问题类型时,通过数据流转方法获取与所述目标问题相关联的流转反馈信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述在所述语料库中的预存信息中,对所述目标问题进行检索,得到检索结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述对所述待测语...

【专利技术属性】
技术研发人员:陆志鹏韩光符兴斌郑曦国丽周崇毅杨伟伟郭红刚唐超王欢李孝春吕轩
申请(专利权)人:中电数据产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1