语音应答方法、装置、设备及存储介质制造方法及图纸

技术编号:31087865 阅读:9 留言:0更新日期:2021-12-01 12:45
本申请涉及人工智能,提供一种语音应答方法、装置、设备及计算机可读存储介质,该方法包括:向客户端发送询问语音;获取所述客户端发送的答复语音,所述答复语音用于答复所述询问语音;基于训练好的意图识别模型,根据所述询问语音对应的第一文本信息和所述答复语音确定用户意图;根据所述用户意图确定应答语音;向所述客户端发送所述应答语音。本申请能够提高意图识别的效率和准确率。本申请还涉及区块链技术,训练好的意图识别模型能够存储于区块链中。链中。链中。

【技术实现步骤摘要】
语音应答方法、装置、设备及存储介质


[0001]本申请涉及语音处理的
,尤其涉及一种语音应答方法、装置、 设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能技术在学术界的快速发展以及在生活中的广泛使用,语音 交互成为人与机器之间沟通交流的重要桥梁。服务端要与客户对话并完成特 定任务,其中一个核心技术是用户意图的判定,即让服务端在接受到用户的 语音后,能够通过语音判定用户的意图。
[0003]目前,通过语音判定客户的意图一般是基于语音意图识别方法完成的, 现传统的意图识别方法通常分成语音识别、意图识别两个独立的阶段,在第 一阶段通过语音识别技术(Automatic Speech Recognition,ASR)将语音转化 成文本,第二阶段通过自然语言处理技术(Natural Language Processing,NLP) 从文本中抽取文本内的语义信息,识别出客户的意图。基于文本的意图识别 的准确率严重依赖于语音识别技术的准确率。并且进行意图识别的时间较长, 意图识别的过程较为复杂且计算量较大。

技术实现思路

[0004]本申请的主要目的在于提供一种语音应答方法、装置、设备及计算机可 读存储介质,旨在提高用户意图识别的准确性和效率,以提供更符合用户意 图的应答语音,提高用户的使用体验。
[0005]第一方面,本申请提供一种语音应答方法,所述语音应答方法包括以下 步骤:
[0006]向客户端发送询问语音;
[0007]获取所述客户端发送的答复语音,所述答复语音用于答复所述询问语音;
[0008]基于训练好的意图识别模型,根据所述询问语音对应的第一文本信息和 所述答复语音确定用户意图;
[0009]根据所述用户意图确定应答语音;
[0010]将所述应答语音发送给所述客户端。
[0011]第二方面,本申请还提供一种语音应答装置,所述语音应答装置包括:
[0012]询问语音发送模块,用于向客户端发送询问语音;
[0013]答复语音获取模块,用于获取所述客户端发送的答复语音,所述答复语 音用于答复所述询问语音;
[0014]用户意图确定模块,用于基于训练好的意图识别模型,根据所述询问语 音对应的第一文本信息和所述答复语音确定用户意图;
[0015]应答语音确定模块,用于根据所述用户意图确定应答语音;
[0016]应答语音发送模块,用于向所述客户端发送所述应答语音。
[0017]第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、 存储器、
以及存储在所述存储器上并可被所述处理器执行的计算机程序,其 中所述计算机程序被所述处理器执行时,实现如上述的语音应答方法的步骤。
[0018]第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存 储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如 上述的语音应答方法的步骤。
[0019]本申请提供一种语音应答方法、装置、设备及计算机可读存储介质,方 法包括向客户端发送询问语音;获取所述客户端发送的答复语音,所述答复 语音用于答复所述询问语音;基于训练好的意图识别模型,根据所述询问语 音对应的第一文本信息和所述答复语音确定用户意图;根据所述用户意图确 定应答语音;将所述应答语音发送给所述客户端。本申请通过询问语音对应 的第一文本信息和用户的答复语音共同判定用户意图,无需将答复语音转化 成文本进行用户意图的判定,有效提高用户意图识别的准确性和效率,以提 供更符合用户意图的应答语音。
附图说明
[0020]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需 要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一 些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
[0021]图1为本申请实施例提供的一种语音应答方法的流程示意图;
[0022]图2为实施本实施例提供的语音应答方法的一场景示意图;
[0023]图3为本申请实施例提供的一种意图识别模型的示意性框图;
[0024]图4为本申请实施例提供的一种语音应答装置的示意性框图;
[0025]图5为本申请一实施例涉及的计算机设备的结构示意框图。
具体实施方式
[0026]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是 全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创 造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步 骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组 合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0028]本申请实施例提供一种语音应答方法、装置、计算机设备及计算机可读 存储介质。其中,该语音应答方法可应用于终端设备中,该终端设备可以是 平板电脑、笔记本电脑、台式电脑等电子设备。也可以应用于服务器中,该 服务器可以是单独的服务器,也可以是提供云服务、云数据库、云计算、云 函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内 容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等 基础云计算服务的云服务器。
[0029]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况 下,下述
的实施例及实施例中的特征可以相互组合。
[0030]请参照图1,图1为本申请的实施例提供的一种语音应答方法的流程示意 图。
[0031]如图1所示,该语音应答方法包括步骤S101至步骤S105。
[0032]步骤S101、向客户端发送询问语音。
[0033]如图2所示,图2为本申请一实施例提供的一种实用场景图。
[0034]示例性的,在电话销售的通话过程中,服务端可以向客户端发送询问语 音。并且接收客户端发送的答复语音,服务端基于答复语音能够将应答答复 语音的应答语音发送到客户端,以完成通话过程。
[0035]示例性的,服务端可以在预设询问文本库中确定用于询问客户的第一文 本文本,而后服务端通过TTS技术将第一文本信息转化为询问语音,并在通 话中向客户端发送询问语音,以对用户进行询问。
[0036]示例性的,预设询问文本库可以是维护人员预先设置的包括有若干询问 文本的数据库,可以理解的,不同的询问文本用于销售不同产品或销售同样 产品时的不同表达方式。
[0037]示例性的,第一文本信息可以用于询问客户,包括询问客户的偏好、需 求。可以理解的,第一文本信息包括产品信息,如询问客户是否需要A产品 的第一文本信息;也可以包括时长信息,如询问客户话费套餐预定多长时间 的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音应答方法,其特征在于,包括:向客户端发送询问语音;获取所述客户端发送的答复语音,所述答复语音用于答复所述询问语音;基于训练好的意图识别模型,根据所述询问语音对应的第一文本信息和所述答复语音确定用户意图;根据所述用户意图确定应答语音;向所述客户端发送所述应答语音。2.如权利要求1所述的语音应答方法,其特征在于,所述基于训练好的意图识别模型,根据所述第一文本信息和所述答复语音确定用户意图,包括:基于所述意图识别模型的文本特征提取网络,对所述第一文本信息进行特征提取,得到第一文本特征向量;基于所述意图识别模型的语音特征提取网络,对所述答复语音进行特征提取,得到答复语音特征向量;基于所述意图识别模型的特征融合网络,对所述第一文本特征向量和所述答复语音特征向量进行融合,得到融合特征向量;基于所述意图识别模型的意图分类网络,对所述融合特征向量进行卷积、激活以及分类处理,得到用户意图。3.如权利要求2所述的语音应答方法,其特征在于,所述基于所述意图识别模型的特征融合网络,对所述第一文本特征向量和所述答复语音特征向量进行融合,得到融合特征向量,包括:获取N个预设矩阵,N为大于或等于3的自然数;将所述第一文本特征向量与每一个所述预设矩阵进行向量相乘,得到N个文本向量;将所述答复语音特征向量与每一个所述预设矩阵进行向量相乘,得到N个语音向量;对所述N个文本向量和所述N个语音向量进行融合,得到融合特征向量。4.如权利要求3所述的语音应答方法,其特征在于,所述对所述N个文本向量和所述N个语音向量进行融合,得到融合特征向量,包括:根据第一文本向量和第二文本向量计算所述第一文本特征向量的相似度;根据第一语音向量和第二语音向量计算所述语音特征向量的相似度;根据所述第一文本特征向量的相似度和所述语音特征向量的相似度,确定所述第一文本特征向量的权重和所述语音特征向量的权重;对所述第一文本特征向量的权重、第三文本向量、所述语音特征向量的权重以及第三语音向量进行向量计算,得到融合特征向量;其中,所述第一文本向量、所述第二文本向量以及所述第三文本向量是从N个文本向量中确定的,所述第一语音向量,所述第二语音向量以及所述第三语音向量是从N个语音向量中确定的。5.如权利要求1

4任一项所述的语音应答方法,其特...

【专利技术属性】
技术研发人员:吴绍锋
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1