语音处理方法、系统和装置制造方法及图纸

技术编号：22078668 阅读：27 留言：0更新日期：2019-09-12 15:09

本申请实施例公开了语音处理方法、系统和装置。该方法的一具体实施方式包括：接收终端设备发送的用户语音，对所述用户语音进行语音识别，得到语音识别结果；向语义服务器发送所述语音识别结果，接收所述语义服务器返回的、针对所述语音识别结果的回复文本；向语音合成服务器发送所述回复文本，将所接收的所述语音合成服务器发送的回复语音向所述终端设备转发。本申请实施例省略了终端设备对服务器返回的结果进行分析处理以及生成请求，有效地节省了处理时间，进而可以缩短终端设备与用户进行交互时，终端设备的反应时间。

Speech Processing Methods, Systems and Devices

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、系统和装置
本申请实施例涉及计算机
，具体涉及互联网
，尤其涉及语音处理方法、系统和装置。
技术介绍
相关技术中，用户与终端设备进行语音交互的过程中，往往需要终端设备与服务器进行多次交互。一般来说，终端设备需要依次向语音识别服务器、语义识别服务器以及语音合成服务器发送处理请求，以和这些服务器进行交互。而在终端设备向服务器发送处理请求之前，需要进行分析处理，从而拖慢了与用户进行语音交互时的反应速度。并且，终端设备多次与服务器的通信过程，也需要消耗大量的时间。
技术实现思路
本申请实施例提出了语音处理方法、系统和装置。第一方面，本申请实施例提供了一种语音处理方法，用于语音识别服务器，该方法包括：接收终端设备发送的用户语音，对用户语音进行语音识别，得到语音识别结果；向语义服务器发送语音识别结果，接收语义服务器返回的、针对语音识别结果的回复文本；向语音合成服务器发送回复文本，将所接收的语音合成服务器发送的回复语音向终端设备转发。在一些实施例中，语音识别服务器与语义服务器、语音合成服务器设置于同一个局域网内。在一些实施例中，方法还包括：响应于得到语音识别结果，向终端设备发送语音识别结果；以及方法还包括：响应于接收到回复文本，向终端设备发送回复文本。在一些实施例中，在向语义服务器发送语音识别结果之前，方法还包括：判断语音识别结果是否有效且与上一个语音的识别结果相关，生成第一判断结果，其中，上一个语音与用户语音在同一个唤醒交互过程中；以及向语义服务器发送语音识别结果，包括：向语义服务器发送语音识别结果，以使语义服务器判断语音识别结果是否符合预设会话...

【技术保护点】
1.一种语音处理方法，用于语音识别服务器，所述方法包括：接收终端设备发送的用户语音，对所述用户语音进行语音识别，得到语音识别结果；向语义服务器发送所述语音识别结果，接收所述语义服务器返回的、针对所述语音识别结果的回复文本；向语音合成服务器发送所述回复文本，将所接收的所述语音合成服务器发送的回复语音向所述终端设备转发。

【技术特征摘要】
1.一种语音处理方法，用于语音识别服务器，所述方法包括：接收终端设备发送的用户语音，对所述用户语音进行语音识别，得到语音识别结果；向语义服务器发送所述语音识别结果，接收所述语义服务器返回的、针对所述语音识别结果的回复文本；向语音合成服务器发送所述回复文本，将所接收的所述语音合成服务器发送的回复语音向所述终端设备转发。2.根据权利要求1所述的方法，其中，所述语音识别服务器与所述语义服务器、所述语音合成服务器设置于同一个局域网内。3.根据权利要求1所述的方法，其中，所述方法还包括：响应于得到所述语音识别结果，向所述终端设备发送所述语音识别结果；以及所述方法还包括：响应于接收到所述回复文本，向所述终端设备发送所述回复文本。4.根据权利要求3所述的方法，其中，在所述向语义服务器发送所述语音识别结果之前，所述方法还包括：判断所述语音识别结果是否有效且与上一个语音的识别结果相关，生成第一判断结果，其中，所述上一个语音与所述用户语音在同一个唤醒交互过程中；以及所述向语义服务器发送所述语音识别结果，包括：向所述语义服务器发送所述语音识别结果，以使所述语义服务器判断所述语音识别结果是否符合预设会话语义类型并生成第二判断结果；以及在所述向所述终端设备发送所述语音识别结果之前，所述方法还包括：接收所述语义服务器反馈的所述第二判断结果，基于所述第一判断结果和所述第二判断结果，确定所述用户语音是否为有意义语音。5.根据权利要求4所述的方法，其中，所述向所述终端设备发送所述语音识别结果，包括：响应于确定所述用户语音为有意义语音，向所述终端设备发送所述语音识别结果。6.根据权利要求4所述的方法，其中，所述基于所述第一判断结果和所述第二判断结果，确定所述用户语音是否为有意义语音，包括：响应于确定所述第一判断结果和所述第二判断结果中的至少一个为是，确定所述用户语音为有意义语音。7.根据权利要求4所述的方法，其中，所述第一判断结果和所述第二判断结果以数值的形式表示，所述第一判断结果的数值用于表征所述语音识别结果有效且与上一个语音的识别结果相关的概率，所述第二判断结果的数值用于表征所述语音识别结果符合预设会话语义类型的概率；以及所述基于所述第一判断结果和所述第二判断结果，确定所述用户语音是否为有意义语音，包括：确定所述第一判断结果的数值与所述第二判断结果的数值的和；响应于确定所述和大于或等于预设阈值，确定所述用户语音为有意义语音。8.根据权利要求7所述的方法，其中，所述第二判断结果的数值为所述语义服务器利用多个预设会话语义类型模型确定出的多个候选数值中最大的数值。9.一种语音处理系统，包括语音识别服务器、语义服务器和语音合成服务器；所述语音识别服务器，用于接收终端设备发送的用户语音，对所述用户语音进行语音识别，得到语音识别结果，将所述语音识别结果发送给所述语义服务器，以及将所述语义服务器返回的回复文本发送给所述语音合成服务器，接收所述语音合成服务器发送的所述回复文本的回复语音，将所述回复语音发送给所述终端设备。10.根据权利要求9所述的系统，其中，所述语音识别服务器与所述语义服务器、所述语音合成服务器设置于同一个局域网内。11.根据权利要求9所述的系统，其中，所述语音识别服务器，还用于响应于得到所述语音识别结果，向所述终端设备发送所述语音识别结果；以及所述语音识别服务器，还用于响应于接收到所述回复文本，向所述终端设备发送所述回复文本。12.根据权利要求9-1...

【专利技术属性】
技术研发人员：陈建哲，欧阳能钧，袁鼎，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人