一种远场语音设备与语音引擎的交互方法技术

技术编号:32831461 阅读:17 留言:0更新日期:2022-03-26 20:44
本发明专利技术公开一种远场语音设备与语音引擎的交互方法,远场语音采集设备和语音引擎交互过程遵守统一的协议;语音采集设备搜索网络中的语音服务;语音引擎向语音采集设备回复搜索消息,并声明提供的服务;语音采集设备识别唤醒词,发出语音控制/语音解析请求以获取语音引擎提供的服务;语音引擎读取请求信息,进行冲突检测,根据附带信息选择优先响应的语音采集设备;语音采集设备基于语音引擎的不同响应执行相应的动作;语音引擎进行语音识别,完成语音控制/语音解析,返回语音控制/语音解析结果;语音采集设备根据语音控制/语音解析结果完成对应输出。本发明专利技术方便在家庭的各个房间区域都能随时使用语音控制关联的IOT设备。域都能随时使用语音控制关联的IOT设备。域都能随时使用语音控制关联的IOT设备。

【技术实现步骤摘要】
一种远场语音设备与语音引擎的交互方法


[0001]本专利技术涉及智能电视和智能音箱
,尤其涉及一种远场语音设备与语音引擎的交互方法。

技术介绍

[0002]万物互联的时代,越来越多的智能设备融入到我们的日常生活。语音控制是智能家居的一个重要功能,已成为智能电视、智能音箱的标配。
[0003]由于电视和音箱的位置固定,用户使用语音控制只能在其附近区域,使用范围具有局限性。目前,扩展电视、音箱的远场语音交互范围,主要是在不同的区域增加远场语音采集设备,通过无线网络在主设备和扩展语音采集设备间传输语音数据,使远场语音交互范围增大。
[0004]现有技术中未考虑如何扩展兼容其他厂商语音采集设备,扩展新的远场语音采集设备容易遇到兼容性问题;未考虑到多个语音采集设备同时工作带来的冲突;语音采集设备只负责语音输入,功能单一。

技术实现思路

[0005]本专利技术的目的在于提供一种远场语音设备与语音引擎的交互方法,定义简单统一的交互协议,方便扩展远场语音设备,拓展语音交互范围,方便在家庭的各个房间区域都能随时使用语音控制关联的IOT设备。
[0006]本专利技术采用的技术方案是:
[0007]一种远场语音设备与语音引擎的交互方法,语音采集设备作为客户端,语音引擎作为服务端;客户端向服务端请求不同的服务,远场语音采集设备和语音引擎交互过程遵守统一的协议;交互方法包括以下步骤:
[0008]步骤1,语音采集设备搜索网络中的语音服务;
[0009]步骤2,语音引擎向语音采集设备回复搜索消息,并声明提供的服务;
[0010]步骤3,语音采集设备识别唤醒词,发出语音控制/语音解析请求以获取语音引擎提供的服务;
[0011]步骤4,语音引擎读取请求信息,进行冲突检测,根据附带信息选择优先响应的语音采集设备;
[0012]步骤5,语音采集设备基于语音引擎的不同响应执行相应的动作;
[0013]当为批准响应时,语音采集设备进行语音数据流传输;当为拒绝响应时,语音采集设备进行状态转换和用户提示;
[0014]步骤6,语音引擎进行语音识别,完成语音控制/语音解析,返回语音控制/语音解析结果;
[0015]步骤7,语音采集设备根据语音控制/语音解析结果完成对应输出。
[0016]进一步地,步骤3中语音控制/语音解析请求携带附带信息,附带信息包括但不局
限于这些信息时间、位置、唤醒词音量、唤醒词置信度、优先级信息;
[0017]位置表示语音采集设备所在位置,时间为语音采集设备发起请求的时间顺序;唤醒词音量为语音采集设备识别到的唤醒词音量;唤醒词置信度为语音采集设备识别到的唤醒词置信度;优先级为不同语音采集设备的优先级,或者不同请求的优先级。
[0018]进一步地,步骤4中当冲突检测到有多个语音采集设备在同一时间段识别到唤醒词同时发起语音请求时,语音引擎根据请求信息中的附带信息进行优先级选择,以批准/拒绝对应的语音控制/语音解析请求避免冲突。
[0019]进一步地,步骤4中冲突检测时,根据附带信息的位置的不同确定语音采集设备的重要性高低,重要性高的语音采集设备优先批准对应的语音控制/语音解析请求。
[0020]进一步地,作为一种实施例,步骤4中位置为客厅的重要性最高,位置为主卧的次之。
[0021]进一步地,步骤5中语音数据流传输时附带编码格式、采样率、流传输标志信息。
[0022]进一步地,语音采集设备通过协议传递参数,语音引擎根据参数以一定的算法进行选择,有效解决多个语音采集设备产生的冲突。
[0023]进一步地,语音采集设备通过协议请求不同的服务,不仅可以实现语音控制,还可根据语音解析结果扩展功能。
[0024]进一步地,语音控制表示语音采集设备输入语音,通过语音引擎控制关联的IOT设备;语音解析表示语音采集设备输入语音,语音引擎返回解析结果,语音采集设备可变身输出终端,完成资源输出。
[0025]进一步地,统一的交互协议基于UDP并遵循UDP基本的协议报文格式,UDP数据内容部分按照远场语音设备与语音引擎交互协议报文格式进行写入传输。
[0026]本专利技术采用以上技术方案,统一标准,使语音采集设备的扩展变得简单,解决兼容性问题。多个语音采集设备共用一个语音引擎,为语音引擎提供选择条件,解决同时使用的冲突问题。本专利技术采用Client

Server模式,可为语音采集设备扩展功能。
附图说明
[0027]以下结合附图和具体实施方式对本专利技术做进一步详细说明;
[0028]图1为本专利技术一种远场语音设备与语音引擎的交互方法采用的系统架构示意图;
[0029]图2为本专利技术一种远场语音设备与语音引擎的交互方法的流程示意图;
[0030]图3为本专利技术语音采集设备利用语音引擎提供的服务实现功能扩展示意图;
[0031]图4为远场语音设备与语音引擎交互协议示意图;
[0032]图5为交互协议的报文部分示意图;
[0033]图6为远场语音设备与语音引擎交互协议的具体实施示例。
具体实施方式
[0034]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。
[0035]如图1至图6之一所示,本专利技术公开了一种远场语音设备与语音引擎的交互方法,语音采集设备作为客户端,语音引擎作为服务端;客户端向服务端请求不同的服务,远场语
音采集设备和语音引擎同时遵守统一的交互协议,具体如图1所示;如图2所示,交互方法包括以下步骤:
[0036]步骤1,语音采集设备搜索网络中的语音服务;
[0037]步骤2,语音引擎向语音采集设备回复搜索消息,并声明提供的服务;
[0038]步骤3,语音采集设备识别唤醒词,发出语音控制/语音解析请求以获取语音引擎提供的服务;
[0039]步骤4,语音引擎读取请求信息,进行冲突检测,根据附带信息选择优先响应的语音采集设备;
[0040]步骤5,语音采集设备基于语音引擎的不同响应执行相应的动作;
[0041]当为批准响应时,语音采集设备进行语音数据流传输;当为拒绝响应时,语音采集设备进行状态转换和用户提示;
[0042]步骤6,语音引擎进行语音识别,完成语音控制/语音解析,返回语音控制/语音解析结果;
[0043]步骤7,语音采集设备根据语音控制/语音解析结果完成对应输出。
[0044]进一步地,语音采集设备通过协议传递参数,语音引擎根据参数以一定的算法进行选择,有效解决多个语音采集设备产生的冲突。
[0045]进一步地,如图3所示,语音采集设备通过协议请求不同的服务,不仅可以实现语音控制,还可根据语音解析结果扩展功能。语音控制表示语音采集设备输入语音,通过语音引擎控制关联的IOT设备;语音解析表示语音采集设备输入语音,语音引擎返回解析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种远场语音设备与语音引擎的交互方法,语音采集设备作为客户端,语音引擎作为服务端;客户端向服务端请求不同的服务,远场语音采集设备和语音引擎交互过程遵守统一的协议;其特征在于:交互方法包括以下步骤:步骤1,语音采集设备搜索网络中的语音服务;步骤2,语音引擎向语音采集设备回复搜索消息,并声明提供的服务;步骤3,语音采集设备识别唤醒词,发出语音控制/语音解析请求以获取语音引擎提供的服务;步骤4,语音引擎读取请求信息,进行冲突检测,根据附带信息选择优先响应的语音采集设备;步骤5,语音采集设备基于语音引擎的不同响应执行相应的动作;当为批准响应时,语音采集设备进行语音数据流传输;当为拒绝响应时,语音采集设备进行状态转换和用户提示;步骤6,语音引擎进行语音识别,完成语音控制/语音解析,返回语音控制/语音解析结果;步骤7,语音采集设备根据语音控制/语音解析结果完成对应输出。2. 根据权利要求1所述的一种远场语音设备与语音引擎的交互方法,其特征在于:统一的交互协议基于UDP并遵循 UDP 基本的协议报文格式,UDP 数据内容部分按照远场语音设备与语音引擎交互协议报文格式进行写入传输。3.根据权利要求1所述的一种远场语音设备与语音引擎的交互方法,其特征在于:语音控制表示语音采集设备输入语音,通过语音引擎控制关联的IOT设备;语音解析表示语音采集设备输入语音,语音引擎返回解析结...

【专利技术属性】
技术研发人员:蔡财溪陈峭
申请(专利权)人:冠捷显示科技厦门有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1