分布式语音处理系统及方法技术方案

技术编号：43509111 阅读：18 留言：0更新日期：2024-11-29 17:11

提供一种分布式语音处理系统及方法。该系统包括多个节点设备，多个节点设备组成网络，其中每个节点设备包括处理器、存储器、通信模块以及声音处理模块，且多个节点设备中的至少一个节点设备包括声音采集模块；其中声音采集模块配置为采集音频信号；声音处理模块配置为对音频信号进行预处理以得到第一声音预处理结果，其中预处理包括提取音频信号的声音特征值；其中通信模块还配置为从网络接收来自至少一个其他节点设备的一个或多个第二声音预处理结果；声音处理模块还配置为基于第一声音预处理结果和/或一个或多个第二声音预处理结果执行语音识别以得到第一语音识别结果。本申请实现了去中心化的设计,提高了语音识别的效率、稳定性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及分布式语音处理领域，尤其涉及一种分布式语音处理系统及方法。

技术介绍

1、语音识别技术和关键词识别技术日趋成熟，且在市场中的应用越来越广泛，比如儿童玩具、教育产品、智能家居等产品中都加入了语音识别功能，实现语音交互控制的功能。

2、当前的语音识别有两种常见的方法，一种是基于单个设备的本地识别，另一种是基于本地识别结合服务器云端的识别。

3、对于第一种方法，智能家居市场上常用的单个设备实现本地语音控制，其语音识别过程是将原始语音采集到一个设备，在这个设备上进行计算获得识别结果。这种方法在应用过程中，如果用户在空间环境中移动或需要跨房间识别时，受拾音距离的限制，常常不能顺利完成语音识别，从而导致出现不能识别或识别效果差的情况。

4、对于第二种方法，市面上通常通过智能音箱或者智能网关等进行语音识别。这些设备作为控制中枢，同时也是语音识别的唯一入口。设备必须先连接到互联网，然后接入相应的云端服务器也需要连接到互联网。这些设备从云端获取语音识别结果，进而完成语音识别或语音控制。这种方法存在问题，例如作为语音识别的唯一入口的设备发生故障、或者网络出现波动等，都会造成语音识别失败的问题。特别是，当网络稳定性较差时，容易导致识别响应速度慢。此外，此类语音识别方法将语音上传至云端，并且设备需要实时监听周围环境声音，容易导致出现用户隐私安全问题。

5、与此同时，这两种方法都存在不能跨房间的语音识别控制等问题。

6、除了上述两种方法之外，还存在另外一种本地中心识别方法，其将多个点的

7、中国专利(cn111415658a)公开了一种去中心化语音控制多设备系统及其控制方法。在该方案中，设备首先识别出语音中的唤醒词，然后将识别出的唤醒词向系统内所有设备发送，并同时接收系统内其他设备发送的唤醒词。设备对所有的唤醒词进行筛选，筛选出与本设备匹配的唤醒词。在该方案中，如果设备接收到的语音中包含自身不支持的唤醒词(即语音指令)，则可能导致语音控制失败。

8、中国专利(cn110136708a)公开了一种基于蓝牙mesh的分布式语音控制系统及控制方法，该控制系统包括蓝牙mesh网络、语音控制器、蓝牙节点设备；语音控制器包括语音采集，语音降噪，语音识别，蓝牙模块，及可选的wifi模块。语音控制器之间通过蓝牙互相通信并实时保持数据同步，任一语音控制器都可控制网络内蓝牙节点设备；蓝牙节点设备通过蓝牙mesh网络与语音控制器通信，根据接收mesh数据或其自身的按键事件进行响应操作。在该方案中，每一语音控制器采集语音，进行语音降噪和回音消除，然后进行语音本地或者在线识别，语义理解解析出要控制的信息，封装成mesh数据，通过蓝牙模块发送至mesh网络中。如果语音控制器不支持当前的控制指令，则可能会导致设备无法识别自己不支持的语音指令，最终导致语音控制失败。

9、综上，现有技术中需要一种改进的分布式语音处理方案，以解决现有技术中存在的上述问题。应理解，上述所列举的技术问题仅作为示例而非对本专利技术的限制，本专利技术并不限于同时解决上述所有技术问题的技术方案。本专利技术的技术方案可以实施为解决上述或其他技术问题中的一个或多个。

技术实现思路

1、为克服现有技术存在的缺陷，本专利技术公开了一种分布式语音处理系统及其处理方法。

2、在本专利技术的一方面，提供一种分布式语音处理系统，包括：多个节点设备，所述多个节点设备组成网络，其中每个节点设备包括处理器、存储器、通信模块以及声音处理模块，且所述多个节点设备中的至少一个节点设备包括声音采集模块；其中所述声音采集模块配置为采集音频信号；所述声音处理模块配置为对所述音频信号进行预处理以得到第一声音预处理结果，其中所述预处理包括提取所述音频信号的声音特征值；其中，所述通信模块还配置为从所述网络接收来自至少一个其他节点设备的一个或多个第二声音预处理结果；所述声音处理模块还配置为基于所述第一声音预处理结果和/或所述一个或多个第二声音预处理结果执行语音识别以得到第一语音识别结果。

3、优选地，所述通信模块还配置为将所述第一声音预处理结果发送到所述网络中的一个或多个节点设备。

4、可选地，所述通信模块还配置为将所述第一语音识别结果发送到所述网络中的一个或多个节点设备。

5、可选地，所述通信模块还配置为从所述网络接收来自至少一个其他节点设备的一个或多个第二语音识别结果；及所述声音处理模块还配置为基于所述第一语音识别结果和所述一个或多个第二语音识别结果执行语音识别以得到最终语音识别结果。

6、优选地，所述第一声音预处理结果和所述一个或多个第二声音预处理结果的每个包括声音特征值、声音质量及声音时间信息。

7、在本专利技术的另一方面，提供一种分布式语音处理方法，由网络中的节点设备执行，包括：若所述节点设备包括声音采集模块，则执行下述步骤：采集音频信号；及对所述音频信号进行预处理以得到第一声音预处理结果，其中所述预处理包括提取所述音频信号的声音特征值；从所述网络接收来自至少一个其他节点设备的一个或多个第二声音预处理结果；基于所述第一声音预处理结果和/或所述一个或多个第二声音预处理结果执行语音识别以得到第一语音识别结果。

8、在本专利技术的再一方面，提供一种分布式语音处理系统，包括：多个节点设备，所述多个节点设备组成网络，其中每个节点设备包括处理器、存储器、通信模块、声音采集模块以及声音处理模块；其中所述声音采集模块配置为采集音频信号；所述声音处理模块配置为对所述音频信号进行预处理以得到第一声音预处理结果；其中，所述通信模块还配置为从所述网络接收来自至少一个其他节点设备的一个或多个第二声音预处理结果；所述第一声音预处理结果和所述一个或多个第二声音预处理结果中的每个包括一个或多个数据块；所述一个或多个数据块中的每个数据块包括时间信息，所述时间信息标识所述声音处理模块完成所述数据块预处理的时间；所述一个或多个数据块中的每个数据块还包括递增序号，所述递增序号依据数据块中的时间信息分配；所述声音处理模块还配置为按照递增序号递增顺序拼接所述第一声音预处理结果和/或一个或多个第二声音预处理结果的数据块，以得到完整的第三声音预处理结果；以及所述声音处理模块还配置为对所述第三声音预处理结果进行处理以得到最终的语音识别结果。

9、优选地，所述通信模块配置为将所述第一声音预处理结果发送到所述网络中的一个或多个节点设备。

10、可选地，所述第一或第二声音预处理结果中的每个数据块配置为具有相同的时长。

11、可选地，所述递增序号是多个节点设备中的每个节点设备的声音处理模块对所述音频信号进行预处理时为数本文档来自技高网...

【技术保护点】

1.一种分布式语音处理系统，其特征在于，包括：

2.根据权利要求1所述的分布式语音处理系统，其特征在于，所述通信模块还配置为将所述第一声音预处理结果发送到所述网络中的一个或多个节点设备。

3.根据权利要求1所述的分布式语音处理系统，其特征在于，所述通信模块还配置为将所述第一语音识别结果发送到所述网络中的一个或多个节点设备。

4.根据权利要求1所述的分布式语音处理系统，其特征在于，所述通信模块还配置为从所述网络接收来自至少一个其他节点设备的一个或多个第二语音识别结果；及

5.根据权利要求1所述的分布式语音处理系统，其特征在于，所述第一声音预处理结果和所述一个或多个第二声音预处理结果的每个包括声音特征值、声音质量及声音时间信息。

6.一种分布式语音处理方法，由网络中的节点设备执行，其特征在于，包括：

7.根据权利要求6所述的分布式语音处理方法，还包括将所述第一声音预处理结果发送到所述网络中的一个或多个节点设备。

8.根据权利要求6所述的分布式语音处理方法，还包括将所述第一语音识别结果发送到所述网络中的一个或多个节点设备。

9.根据权利要求6所述的分布式语音处理方法，还包括从所述网络接收来自至少一个其他节点设备的一个或多个第二语音识别结果；及

10.根据权利要求6所述的分布式语音处理方法，其特征在于，所述第一声音预处理结果和所述一个或多个第二声音预处理结果的每个包括声音特征值、声音质量及声音时间信息。

...

【技术特征摘要】

1.一种分布式语音处理系统，其特征在于，包括：

3.根据权利要求1所述的分布式语音处理系统，其特征在于，所述通信模块还配置为将所述第一语音识别结果发送到所述网络中的一个或多个节点设备。

5.根据权利要求1所述的分布式语音处理系统，其特征在于，所述第一声音预处理结果和所述一个或多个第二声音预处理结果的每个包括声音特征值、声音质...

【专利技术属性】
技术研发人员：毛建鑫，
申请(专利权)人：乐鑫信息科技上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人