当前位置: 首页 > 专利查询>佛山智优人科技有限公司华南智能机器人创新研究院广东省科学院智能制造研究所专利>正文

一种搬运机器人的语音控制方法及系统技术方案

技术编号：37769798 阅读：11 留言：0更新日期：2023-06-06 13:33

本发明专利技术公开了一种搬运机器人的语音控制方法及系统，其中，所述方法包括：基于设置在搬运机器人上的麦克风设备进行控制语音采集处理，获得控制语音信息；对所述控制语音信息进行语音增强处理，获得增强控制语音信息；对所述增强控制语音信息进行语音识别处理，获得语音识别结果；基于所述语音识别结果生成所述搬运机器人的控制指令，并将所述控制指令发送至语音控制模块中；所述语音控制模块基于接收到的控制指令对所述搬运机器人进行控制处理。在本发明专利技术实施例中，解决了在设计移动机器人语音控制系统时过滤噪声能力弱的问题，特别是应对散漫噪声。散漫噪声。散漫噪声。

全部详细技术资料下载

【技术实现步骤摘要】
一种搬运机器人的语音控制方法及系统

[0001]本专利技术涉及机器人语音控制
，尤其涉及一种搬运机器人的语音控制方法及系统。

技术介绍

[0002]移动机器人语音控制系统分为硬件部分和软件部分，其中移动机器人语音控制系统硬件部分分为主控端、麦克风阵列、扩展模块、激光雷达以及驱动模块。移动机器人语音控制系统软件部分分为四个部分：语音采集模块设计，语音识别模块设计、语音控制模块设计以及语音增强模块设计。语音控制系统采用前端的麦克风阵列完成对语音的采集；在语音识别方面，随着语音识别率和稳定性的提升，多种和智能语音相关的软件开发工具包(SDK)逐渐走向成熟，达到了产品化水平。个人开发者只需选择合适且稳定的语言识别SDK，无需重新训练语言模型；在语音控制程序设计方面，是先通过语音识别将识别的文本以信息的形式发布，后将重要动作参数进行设定。当接受到指令语音后，控制程序生成与之对应的命令词，根据命令词执行语音控制策略；
[0003]目前，面向移动机器人语音增强算法主要采用的方法包括：基于数字信号处理的方法和基于机器学习的方法。数字信号单通道增强的典型方法有维纳滤波、谱减法和基于统计模型的方法，多通道增强方法有固定波束形成和自适应波束形成两种。机器学习的方法有基于HMM模型、基于非负矩阵分解、基于浅层和深层神经网络等。为了满足移动机器人语音控制系统所需的稳定、可靠、低噪声需求，本专利技术采用建立在改进GSC算法上的语音增强技术。
[0004]GSC(Generalized Sidelobe Canceller)...

【技术保护点】

【技术特征摘要】
1.一种搬运机器人的语音控制方法，其特征在于，所述方法包括：基于设置在搬运机器人上的麦克风设备进行控制语音采集处理，获得控制语音信息；对所述控制语音信息进行语音增强处理，获得增强控制语音信息；对所述增强控制语音信息进行语音识别处理，获得语音识别结果；基于所述语音识别结果生成所述搬运机器人的控制指令，并将所述控制指令发送至语音控制模块中；所述语音控制模块基于接收到的控制指令对所述搬运机器人进行控制处理。2.根据权利要求1所述的语音控制方法，其特征在于，所述麦克风设备为Seeed Respeaker线性四麦克风阵列；并将所述Seeed Respeaker线性四麦克风阵列中的多个麦克风单元按照线性排列的方式设置在所述搬运机器人上；其中所述线性排列的排列距离为预设距离。3.根据权利要求1所述的语音控制方法，其特征在于，所述对所述控制语音信息进行语音增强处理，获得增强控制语音信息，包括：基于广义旁瓣抵消算法对所述控制语音信息进行语音增强处理，获得增强控制语音信息。4.根据权利要求3所述的语音控制方法，其特征在于，所述基于广义旁瓣抵消算法对所述控制语音信息进行语音增强处理，包括：对所述控制语音信息进行端点检测及分帧处理，获得语音分帧结果；基于所述语音分帧结果进行所述控制语音信息入射角设定，获得设定入射角；计算所述设定入射角的延迟时间，获得所述延迟时间后的控制语音信息，并输入广义旁瓣抵消器中进行短时能量值计算处理，获得短时能量值；在重复预设次数的短时能量值计算处理后，选取同组中短时能量值最大的所对应的设定入射角进行精确化处理，获得精确化处理后的入射角；基于所述广义旁瓣抵消算法利用精确化处理后的入射角对所述控制语音信息进行语音增强处理。5.根据权利要求4所述的语音控制方法，其特征在于，所述基于所述语音分帧结果进行所述控制语音信息入射角设定，包括：所述麦克风设备为线性四麦克风阵列，在声源与所述麦克风设备之间达到预设距离后，所述控制语音信息在空间中将以平行声波的形式存在；设所述平行声波的入射角为延时数据为δ，则有：延时数据为δ，则有：其中，c表示声音在空间中传播的速度，取值为340m/s，N为任意取值，且取值越大，入射角越精准；当麦克风设备中的麦克风数目为M时，以1号麦克风的位置为起点，对该通道的控制语音信息进行端点检测后截取语音段x
i
(n)对应第i个麦克风截取的控制语音信息，则有：
经过延...

【专利技术属性】
技术研发人员：曹帅，钱谦，文桂林，曹永军，黄伟溪，梁佳楠，李文威，
申请(专利权)人：佛山智优人科技有限公司华南智能机器人创新研究院广东省科学院智能制造研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人