本发明专利技术公开了基于变电站巡检机器人的语音交互控制方法,利用设置在巡检机器人上的语音传感器采集语音信号,巡检机器人的语音识别系统对采集到的语音信号进行端点检测等预处理、特征提取,然后通过识别引擎判定语音内容是否为合法语音指令,若经过语音识别后的语音指令合法并识别为提问指令时,从应答指令文件中搜索出与所述提问指令对应的应答指令,然后巡检机器人以语音播报的形式应答;否则,向巡检机器人发生相应控制信号完成指定操作。本发明专利技术着眼于变电站巡检机器人语音交互控制的功能需求,以语音识别和语音合成的应用开发为手段,实现了可靠快捷的机器人语音控制与交互会话,在电力行业具有广阔的应用前景。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了,利用设置在巡检机器人上的语音传感器采集语音信号,巡检机器人的语音识别系统对采集到的语音信号进行端点检测等预处理、特征提取,然后通过识别引擎判定语音内容是否为合法语音指令,若经过语音识别后的语音指令合法并识别为提问指令时,从应答指令文件中搜索出与所述提问指令对应的应答指令,然后巡检机器人以语音播报的形式应答;否则,向巡检机器人发生相应控制信号完成指定操作。本专利技术着眼于变电站巡检机器人语音交互控制的功能需求,以语音识别和语音合成的应用开发为手段,实现了可靠快捷的机器人语音控制与交互会话,在电力行业具有广阔的应用前景。【专利说明】
本专利技术涉及。
技术介绍
长期以来,我国电力行业变电站设备多采用人工巡检作业方式。在高压、超高压以 及雷雨等恶劣气象条件下,人工巡检存在较大安全风险,并且检测到的数据也无法准确、及 时地接入管理信息系统,对电网安全运行带来一定隐患。 变电站巡检机器人能够全天候全方位对变电站设备进行无人值守巡检,从而代替 繁重的变电站设备人工巡检,提高了变电站巡检的自动化、智能化水平。在运行方式上,巡 检机器人能够按照预设的指令集自主完成整套巡检流程,也可以在操作人员的指令控制下 完成指定操作,操作指令通常以点击按钮或菜单的方式下达。 目前,变电站巡检机器人已经在国内多地推广应用。现场应用对机器人的控制方 式提出了新的要求,希望能够以语音命令控制机器人,并且实现与巡检机器人的交互对话。
技术实现思路
为解决现有技术存在的不足,本专利技术公开了基于变电站巡检机器人的语音交互控 制方法,该控制方法以语音识别和语音合成的应用开发为手段,利于实现可靠快捷的机器 人语音控制与交互会话。 为实现上述目的,本专利技术的具体方案如下: ,包括以下步骤: 步骤一:利用设置在巡检机器人上的语音传感器采集语音信号,语音传感器与巡 检机器人自带的音频采集卡进行连接,音频采集卡将获取的语音信号作为语音识别输入源 送入巡检机器人的控制系统; 步骤二:巡检机器人的语音识别系统对采集到的语音信号进行端点检测预处理、 特征提取,然后通过识别引擎判定语音内容是否为合法语音指令,合法语音指令包括提问 指令和控制指令两类;若为合法语音指令,进一步判断语音指令的类型,若经过语音识别后 的语音指令合法并识别为提问指令时,转向步骤三,否则,转向步骤四; 步骤三:从应答指令文件中搜索出与所述提问指令对应的应答指令,然后巡检机 器人以语音播报的形式应答; 步骤四:若经过语音识别后的语音指令合法并识别为控制指令时,向巡检机器人 发生相应控制信号完成指定操作。 所述步骤一中,巡检机器人的控制系统检测音频采集卡获取的语音信号,若语音 信号强度及持续时间达到设定阈值则表明有有效语音输入,开始进行语音识别。 所述步骤二中语音识别判定语音输入的内容,识别结果采用指令文本的形式进行 输出。 所述步骤二中提问指令和控制指令逐条存储于同一交互指令文件中,提问指令在 前、控制指令在后,每条提问指令设置有对应的应答指令,所有应答指令逐条存储于应答指 令文件中,在初始化过程中,识别引擎能够识别出交互指令文件和应答指令文件的位置,并 能读取交互指令文件和应答指令文件中各指令的内容。 所述步骤二中对语音内容进行分析识别,若判定语音内容为交互指令文件中的某 一条提问指令或控制命令,则认为成功获得识别结果。 所述步骤二中的提问指令和控制指令的识别之前编写语法规则文件,其中在语法 规则文件定义需要识别的字和短语,SDK语音识别引擎加载该语法规则来识别用户的语音。 所述步骤三中,巡检机器人以语音播报的形式应答,机器人应答形式为预先录制 好的语音,或者先通过语音合成实现文本到语音的转换、再实现语音输出。 所述编写语法规则文件,SAPI的语法规则采用XML格式,在语音识别时对每条指 令的判断是采用整体比对或者分段比对的方式。 本专利技术的有益效果: 1、本专利技术利用语音识别技术正确识别操作人员发出的语音指令,再根据识别结果 判断语音指令的类型,通过设置提问指令和控制指令实现对机器人的交互式控制,保证巡 检机器人在识别到有效语音对话和语音操作指令后,能根据识别结果及时做出应答或完成 指定操作。 2、本专利技术根据应用需求设计了完整的语音交互开发流程;在此基础上基于微软语 音应用程序接口 SAPI,完成了一套人机语音交互控制系统。现场测试结果表明,系统的各项 性能指标满足设计要求。 3、本专利技术着眼于变电站巡检机器人语音交互控制的功能需求,以语音识别和语音 合成的应用开发为手段,实现了可靠快捷的机器人语音控制与交互会话,在电力行业具有 广阔的应用前景。 【专利附图】【附图说明】 图1为本专利技术中的结构框图; 图2为本专利技术中的处理流程图; 图3为微软SAPI的开发架构示意图。 【具体实施方式】: 下面结合附图对本专利技术进行详细说明: 结合图1至图3所示,,包括如下步 骤: a、语音采集 将语音传感器与巡检机器人自带的音频采集卡进行连接,利用巡检机器人自带的 语音传感器采集语音信号,并将音频采集卡获取的语音信号作为语音识别输入源;在语音 采集过程中,检测音频采集卡获取的语音信号,若语音信号强度及持续时间达到一定阈值 表明有有效语音输入,开始进行语音识别; b、语音识别,通过识别引擎获取语音内容,然后通过搜索指令文件判定其是否为 合法指令;对合法指令进一步判定其类型。 通过对采集到的语音信号进行分析处理、特征提取比对识别出语音内容,然后通 过识别引擎判定语音内容是否为合法语音指令,若为合法语音指令,进一步判断语音指令 的类型,进而控制巡检机器人做出响应,合法语音指令包括提问指令和控制指令两类,提问 指令包括"你叫什么名字"、"你会做什么"等指令,控制指令包括"开始充电"、"停止充电"、 "开启超声"等指令;语音识别判定语音输入的内容,识别结果采用指令文本的形式进行输 出; 上述提问指令和控制指令逐条存储于同一交互指令文件中,提问指令在前、控制 指令在后,每条提问指令设置有对应的应答指令,所有应答指令逐条存储于应答指令文件 中,在初始化过程中,识别引擎能够识别出交互指令文件和应答指令文件的位置,并能读取 交互指令文件和应答指令文件中各指令的内容;对语音内容进行分析识别时,若判定语音 内容为交互指令文件中的某一条提问指令或控制命令,则认为成功获得识别结果; c、对话应答 若经过语音识别后的语音指令合法并识别为提问指令时,从应答指令文件中搜 索出与所述提问指令对应的应答指令,然后巡检机器人以语音播报的形式应答;机器人应 答形式为预先录制好的语音,或者先通过语音合成实现文本到语音的转换、再实现语音输 出; d、执行操作 若经过语音识别后的语音指令合法并识别为控制指令时,向巡检机器人发生相应 控制信号完成指定操作。 在语音交互控制方法中,语音识别和用于对话应答的语音合成是实现巡检机器人 语音交互控制的关键。结合系统需求和语音技术发展状况,本专利技术基于现有语音开发包的 方式实现了整个语音交互控制系统。 语音识别技术就本文档来自技高网...
【技术保护点】
基于变电站巡检机器人的语音交互控制方法,其特征是,包括以下步骤:步骤一:利用设置在巡检机器人上的语音传感器采集语音信号,语音传感器与巡检机器人自带的音频采集卡进行连接,音频采集卡将获取的语音信号作为语音识别输入源送入巡检机器人的控制系统;步骤二:巡检机器人的语音识别系统对采集到的语音信号进行端点检测预处理、特征提取,然后通过识别引擎判定语音内容是否为合法语音指令,合法语音指令包括提问指令和控制指令两类;若为合法语音指令,进一步判断语音指令的类型,若经过语音识别后的语音指令合法并识别为提问指令时,转向步骤三,否则,转向步骤四;步骤三:从应答指令文件中搜索出与所述提问指令对应的应答指令,然后巡检机器人以语音播报的形式应答;步骤四:若经过语音识别后的语音指令合法并识别为控制指令时,向巡检机器人发生相应控制信号完成指定操作。
【技术特征摘要】
【专利技术属性】
技术研发人员:陕华平,李红玉,杨国庆,傅崇光,韩磊,
申请(专利权)人:国家电网公司,国家电网公司运行分公司,山东鲁能智能技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。