一种基于语音识别的控制方法及装置制造方法及图纸

技术编号:29407500 阅读:30 留言:0更新日期:2021-07-23 22:47
本申请实施例公开了一种基于语音识别的控制方法及装置,所述方法包括:获取对话语音信息;对所述对话语音信息进行语音识别,获得不同用户的语音信息;对所述不同用户的语音信息进行语义分析,获得文字信息;提取所述文字信息中的关键词;在关键词指令库中对所述关键词进行匹配,根据匹配结果确定所述关键词对应的控制指令信息;基于所述控制指令信息对设备进行控制。采用说明书实施例的方法,可以在用户在谈话时智能调取会谈内容中的控制指令,用于对智能设备进行控制,提高用户操作的便利性。

【技术实现步骤摘要】
一种基于语音识别的控制方法及装置
本申请涉及语音识别与控制
,尤其涉及一种基于语音识别的控制方法及装置。
技术介绍
近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。目前的语音识别,主要将双方交谈内容完整记录下来,还无法对实时谈话中的指令进行实时响应。
技术实现思路
有鉴于此,本申请实施例提供了一种基于语音识别的控制方法及装置,可以在用户在谈话时智能调取会谈内容中的控制指令,用于对智能设备进行控制。为解决上述技术问题,本申请实施例是这样实现的:本申请实施例提供的一种基于语音识别的控制方法,所述方法包括:获取对话语音信息;对所述对话语音信息进行语音识别,获得不同用户的语音信息;对所述不同用户的语音信息进行语义分析,获得文字信息;提取所述文字信息中的关键词;在关键词指令库中对所述关键词进行匹配,根据匹配结果确定所述关键词对应的控制指令信息;基于所述控制指令信息对设备进行控制。可选的,所述对话语音信息为拾音设备发送的对话语音信息。可选的,所述对所述对话语音信息进行语音识别,获得不同用户的语音信息,具体包括:采用声纹识别对所述对话语音信息进行语音识别,获得不同用户的语音信息。可选的,在对所述不同用户的语音信息进行语义分析,获得文字信息之前,所述方法还包括:对所述语音信息进行语种识别;根据语种识别结果调取对应的语义分析策略;对所述不同用户的语音信息进行语义分析,获得文字信息,具体包括:利用所述语义分析策略对所述不同用户的语音信息进行语义分析,获得文字信息。可选的,在对所述不同用户的语音信息进行语义分析,获得文字信息之后,提取所述文字信息中的关键词之前,还包括:获取所述文字信息的预设长度的起始字符串;根据所述起始字符串判断所述文字信息是否用于触发控制指令;提取所述文字信息中的关键词,具体包括:若所述文字信息用于触发控制指令,提取所述文字信息中的关键词。可选的,所述控制指令信息用于调取信号源、监控、程序或文件。可选的,所述基于所述控制指令信息对设备进行控制后,所述方法还包括:当在预设时间内没有语音输入时,关闭基于控制指令信息控制设备的功能,当有语音输入时,自动唤醒基于控制指令信息控制设备的功能。可选的,在关键词指令库中对所述关键词进行匹配,具体包括:从关键词指令库中检索所述关键词对应的大屏幕显示场景,所述关键词指令库中存储关键词与大屏幕显示场景之间的映射关系。可选的,所述确定所述关键词对应的控制指令信息后,所述基于所述控制指令信息对设备进行控制前,所述方法还包括:当所述控制指令信息为多个时,若在预设时间段内,存在相互矛盾或者完全反向的控制指令时,丢弃相互矛盾的控制指令信息。可选的,所述控制指令信息为多个,所述基于所述控制指令信息对设备进行控制,具体包括:按照执行逻辑顺序将多个所述控制指令信息进行组合;将组合后的所述多个所述控制指令信息转化为机器控制命令;将所述机器控制命令发送至相应设备。本申请实施例提供的一种基于语音识别的控制装置,其特征在于,所述设备包括:语音获取模块,用于获取对话语音信息;语音识别模块,用于对所述对话语音信息进行语音识别,获得不同用户的语音信息;语义分析模块,用于对所述不同用户的语音信息进行语义分析,获得文字信息;关键词提取模块,用于提取所述文字信息中的关键词;关键词匹配模块,用于在关键词指令库中对所述关键词进行匹配,根据匹配结果确定所述关键词对应的控制指令信息;设备控制模块,用于基于所述控制指令信息对设备进行控制。本申请实施例提供的一种存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述的基于语音识别的控制方法。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请实施例提供的方法自动获取对话语音信息,提取出其中的关键词,并根据关键词确定控制指令信息,使得用户通过说话方式即可对各种指定设备进行操作。由此可见,本申请提供的方法可以在用户实时谈话过程中响应对话语音信息进行指定设备控制。本方法可以在用户对话时自然实时操作指定设备或程序,无需唤醒,支持直接调取信号源、监控、程序或文件。本方法对所述对话语音信息进行语音识别,获得不同用户的语音信息,因此可以支持多人在实时对话中发布控制指令。另外,本方法还对语音信息的语种进行识别,然后再进行语义分析,因此可以支持多语言调取信号源、监控、程序或文件。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分,本领域技术人员应该理解的是,这些附图未必是按比例绘制的,在附图中:图1为本申请实施例提供的一种基于语音识别的控制方法的流程示意图;图2为本申请实施例提供的对应于图1的一种基于语音识别的控制装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。对于一些智能控制设备,比如计算机、大屏幕等,往往需要单独进行控制才可以,比如采用鼠标或者遥控器等。对于在进行会议的过程中,如果能在聊天的模式中自动的控制智能设备,能够大大的提高用户的便利性。本方案就提供了一种可以通过采集对话语音信息从而自动对智能设备进行控制的方法,对话时,通过不同拾音设备或者声纹识别,将多个正在说话的用户语音区分开,并将语音信息采集后传送到语义分析模块进行解析,语义分析模块将根据语音特点自动翻译成对应语言的文字,并将文字发送到关键词提取模块中。关键词通过和预设的相应语言的预设关键词指令库进行搜索并匹配,并将匹配成功的一系列指令发送到设备控制模块。其中,智能设备可以是显示器,显示屏等,显示器或者显示屏可以有多个。以下结合附图,详细说明本申请各实施例提供的技术方案。图1为本申请实施例提供的一种基于语音识别的控制方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。如图1所示,该流程可以包括以下步骤:步骤102:获取对话语音信息。在该步骤中,获取对话语音信息可以是实时获取的。对于采集对话语音信息的设本文档来自技高网
...

【技术保护点】
1.一种基于语音识别的控制方法,其特征在于,所述方法包括:/n获取对话语音信息;/n对所述对话语音信息进行语音识别,获得不同用户的语音信息;/n对所述不同用户的语音信息进行语义分析,获得文字信息;/n提取所述文字信息中的关键词;/n在关键词指令库中对所述关键词进行匹配,根据匹配结果确定所述关键词对应的控制指令信息;/n基于所述控制指令信息对设备进行控制。/n

【技术特征摘要】
1.一种基于语音识别的控制方法,其特征在于,所述方法包括:
获取对话语音信息;
对所述对话语音信息进行语音识别,获得不同用户的语音信息;
对所述不同用户的语音信息进行语义分析,获得文字信息;
提取所述文字信息中的关键词;
在关键词指令库中对所述关键词进行匹配,根据匹配结果确定所述关键词对应的控制指令信息;
基于所述控制指令信息对设备进行控制。


2.如权利要求1所述的方法,其特征在于,所述对话语音信息为拾音设备发送的对话语音信息。


3.如权利要求1所述的方法,其特征在于,所述对所述对话语音信息进行语音识别,获得不同用户的语音信息,具体包括:
采用声纹识别对所述对话语音信息进行语音识别,获得不同用户的语音信息。


4.如权利要求1所述的方法,其特征在于,在对所述不同用户的语音信息进行语义分析,获得文字信息之前,所述方法还包括:
对所述语音信息进行语种识别;
根据语种识别结果调取对应的语义分析策略;
对所述不同用户的语音信息进行语义分析,获得文字信息,具体包括:
利用所述语义分析策略对所述不同用户的语音信息进行语义分析,获得文字信息。


5.如权利要求1所述的方法,其特征在于,在对所述不同用户的语音信息进行语义分析,获得文字信息之后,提取所述文字信息中的关键词之前,还包括:
获取所述文字信息的预设长度的起始字符串;
根据所述起始字符串判断所述文字信息是否用于触发控制指令;
提取所述文字信息中的关键词,具体包括:
若所述文字信息用于触发控制指令,提取所述文字信息...

【专利技术属性】
技术研发人员:党战雄陈禹衡
申请(专利权)人:中天智领北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1