【技术实现步骤摘要】
语音识别方法、装置及系统
本申请实施例涉及音频处理
,尤其涉及一种语音识别方法、装置及系统。
技术介绍
语音识别技术,也被称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。相关技术中,对所有用户使用相同的语音识别引擎识别语音内容。但是,由于不同区域的用户在口音上相差较大,因此,这种方式中语音识别的准确性较低。
技术实现思路
为克服相关技术中存在的问题,本申请实施例提供了一种语音识别方法、装置及系统,以提高语音识别的准确性。根据本申请实施例的第一方面,提供一种语音识别方法,所述方法包括:根据待识别的目标语音信号对应的目标区域标识,确定与所述目标区域标识对应的目标语音识别引擎;利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果。根据本申请实施例的第二方面,提供一种语音识别装置,所述装置包括:区域确定模块,用于根据待识别的目标语音信号对应的区域标识,确定目标用户所属的目标区域,所述目标用户为说出所述目标语音信号的用户;内容识别模块,用于利用与所述目标区域对应的目标语音识别引擎,识别所述目标语音信号的内容。根据本申请实施例的第三方面,提供一种语音识别系统,包括麦克风、显示器和处理器:所述麦克风,用于采集语音,并将所述语音转换为语音信号发送给所述处理器;所述处理器,用于根据待识别的目标语音信 ...
【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n根据待识别的目标语音信号对应的目标区域标识,确定与所述目标区域标识对应的目标语音识别引擎;/n利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果。/n
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
根据待识别的目标语音信号对应的目标区域标识,确定与所述目标区域标识对应的目标语音识别引擎;
利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果。
2.根据权利要求1所述的方法,其特征在于,所述目标区域标识的获取方式包括:
根据所述目标语音信号的语音特征信息,确定所述目标区域标识;或,
从所述目标用户的输入信息中获取所述目标区域标识;或,
从接收所述目标语音信号的目标终端本地的存储信息中,获取所述目标区域标识;或,
根据接收所述目标语音信号的目标终端的定位信息,获取所述目标区域标识;或,
根据接收所述目标语音信号的目标终端的号码归属地,获取所述目标区域标识。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标语音信号的语音特征信息,确定所述目标区域标识,包括:
将所述目标语音信号的语音特征信息输入至已训练的区域信息识别模型,以由所述区域信息识别模型依据输入的语音特征信息识别出目标区域标识,所述目标区域标识用于指示说出所述目标语音信号的目标用户所属的区域;
所述确定与所述目标区域标识对应的目标语音识别引擎,包括:
从已训练的各区域的语音识别引擎中选择与所述目标区域标识对应的目标语音识别引擎;
所述利用目标语音识别引擎,对所述目标语音信号进行识别,得到识别结果,包括:
将所述目标语音音频输入至所述目标语音识别引擎,以由所述目标语音识别引擎对输入的目标语音信号进行语音识别,得到识别结果。
4.根据权利要求2所述的方法,其特征在于,所述语音特征信息通过以下步骤确定:
按照设定帧长m,设定帧移n对所述目标语音信号进行分帧,得到至少一个第一音频帧;
按照预设的窗函数对每一第一音频帧进行加窗操作,得到第二音频帧;
对每一第二音频帧进行预加重操作,得到第三音频帧,所述预加重操作用于增加第二音频帧的高频特征的权重;
从各第三音频帧中提取所述目标语音信号的语音特征信息。
5.根据权利要求4所述的方法,其特征在于,所述从各第三音频帧中提取所述目标语音信号的语音特征信息,包括:
对每一第三音频帧进行快速傅里叶变换,得到第一频谱;
对每一第一频谱进行三角滤波,得到第二频谱;
根据预设的梅尔倒谱系数MFCC与频谱的对应关系,确定各第二频谱对应的MFCC;
将确定的各MFCC确定为所述语音特征信息。...
【专利技术属性】
技术研发人员:董勤波,周洪伟,陈展,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。