一种语音识别方法、系统及终端设备技术方案

技术编号:16400136 阅读:33 留言:0更新日期:2017-10-17 20:11
本发明专利技术适用于通讯技术领域,提供了一种语音识别方法、系统及其终端设备,所述语音识别方法包括:接收用户输入的语音信息;将所述语音信息存储到具有不同存储编号的存储模块;读取消费者指针当前指向的存储编号n的存储模块存储的语音信息,在检测到所述存储编号n的存储模块存储的语音信息中包含预先设置的唤醒词后,从存储编号为n+1的存储模块处开始依次读取并识别所述语音信息。这一过程中由于预先将语音信息进行了存储,因此,即使用户在语音识别应用未启动时输入语音命令,智能终端也可以从存储模块中读取到用户输入的语音信息,保证了用户可以连续输入语音信息,智能终端又能完整的识别出所述语音命令,提高用户体验。

Speech recognition method, system and terminal equipment

The invention is applicable to the technical field of communication, a speech recognition method, system and terminal equipment is provided, including the speech recognition method: voice information input by the user is received; the voice information stored in the storage module with different storage number; voice information storage module reads the consumer stored numbers currently pointing to the pointer n the voice information is detected, the storage module stores the number n contains a preset wake-up word, from the storage number is stored at the n+1 module are read and identify the voice information. This process with pre voice information are stored, therefore, even if the user input voice commands in the application of speech recognition has not started, the intelligent terminal can be read into the voice information of user input from the storage module, the user can continuously input voice information, intelligent terminal can complete identification of the voice commands, improve the user experience.

【技术实现步骤摘要】
一种语音识别方法、系统及终端设备
本专利技术属于通讯
,尤其涉及一种语音识别方法、系统及其终端设备。
技术介绍
随着通讯技术的发展,各种智能终端悄然走进千家万户。现有技术中的各种智能终端大多支持语音唤醒功能以及语音控制技术。然而当前智能终端在接收用户输入的语音控制信息时,一般需要首先进行语音唤醒,接收到语音唤醒的反馈后(如指示灯点亮)再进行语音控制信息的输入,这一过程中用户收到反馈和再次进行语音输入之间有一个明显的停顿时间;若用户将语音唤醒信息和语音控制信息连续输入,智能终端在进行语音识别时往往会产生丢字现象,从而使得用户的语音控制信息无法被正确识别,例如对于目前支持语音唤醒和语音控制的亚马逊Echo音箱,若用户连续输入语音唤醒信息,Alexa,和语音控制信息,Playmusic,如:“Alexa,Playmusic”,Echo音箱识别出的语音控制信息可能仅有“music”一个词的信息,这种识别结果给用户带来了不友好的体验。故,鉴于现有技术的不足,提出一种语音识别方法。
技术实现思路
本专利技术实施例提供了一种语音识别方法、系统及终端设备,以解决现有技术中用户在进行语音唤醒信息和语音命令连续输入时,智能终端无法完整识别出语音控制信息的问题。本专利技术实施例的第一方面提供了一种语音识别方法,所述语音识别方法包括:接收用户输入的语音信息;将所述语音信息存储到具有不同存储编号的存储模块;读取消费者指针当前指向的存储编号n的存储模块存储的语音信息,检测所述存储编号n的存储模块存储的语音信息中是否包含预先设置的唤醒词;所述唤醒词用于唤醒语音识别功能;在检测到所述存储编号n的存储模块存储的语音信息中包含预先设置的唤醒词后,从存储编号为n+1的存储模块处开始依次读取并识别所述语音信息。本专利技术实施例的第二方面提供了一种语音识别系统,所述语音识别系统包括:接收单元,用于接收用户输入的语音信息;存储单元,用于将所述语音信息存储到具有不同存储编号的存储模块;读取单元,用于读取消费者指针当前指向的存储编号n的存储模块存储的语音信息,检测所述存储编号n的存储模块存储的语音信息中是否包含预先设置的唤醒词;所述唤醒词用于唤醒语音识别功能;识别单元,用于在检测到所述存储编号n的存储模块存储的语音信息中包含预先设置的唤醒词后,从存储编号为n+1的存储模块处开始依次读取并识别所述语音信息。本专利技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如所述一种语音识别方法中任一项所述方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述一种语音识别方法中任一项所述方法的步骤。本专利技术实施例中对接收到的语音信息,首先进行环形存储,然后根据消费者指针的指向读取存储模块中的语音信息,在检测到当前存储模块中包含预先设置的唤醒词时,唤醒语音识别功能,由语音识别应用从当前存储模块的下一个存储模块开始读取并识别用户输入的语音信息。这一过程中由于预先将语音信息进行了存储,因此,即使用户在语音识别应用未启动时输入语音命令,智能终端也可以从存储模块中读取到用户输入的语音信息,保证了用户可以连续输入语音信息,智能终端又能完整的识别出所述语音命令,提高用户体验。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的一种语音识别方法的实现流程示意图;图2是本专利技术实施例一提供的以时间轴形式示出了现有技术智能终端接收并识别语音信息的过程;图3是本专利技术实施例一提供的智能终端存储及读取语音信息的示意图;图4是本专利技术实施例二提供的一种语音识别系统的框图;图5是本专利技术实施例三提供的一种终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。实施例一图1为本专利技术实施例一提供的语音识别方法的实现流程图,如图1所示:步骤S11,接收用户输入的语音信息;步骤S12,将所述语音信息存储到具有不同存储编号的存储模块;本专利技术实施例中为了避免用户输入语音信息不能被智能终端的语音识别应用完整识别的情况,在语音唤醒应用开始接收用户输入的语音信息后将接收到的语音信息进行环形存储。具体地,智能终端根据所接收到的语音信息的长度,将所述语音信息分别存储在具有不同存储编号的存储模块中,可选地,所述不同存储编号的存储模块对应的区域为环形存储区域;所述语音信息包括唤醒词和语音命令;所述唤醒词用于唤醒智能终端的语音识别功能;所述语音命令包括用户输入的待智能终端执行的指令,如放音乐,增大音量等。图2以时间轴的形式示出了现有技术智能终端接收并识别用户输入的语音信息的过程,如图:以亚马逊Echo音箱为例,假设在t1时间点Echo音箱开启语音唤醒进行录音,用户在t1~t2时间内说出了唤醒词“Alexa”,并在时间点t2时系统检测到唤醒词,系统被唤醒。然后语音唤醒应用通知语音识别应用系统被唤醒,准备开始录入用户后续的语音命令(即语音控制信息),用户在t3-t4才可进行语音命令“Playmusic”的输入。而本专利技术实施中由于智能终端会将用户输入的语音信息都进行存储,用户从t1时刻便可连续的输入唤醒词和语音命令“Alexa,Playmusic”,此时,即使在t2-t3时间段内Echo音箱未对用户输入的语音信息进行录音,在语音识别应用启动后也可从预先存储的语音信息中读取t2-t3时间段内用户输入的语音内容,进而做到完整的识别用户输入的语音信息。可选地,在所述将所述语音信息存储到具有不同存储编号的存储模块之前,包括:预先将环形存储区域分隔为N个存储模块,标记每个存储模块的存储编号。本专利技术实施例中,首先将环形存储区域进行分块,并对分块后的每个存储模块进行编号,在存储语音信息时使得语音信息被一块一块的存储在不同存储编号的存储模块中;对存储模块进行编号方便存储和读取任一存储模块的语音信息的数据。在对环形的存储区域进行分块时,根据智能终端内存的大小,接收的语音信息所占空间的大小等设置每个存储模块的存储空间的大小以及存储模块的个数。如图3所示:假设智能终端进行语音录入时采用16k采样率,单声道采样,位深为16bit,则智能终端每秒的采样数据是32k个字节,由于语音录音应用从底层读取语音信息数据时有最小读取缓存的限制(具体值和具体硬件平台有关,假设是1280字节),那么可以设计每块存储模块的数据为40ms的语音信息。对每个存储模块进行编号时可以用如图3中类似于1,2,…,128这样的存储编号表示每一个存储模块。本文档来自技高网...
一种语音识别方法、系统及终端设备

【技术保护点】
一种语音识别方法,其特征在于,所述语音识别方法包括:接收用户输入的语音信息;将所述语音信息存储到具有不同存储编号的存储模块;读取消费者指针当前指向的存储编号n的存储模块存储的语音信息,检测所述存储编号n的存储模块存储的语音信息中是否包含预先设置的唤醒词;所述唤醒词用于唤醒语音识别功能;在检测到所述存储编号n的存储模块存储的语音信息中包含预先设置的唤醒词后,从存储编号为n+1的存储模块处开始依次读取并识别所述语音信息。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括:接收用户输入的语音信息;将所述语音信息存储到具有不同存储编号的存储模块;读取消费者指针当前指向的存储编号n的存储模块存储的语音信息,检测所述存储编号n的存储模块存储的语音信息中是否包含预先设置的唤醒词;所述唤醒词用于唤醒语音识别功能;在检测到所述存储编号n的存储模块存储的语音信息中包含预先设置的唤醒词后,从存储编号为n+1的存储模块处开始依次读取并识别所述语音信息。2.如权利要求1所述的语音识别方法,其特征在于,在所述将所述语音信息存储到具有不同存储编号的存储模块之前,包括:预先将环形存储区域分隔为N个存储模块,标记每个存储模块的存储编号。3.如权利要求1所述的语音识别方法,其特征在于,所述将所述语音信息存储到具有不同存储编号的存储模块,具体包括:调用生产者指针当前指向的存储模块的存储编号;所述生产者指针用于指向即将存储语音信息的存储模块的位置;根据所述存储模块的存储空间的大小,从所述生产者指针当前指向的存储模块的存储编号开始依次存储所述语音信息到不同存储编号的存储模块。4.如权利要求1或3所述的语音识别方法,其特征在于,在所述将所述语音信息存储到具有不同存储编号的存储模块之后,包括:记录所述语音信息所存储到的最后一个存储模块的存储编号m;调整生产者指针的指向到存储编号为m+1的存储模块。5.如权利要求1所述的语音识别方法,其特征在于,在所述从存储编号为n+1的存储模块处开始依次读取并识别所述语音信息之后,包括:根据识别出的语音信息,执行所述语音信息所包含指令;执行结束后根据消费者指针指向...

【专利技术属性】
技术研发人员:祁学文吴海全王如军张恩勤师瑞文曹磊
申请(专利权)人:深圳市冠旭电子股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1