本发明专利技术公开了一种语音信息的处理方法及装置。方法包括:当检测到语音输入触发操作时,控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态;通过录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息;在第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据。通过本发明专利技术的技术方案,通过在该第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据,能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息,以在补齐各录音过程中的语音信息的同时,使得各录音过程中的录音时间点实现对齐。
【技术实现步骤摘要】
本专利技术涉及终端
,特别涉及一种语音信息的处理方法及装置。
技术介绍
目前,在使用语音输入法进行语音识别时,都是在录音按键被按下时,才开始录音的,然后将录制的语音识别为文字后进行输出,而相关技术中的录音方案对应两个线程,一个录音线程和一个识别线程,具体的录音过程如下:当录音按键被按下后,启动语音输入法对应的录音线程和识别线程,而录音线程负责启动终端录音,以录制输入的语音信息,识别线程负责从录音线程处取语音信息,并发送给服务器识别,待识别完毕后,从服务器中获取识别的文字并输出,但由于录音线程启动终端录音时需要一定的时间,因而,相关技术中的录音方案可能会导致录音延迟,同时,相关技术中的录音线程并没有缓存所录制的语音信息,所以,如果在某次录音过程中用户按下/抬起录音按键时动作稍微有些延迟或提前,则会导致丢失该录音过程中的部分语音信息。
技术实现思路
本专利技术提供一种语音信息的处理方法及装置,用以当检测到语音输入触发操作时,通过控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态,不仅可以通过该录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息,也可以在用户反复启动录音按键时,不需要反复启动录音线程,进而不需要反复启动终端的录音功能,使得终端在预设语音输入法被启用的过程中一直处于录音状态,以尽可能避免录音线程延迟启动终端录音的问题,尽可能避免了相关技术中的录音延迟问题;另外,通过在该第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据,能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息,以在补齐各录音过程中的语音信息的同时,使得各录音过程中的录音时间点实现对齐。本专利技术提供一种语音信息的处理方法,包括:当检测到语音输入触发操作时,控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态;通过所述录音线程录制在所述预设语音输入法被启用的过程中输入的第一语音信息;在所述第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据。在一个实施例中,所述方法还包括:在所述预设语音输入法被启用的过程中,若接收到针对预设录音按键执行的录音过程开始触发操作,则从所述缓存数据中获取接收到所述录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息,其中,所述第二预设时长小于或等于所述第一预设时长;将所述第一部分语音信息与自接收到所述录音过程开始触发操作起所录制的第二语音信息进行合成,得到目标语音信息,其中,所述第一语音信息包括所述第二语音信息;通过所述终端中的识别线程识别目标语音信息,得到所述目标语音信息对应的文字信息。在一个实施例中,所述方法还包括:在所述预设语音输入法被启用的过程中,若接收到针对预设录音按键执行的录音过程结束触发操作,则判断接收到所述录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端,其中,所述第一语音信息包括所述第三语音信息;当所述第三语音信息对应的文字信息不是所述语句末端时,从所述缓存数据中获取自接收到所述录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息,其中,所述第三预设时长小于或等于所述第一预设时长;将所述第二部分语音信息识别为文字信息。在一个实施例中,所述方法还包括:在所述预设语音输入法被启用的过程中,当再次接收到录音过程开始触发操作时,判断所述录音过程开始触发操作的再次接收时间和与其紧邻的上一个所述录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长,其中,所述目标时长包括所述第三预设时长或所述第二预设时长;当小于所述目标时长时,从所述缓存数据中获取自再次接收到所述录音过程开始触发操作之前的所述时间间隔内录制的第三部分语音信息;将所述第三部分语音信息识别为文字信息。在一个实施例中,所述语音输入触发操作包括:启用所述预设语音输入法。本专利技术还提供一种语音信息的处理装置,包括:控制模块,用于当检测到语音输入触发操作时,控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态;录制模块,用于通过所述录音线程录制在所述预设语音输入法被启用的过程中输入的第一语音信息;缓存模块,用于在所述第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据。在一个实施例中,所述装置还包括:第一获取模块,用于在所述预设语音输入法被启用的过程中,若接收到针对预设录音按键执行的录音过程开始触发操作,则从所述缓存数据中获取接收到所述录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息,其中,所述第二预设时长小于或等于所述第一预设时长;合成模块,用于将所述第一部分语音信息与自接收到所述录音过程开始触发操作起所录制的第二语音信息进行合成,得到目标语音信息,其中,所述第一语音信息包括所述第二语音信息;第一识别模块,用于通过所述终端中的识别线程识别目标语音信息,得到所述目标语音信息对应的文字信息。在一个实施例中,所述装置还包括:第一判断模块,用于在所述预设语音输入法被启用的过程中,若接收到针对预设录音按键执行的录音过程结束触发操作,则判断接收到所述录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端,其中,所述第一语音信息包括所述第三语音信息;第二获取模块,用于当所述第三语音信息对应的文字信息不是所述语句末端时,从所述缓存数据中获取自接收到所述录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息,其中,所述第三预设时长小于或等于所述第一预设时长;第二识别模块,用于将所述第二部分语音信息识别为文字信息。在一个实施例中,所述装置还包括:第二判断模块,用于在所述预设语音输入法被启用的过程中,当再次接收到录音过程开始触发操作时,判断所述录音过程开始触发操作的再次接收时间和与其紧邻的上一个所述录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长,其中,所述目标时长包括所述第三预设时长或所述第二预设时长;第三获取模块,用于当小于所述目标时长时,从所述缓存数据中获取自再次接收到所述录音过程开始触发操作之前的所述时间间隔内录制的第三部分语音信息;第三识别模块,用于将所述第三部分语音信息识别为文字信息。在一个实施例中,所述语音输入触发操作包括:启用所述预设语音输入法。本公开的实施例提供的技术方案可以包括以下有益效果:当检测到语音输入触发操作时,通过控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态,不仅可以通过该录音线程录制在预设语音输入法被启用的过程中输入的第一语音信息,也可以在用户反复启动录音按键时,不需要反复启动录音线程,进而不需要反复启动终端的录音功能,使得终端在该预设过程中一直处于录音状态,以尽可能避免录音线程延迟启动终端录音的问题,尽可能避免了相关技术中的录音延迟问题;同时,通过在该第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据,能够从该缓存数据中获取各录音过程中可能由于该预设录音按键被提前或延迟触发而被丢失的部分语音信息,以在补齐各录音过程中的语音信息的同时,使得各录音过程中的录音时间点实现对齐。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本文档来自技高网...
【技术保护点】
一种语音信息的处理方法,其特征在于,包括:当检测到语音输入触发操作时,控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态;通过所述录音线程录制在所述预设语音输入法被启用的过程中输入的第一语音信息;在所述第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据。
【技术特征摘要】
1.一种语音信息的处理方法,其特征在于,包括:当检测到语音输入触发操作时,控制终端中的录音线程在预设语音输入法被启用的过程中一直保持启动状态;通过所述录音线程录制在所述预设语音输入法被启用的过程中输入的第一语音信息;在所述第一语音信息的录制过程中不断进行缓存,得到第一预设时长的缓存数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述预设语音输入法被启用的过程中,若接收到针对预设录音按键执行的录音过程开始触发操作,则从所述缓存数据中获取接收到所述录音过程开始触发操作之前的第二预设时长内录制的第一部分语音信息,其中,所述第二预设时长小于或等于所述第一预设时长;将所述第一部分语音信息与自接收到所述录音过程开始触发操作起所录制的第二语音信息进行合成,得到目标语音信息,其中,所述第一语音信息包括所述第二语音信息;通过所述终端中的识别线程识别目标语音信息,得到所述目标语音信息对应的文字信息。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述预设语音输入法被启用的过程中,若接收到针对预设录音按键执行的录音过程结束触发操作,则判断接收到所述录音过程结束触发操作时所录制的第三语音信息对应的文字信息是否为语句末端,其中,所述第一语音信息包括所述第三语音信息;当所述第三语音信息对应的文字信息不是所述语句末端时,从所述缓存数据中获取自接收到所述录音过程结束触发操作之后的第三预设时长内录制的第二部分语音信息,其中,所述第三预设时长小于或等于所述第一预设时长;将所述第二部分语音信息识别为文字信息。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述预设语音输入法被启用的过程中,当再次接收到录音过程开始触发操作时,判断所述录音过程开始触发操作的再次接收时间和与其紧邻的上一个所述录音过程结束触发操作的接收时间之间的时间间隔是否小于目标时长,其中,所述目标时长包括所述第三预设时长或所述第二预设时长;当小于所述目标时长时,从所述缓存数据中获取自再次接收到所述录音过程开始触发操作之前的所述时间间隔内录制的第三部分语音信息;将所述第三部分语音信息识别为文字信息。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述语音输入触发操作包括:启用所述预设语音输入法。6.一种语音信息的处理装置,其特征在于,包括:控制模块,用于当检测到语音输入触发操作时,控制终端中的...
【专利技术属性】
技术研发人员:赵东阳,
申请(专利权)人:北京云知声信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。