语音检测方法、装置及电子设备制造方法及图纸

技术编号:9739229 阅读:135 留言:0更新日期:2014-03-06 19:58
本发明专利技术实施例提供了一种语音检测方法、装置及电子设备,该方法包括:通过所述音频采集单元获取音频信息;从所述音频信息中获取用户的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点。采用本发明专利技术实施例提供的方法、装置及电子设备,可以提高获取尾点语音端点的准确率。

【技术实现步骤摘要】
语音检测方法、装置及电子设备
本专利技术涉及语音识别
,更具体的说,是涉及语音检测方法、装置及电子设备。
技术介绍
随着电子设备的发展,语音识别越来越被广泛的应用到电子设备中。语音端点检测是语音识别中的一个必要环节,语音端点包括尾点语音端点。尽管语音端点检测技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时,由于噪声引入通常会使尾点语音端点检测的准确率显著下降。
技术实现思路
有鉴于此,本专利技术提供了一种语音检测方法及电子设备,以克服现有技术中由于噪声引入通常会使尾点语音端点检测的准确率显著下降的问题。为实现上述目的,本专利技术提供如下技术方案:一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,所述语首?目息检测方法包括:通过所述音频采集单元获取音频信息;从所述音频信息`中获取用户的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点。其中,所述音频信息为振动信息,所述振动信息通过所述电子设备与所述用户的身体接触获得的,所述从所述音频信息中获取用户的语音信息包括:从所述振动信息中获得所述语音信息。其中,所述时间为时间段,所述利用所述时间确定所述语音信息的尾点语音端点包括:当所述语音信息满足第一预设条件时,根据所述语音信息,以预设帧为时间间隔分别计算所述时间内各个时间点成为第一尾点语音端点的置信度;当所述面部表情变化信息满足第二预设条件时,根据所述面部表情变化信息,分别计算所述各个时间点成为第二尾点语音端点的置信度;根据为所述语音信息分配的第一权重、所述各个时间点成为第一尾点语音端点的置信度、为所述面部表情变化信息分配的第二权重以及所述各个时间点成为第二尾点语音端点的置信度,分别计算出所述各个时间点对应的尾点语音端点的置信度;从各个所述尾点语音端点的置信度中选择满足第三预设条件的尾点语音端点的置信度对应的尾点语音端点作为所述第一尾点语音端点。其中,获取所述第一权重与所述第二权重的方法包括:获取所述电子设备的环境状态;根据所述电子设备的环境状态确定出所述第一权重以及所述第二权重。其中,所述当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间包括:当所述结果表明所述语音信息满足第一预设条件时,判断所述面部表情变化信息是否满足所述第二预设条件;当所述面部表情变化信息满足所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间;或,当所述结果表明所述面部表情变化信息满足所述第二预设条件时,判断所述语音信息是否满足第一预设条件;当所述语音信息满足第一预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间;或,当所述结果表明所述语音信息以及所述面部表情变化信息同时分别满足所述第一预设条件以及所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间。其中,所述第一预设条件包括所述电子设备保持静音状态或所述电子设备保持静音状态预设时间,检测所述电子设备保持静音状态预设时间的方法包括:记录所述电子设备处于静音状态的时刻;以所述电子设备处于静音状态的时刻为起始时间记录延时时间;当所述延时时间等于预设时间时,确定所述电子设备保持静音状态预设时间,所述预设时间依据第四预设条件进行设定。一种语音检测装置,应用于具有音频采集单元和视频采集单元的电子设备,所述语音信息检测装置包括:第一获取模块,用于通过所述音频采集单元获取音频信息;第二获取模块,用于从所述音频信息中获取用户的语音信息;第三获取模块,用于通过所述视频采集单元获取视频信息;第四获取模块,用于从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;判断模块,用于对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;第一确定模块,用于利用所述时间确定所述语音信息的尾点语音端点。其中,所述音频信息为振动信息,所述振动信息通过所述电子设备与所述用户的身体接触获得的,所述第二获取模块具体用于:从所述振动信息中获得所述语音信息。其中,所述时间为时间段,所述第一确定模块包括:第一计算单元,用于当所述语音信息满足第一预设条件时,根据所述语音信息,以预设帧为时间间隔分别计算所述时间内各个时间点成为第一尾点语音端点的置信度;第二计算单元,用于当所述面部表情变化信息满足第二预设条件时,根据所述面部表情变化信息,分别计算所述各个时间点成为第二尾点语音端点的置信度;第三计算单元,用于根据为所述语音信息分配的第一权重、所述各个时间点成为第一尾点语音端点的置信度、为所述面部表情变化信息分配的第二权重以及所述各个时间点成为第二尾点语音端点的置信度,分别计算出所述各个时间点对应的尾点语音端点的置信度;选择单元,用于从各个所述尾点语音端点的置信度中选择满足第三预设条件的尾点语音端点的置信度对应的尾点语音端点作为所述第一尾点语音端点。其中,还包括:第五获取模块,用于获取所述电子设备的环境状态;第二确定模块,用于根据所述电子设备的环境状态确定出所述第一权重以及所述第二权重。其中,所述判断模块具体用于:当所述结果表明所述语音信息满足第一预设条件时,判断所述面部表情变化信息是否满足所述第二预设条件;当所述面部表情变化信息满足所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间;或,当所述结果表明所述面部表情变化信息满足所述第二预设条件时,判断所述语音信息是否满足第一预设条件;当所述语音信息满足第一预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间;或,当所述结果表明所述语音信息以及所述面部表情变化信息同时分别满足所述第一预设条件以及所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间。其中,所述第一预设条件包括所述电子设备保持静音状态或所述电子设备保持静音状态预设时间,所述语音检测装置还包括:第一记录模块,用于记录所述电子设备处于静音状态的时刻;第二记录模块,用于以所述电子设备处于静音状态的时刻为起始时间记录延时时间;第三确定模块,用于当所述延时时间等于预设时间时,确定所述电子设备保持静音状态预设时间,所述预设时间依据第四预设条件进行设定。一种电子设备,包括:音频采集单元;视频采集单元;以及上述任一所述语音检测装置。经由上述的技术方案可知,与现有技术相比,本专利技术实施例提供了一种语音检测方法,同时根据用户发出与语音信息对应的语音时的面部表情变化信息和语音信息获得尾点语音端点,由于用户发出与语音信息对应的语音时的面部表情变化信息不受外界噪声的影响,所以可以提高获取尾点语音端点的准确率。【附图说明】为了更清楚地说明本专利技术本文档来自技高网...
语音检测方法、装置及电子设备

【技术保护点】
一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,其特征在于,所述语音信息检测方法包括:通过所述音频采集单元获取音频信息;从所述音频信息中获取用户的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点。

【技术特征摘要】
1.一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,其特征在于,所述语音信息检测方法包括: 通过所述音频采集单元获取音频信息; 从所述音频信息中获取用户的语音信息; 通过所述视频采集单元获取视频信息; 从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息; 对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻; 利用所述时间确定所述语音信息的尾点语音端点。2.根据权利要求1所述语音检测方法,其特征在于,所述音频信息为振动信息,所述振动信息通过所述电子设备与所述用户的身体接触获得的,所述从所述音频信息中获取用户的语音信息包括: 从所述振动信息中获得所述语音信息。3.根据权利要求1或2所述语音检测方法,其特征在于,所述时间为时间段,所述利用所述时间确定所述语音信息的尾点语音端点包括: 当所述语音信息满足第一预设条件时,根据所述语音信息,以预设帧为时间间隔分别计算所述时间内各个时间点成为第一尾点语音端点的置信度; 当所述面部表情变化信息满足第二预设条件时,根据所述面部表情变化信息,分别计算所述各个时间点成为第二尾点语音端点的置信度; 根据为所述语音信息分配的第一权重、所述各个时间点成为第一尾点语音端点的置信度、为所述面部表情变化信息分配的第二权重以及所述各个时间点成为第二尾点语音端点的置信度,分别计算出所述各个时间点对应的尾点语音端点的置信度; 从各个所述尾点语音端点的置信度中选择满足第三预设条件的尾点语音端点的置信度对应的尾点语音端点作为所述第一尾点语音端点。4.根据权利要求3所述语音检测方法,其特征在于,获取所述第一权重与所述第二权重的方法包括: 获取所述电子设备的环境状态; 根据所述电子设备的环境状态确定出所述第一权重以及所述第二权重。5.根据权利要求1所述语音检测方法,其特征在于,所述当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间包括: 当所述结果表明所述语音信息满足第一预设条件时,判断所述面部表情变化信息是否满足所述第二预设条件;当所述面部表情变化信息满足所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间; 或, 当所述结果表明所述面部表情变化信息满足所述第二预设条件时,判断所述语音信息是否满足第一预设条件;当所述语音信息满足第一预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间; 或, 当所述结果表明所述语音信息以及所述面部表情变化信息同时分别满足所述第一预设条件以及所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间。6.根据权利要求1或5所述语音检测方法,其特征在于,所述第一预设条件包括所述电子设备保持静音状态或所述电子设备保持静音状态预设时间,检测所述电子设备保持静音状态预设时间的方法包括: 记录所述电子设备处于静音状态的时刻; 以所述电子设备处于静音状态的时刻为起始时间记录延时时间; 当所述延时时间等于预设时间时,确定所述电子设备保持静音状态预设时间,所述预设时间依据第四预设条件进行设定。7.一种语音检测装置,应用于具有音频采集单元和视频采集单元的电子设备,其...

【专利技术属性】
技术研发人员:戴海生
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1