【技术实现步骤摘要】
语音检测方法、装置及电子设备
本专利技术涉及语音识别
,更具体的说,是涉及语音检测方法、装置及电子设备。
技术介绍
随着电子设备的发展,语音识别越来越被广泛的应用到电子设备中。语音端点检测是语音识别中的一个必要环节,语音端点包括尾点语音端点。尽管语音端点检测技术在安静的环境中已经达到了令人鼓舞的准确率,但是在实际应用时,由于噪声引入通常会使尾点语音端点检测的准确率显著下降。
技术实现思路
有鉴于此,本专利技术提供了一种语音检测方法及电子设备,以克服现有技术中由于噪声引入通常会使尾点语音端点检测的准确率显著下降的问题。为实现上述目的,本专利技术提供如下技术方案:一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,所述语首?目息检测方法包括:通过所述音频采集单元获取音频信息;从所述音频信息`中获取用户的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点。其中,所述音频信息为振动信息,所述振动信息通过所述电子设备与所述用户的身体接触获得的,所述从所述音频信息中获取用户的语音信息包括:从所述振动信息中获得所述语音信息。其中,所述时间为时间段,所述利用所述时间确定所述语音信息的尾点语音端点包括:当所述语音信息满足第一预 ...
【技术保护点】
一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,其特征在于,所述语音信息检测方法包括:通过所述音频采集单元获取音频信息;从所述音频信息中获取用户的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点。
【技术特征摘要】
1.一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,其特征在于,所述语音信息检测方法包括: 通过所述音频采集单元获取音频信息; 从所述音频信息中获取用户的语音信息; 通过所述视频采集单元获取视频信息; 从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息; 对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻; 利用所述时间确定所述语音信息的尾点语音端点。2.根据权利要求1所述语音检测方法,其特征在于,所述音频信息为振动信息,所述振动信息通过所述电子设备与所述用户的身体接触获得的,所述从所述音频信息中获取用户的语音信息包括: 从所述振动信息中获得所述语音信息。3.根据权利要求1或2所述语音检测方法,其特征在于,所述时间为时间段,所述利用所述时间确定所述语音信息的尾点语音端点包括: 当所述语音信息满足第一预设条件时,根据所述语音信息,以预设帧为时间间隔分别计算所述时间内各个时间点成为第一尾点语音端点的置信度; 当所述面部表情变化信息满足第二预设条件时,根据所述面部表情变化信息,分别计算所述各个时间点成为第二尾点语音端点的置信度; 根据为所述语音信息分配的第一权重、所述各个时间点成为第一尾点语音端点的置信度、为所述面部表情变化信息分配的第二权重以及所述各个时间点成为第二尾点语音端点的置信度,分别计算出所述各个时间点对应的尾点语音端点的置信度; 从各个所述尾点语音端点的置信度中选择满足第三预设条件的尾点语音端点的置信度对应的尾点语音端点作为所述第一尾点语音端点。4.根据权利要求3所述语音检测方法,其特征在于,获取所述第一权重与所述第二权重的方法包括: 获取所述电子设备的环境状态; 根据所述电子设备的环境状态确定出所述第一权重以及所述第二权重。5.根据权利要求1所述语音检测方法,其特征在于,所述当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间包括: 当所述结果表明所述语音信息满足第一预设条件时,判断所述面部表情变化信息是否满足所述第二预设条件;当所述面部表情变化信息满足所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间; 或, 当所述结果表明所述面部表情变化信息满足所述第二预设条件时,判断所述语音信息是否满足第一预设条件;当所述语音信息满足第一预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间; 或, 当所述结果表明所述语音信息以及所述面部表情变化信息同时分别满足所述第一预设条件以及所述第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间。6.根据权利要求1或5所述语音检测方法,其特征在于,所述第一预设条件包括所述电子设备保持静音状态或所述电子设备保持静音状态预设时间,检测所述电子设备保持静音状态预设时间的方法包括: 记录所述电子设备处于静音状态的时刻; 以所述电子设备处于静音状态的时刻为起始时间记录延时时间; 当所述延时时间等于预设时间时,确定所述电子设备保持静音状态预设时间,所述预设时间依据第四预设条件进行设定。7.一种语音检测装置,应用于具有音频采集单元和视频采集单元的电子设备,其...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。