语音感知音频系统及方法技术方案

技术编号：27466421 阅读：29 留言：0更新日期：2021-03-02 17:29

一种用于使佩戴耳机的用户在收听音乐或任何其他音频源的同时感知外部声音环境的语音感知音频系统和方法。可调整声音感知区赋予用户灵活性，以避免听到远距离的语音。能够在频域中分析外部声音，以选择振荡频率备选项，并且能够在时域中分析外部声音，以确定振荡频率备选项是否为感兴趣的信号。如果确定被导向至外部声音的信号是感兴趣的信号，则使外部声音与来自音频源的音频混合。音与来自音频源的音频混合。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音感知音频系统及方法

[0001]本专利技术涉及一种使佩戴耳机的用户在收听音乐或任何其他音频源的同时感知外部声音环境的系统和方法。

技术介绍

[0002]语音活动检测(VAD)，也被称为话语活动检测或话语检测，是检测人类话语的存在或缺失的话语处理中所使用的技术。已知各种VAD算法。已知VAD所使用的常规算法方案在输入信号有噪声时会遇到检测分值较低的问题。
[0003]在包括话语识别的许多话语处理应用中，VAD扮演话语压缩与降噪系统的角色。在图1中，描述了由下列项构成的常规VAD的基本原理，即，从成帧的输入信号提取特征，然后，基于从最近几帧获取的信息，适配多维阈值，并且进行特征与该阈值的比较，以确定帧是话语还是噪声。通常，通常存在确定拖尾的最后阶段，其目标是确保句子中出现包括正常短的静默期的连续话语流。一般，选择10ms至40ms持续时间之间的帧长度，因为此长度与话语被视为统计静止的时间窗对应。
[0004]检测话语的标准是找到语音部分，由于这些是周期性并且具有算法中使用的数学上限定良好的结构。另一解决方案是使用话语的统计模型、从所获取的数据采样中估计其参数、并且使用确定理论的经典结果进行帧话语/噪声分类。
[0005]图2示出了在时域方法中用于检测话语的技术。这些技术包括短时能量、过零率、互相关、周期性测量、线性预测分析，以及音高估计。图3示出了频域方法中用于检测话语的技术。这些技术包括子带能量、维纳熵(Weiner entropy)、倒谱、能量熵、调和比、以及频谱峰值分析。常规的VAD算法...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种语音感知音频系统，包括：耳机，被配置为从音频源接收音频；至少一个麦克风，与所述耳机相关联，所述至少一个麦克风被配置为检测外部声音环境中的外部声音并且生成被导向至所述外部声音的信号；以及分析器模块，用于确定被导向至所述外部声音的所述信号是否为感兴趣的信号；其中，如果确定被导向至所述外部声音的所述信号为所述感兴趣的信号，则使所述外部声音与来自所述音频源的所述音频混合。2.根据权利要求1所述的语音感知音频系统，其中，所述分析器模块被配置为分析频域中被导向至所述外部声音的所述信号以选择振荡频率备选项，并且分析时域中被导向至所述外部声音的所述信号来确定所述振荡频率备选项是否为所述感兴趣的信号。3.根据权利要求2所述的语音感知音频系统，其中，所述分析器模块将被导向至所述外部声音的所述信号接收在输入缓冲器中，并且所述频域的分析使用所述输入缓冲器中的所述信号的FFT来生成输入帧，且所述时域的分析递归地使用具有所述输入帧的子帧。4.根据权利要求3所述的语音感知音频系统，其中，利用维纳熵或简化的维纳熵来执行所述频域的分析。5.根据权利要求3所述的语音感知音频系统，其中，利用音高估计或YIN算法来执行所述时域的分析。6.根据权利要求1所述的语音感知音频系统，其中，所述分析器模块还包括拖尾模块，所述拖尾模块用于确定在所述时域中确定的所述感兴趣的信号中的话语存在或话语缺失。7.根据权利要求2所述的语音感知系统，其中，在降噪算法中使用所述频域的分析，以估计所述外部声音环境中的噪声级别并且基于所述噪声级别对所述语音感知音频系统进行调谐。8.根据权利要求1所述的语音感知音频系统，其中，限定所述耳机周围的可调整声音感知区，所述可调整声音感知区具有一个或多个调谐区，并且当所述外部声音处于所述一个或多个调谐区中的一个预定调谐区内时，将所述外部声音确定为所述感兴趣的信号。9.根据权利要求1所述的语音感知音频系统，其中，所述音频是音乐。10.根据权利要求1所述的语音感知音频系统，其中，所述耳机包括麦克风阵列，所述麦克风阵列被布置成使来自所选择方向的音频衰减或放大，所述麦克风阵列中的所述麦克风指向各个方向，以实现用户周围环境的360
°
音频图像。11.根据权利要求10所述的语音感知音频系统，其中，限定所述耳机周围的可调整声音感知区，所述可调整声音感知区具有一个或多个调谐区，并且当所述外部声音处于所述一个或多个调谐区中的一个预定调谐区内时，确定所述外部声音是感兴趣的信号，所述麦克风阵列去除来自非期望方向的信号并且将所述麦克风阵列导向至感兴趣的方向。12.一种使佩戴耳机的用户感知外部声音环境的方法，所述耳机被配置为从音频源接收音频，所述方法包括下列步骤：a.利用与所述耳机相关联的至少一个麦克风来检测所述外部声音环境中的外部声音；b.生成被导向至所述外部声音的信号；c.确定被导向至所述外部声音的所述信号是否为感兴趣的信号；并且d.如果确定被导向至所述外部声音的所述信号是所述感兴趣的信号，则使所述外部声
音与来自所述音频源的所述音频混合。13.根据权利要求12所述的方...

【专利技术属性】
技术研发人员：蒂莫西，
申请(专利权)人：HED科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人