低功率语音检测制造技术

技术编号：10282738 阅读：138 留言：0更新日期：2014-08-04 09:59

允许具有最小功耗的语音处理的方法包含以第一时钟频率和第一电压记录时域音频信号，并且以第二时钟频率对时域音频信号执行快速傅里叶变换（FFT）操作来生成频域音频信号。可通过一个或多个滤波和增强技术来增强频域音频信号而获取更佳信噪比。增强的音频信号可用于生成总信号能量并且估计背景噪声能量。决策逻辑可从信号能量和背景噪声来确定人语音的存在或不存在。第一时钟频率可不同于第二时钟频率。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】低功率语音检测背景。
实施例通常涉及音频处理。更特别地，实施例涉及语音识别。讨论语音命令和连续的言语识别对于移动计算系统而言因为有限的键盘功能性而可能是重要的。然而，持续地监听环境中的潜在语音的功率成本可能太高以使得在系统可以开始监听之前大多数系统要求来自用户的输入。此方式会不便并且会限制许多潜在应用的实用性。【附图说明】通过阅读下文的说明书和所附权利要求，并且通过参考以下的图，本专利技术的实施例的各种优势将对于本领域的技术人员而变得明显，图中: 图1是图示言语识别系统的实施例的示例的框图；图2是图示根据实施例的与音频信号有关的示例能量和帧的图表；图3是表示噪声抑制的示例实施例的框图。图4是图示与人语音检测操作关联的示例错误接受率和错误拒绝率的图表；图5是语音活动检测模块的硬件架构实施例的示例；图6是图示根据实施例的示例512点快速傅里叶变换的框图；图7是图示根据实施例的快速傅里叶变换模块的示例硬件实现的框图；图8是图示根据实施例的乘法和滤波模块的示例硬件实现的图；以及图9是处理音频信号来检测人语音的示例方法的流程图。【具体实施方式】实施例可包括设备，它包含用于在存储器中存储时域中的音频信号的逻辑，其配置为基于第一时钟频率和第一电压来操作，并且基于第二时钟频率和第二电压对时域中的音频信号执行快速傅里叶变换(FFT)操作来生成频域中的音频信号。实施例可包括计算机实现的方法，其包含以第一时钟频率和第一电压记录时域音频信号。该方法还包含以第二时钟频率对时域音频信号执行快速傅里叶变换(FFT)操作来生成频域音频信号。第一时...

【技术保护点】
一种设备，包括：逻辑，所述逻辑用于：在存储器中存储时域音频信号，所述存储器配置为基于第一时钟频率和第一电压来操作，以及基于第二时钟频率和第二电压对所述时域音频信号执行快速傅里叶变换（FFT）操作来生成频域音频信号。

【技术特征摘要】
【国外来华专利技术】1.一种设备，包括: 逻辑，所述逻辑用于: 在存储器中存储时域音频信号，所述存储器配置为基于第一时钟频率和第一电压来操作，以及基于第二时钟频率和第二电压对所述时域音频信号执行快速傅里叶变换(FFT)操作来生成频域音频信号。2.如权利要求1所述的设备，其中所述逻辑用于: 执行第一组FFT操作，执行复数乘法操作，以及与所述第一组FFT操作串行地执行第二组FFT操作。3.如权利要求2所述的设备，其中所述第二时钟频率比所述第一时钟频率慢，并且其中所述第二电压低于所述第一电压。4.如权利要求3所述的设备，其中所述逻辑用于: 执行噪声抑制操作，基于所述第二时钟频率和所述第二电压对所述频域音频信号执行滤波操作来生成增强的音频信号。5.如权利要求4所述的设备，其中所述复数乘法操作和滤波操作使用相同的硬件部件来实现。6.如权利要求4所述的设备，其中所述逻辑用于基于所述第二时钟频率和所述第二电压对所述增强的音频信号执行人语音检测操作。7.如权利要求6所述的设备，其中所述逻辑用于确定所述增强的音频信号的帧中的总能量，并且确定所述增强的音频信号的所述帧中的背景噪声。8.如权利要求7所述的设备，其中所述逻辑用于执行中值滤波操作，并且执行轮廓跟踪操作。9.如权利要求7所述的设备，其中所述逻辑用于基于所述第一时钟频率和所述第一电压来执行与所检测的人语音关联的命令。10.一种计算机实现的方法，包括: 以第一时钟频率和第一电压记录时域音频信号；以第二时钟频率对所述时域音频信号执行快速傅里叶变换(FFT)操作来生成频域音频信号，其中所述第一时钟频率比所述第二时钟频率快。11.如权利要求10所述的方法，其中所述FFT操作以低于所述第一电压的第二电压执行。12.如权利要求11所述的方法，还包含；以所述第二时钟频率和所述第二电压对所述频域音频信号执行噪声抑制操作来生成增强的音频信号。13.如权利要求12所述的方法，还包含: 以所述第二时钟频率和所述第二电压对所述增强的音频信号执行语音检测操作来检测人语音。14.如权利要求13所述的方法，其中执行所述人语音检测操作包含:确定所述增强的音频信号的帧中的总能量；确定与所述增强的音频信号的所述帧中的背景噪声关联的能量；以及通过从所述增强的音频信号的所述帧中的所述总能量中减去与所述背景噪声关联的能量来检测所述人语音。15.如权利要求13所述的方法，还包含: 以所述第一时钟频率和所述第一电压执行与所述人语音关联的命令。16.如权利要求15所述的方法，其中以所述第一时钟频率和所述第一电压持续地记录所述时域音频信号并且将所述时...

【专利技术属性】
技术研发人员：A雷乔杜里，WM贝尔特曼，JW尚茨，C托库纳加，ME戴舍尔，TE沃尔什，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人