音频环境分类的系统和方法技术方案

技术编号：11733232 阅读：136 留言：0更新日期：2015-07-15 04:53

本发明专利技术揭示分类音频环境的系统和方法。在一个实施例中，一种分类音频环境的方法包括根据第一时间间隔对所述音频环境进行取样以获得经取样音频数据，计算所述经取样音频数据的特征，根据第二时间间隔从所述经取样音频数据的所述特征中推断音频群集标识符，以及根据第三时间间隔使用所述经取样音频数据的所述特征更新音频环境模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及无线通信领域。明确地说，本专利技术涉及。
技术介绍
可将低功率始终接通音频环境分类设想为用于智能手机的情境感知应用的启用程序。虽然已试图促进监督（即，预先训练的）音频分类，但此监督音频分类的执行可能被混淆，这是因为给定周围音频环境的正确语义标签可能常常为用户特定的。举例来说，一个人的家里的周围环境可能听起来好像另一个人的办公室的周围环境。另外，常规音频分类方法可为计算上密集的，从而使得此类方法不适于以低功率始终接通方式来实施。关于常规音频分类方法的另一个问题是对隐私的关注，这是因为可存储原始音频样本。
技术实现思路
一种根据本专利技术的分类音频环境的方法的实例包含根据第一时间间隔对所述音频环境进行取样以获得经取样音频数据，计算所述经取样音频数据的特征，根据第二时间间隔从经取样音频数据的所述特征推断音频群集标识符，以及根据第三时间间隔使用经取样音频数据的所述特征更新音频环境模型。所述方法的实施方案可包含以下特征中的一者或一者以上。计算所述经取样音频数据的特征可包含计算多个梅尔频率倒谱系数（mel-frequency ceptral coefficient ; MFCC)，在所述第一时间间隔内使用所述多个MFCC产生对MFCC数据的统计的连续估计，以及存储对MFCC数据的统计的所述连续估计。产生对MFCC数据的统计的连续估计可包含将所述多个MFCC加到与所述音频环境的所述多个MFCC的平均值成比例的估计，以及将所述多个MFCC的平方加到与所述音频环境的所述多个MFCC的方差成比例的估计。推断所述音频群集...

【技术保护点】
一种分类音频环境的方法，其包括：根据第一时间间隔对所述音频环境进行取样以获得经取样音频数据；计算所述经取样音频数据的特征；根据第二时间间隔从所述经取样音频数据的所述特征中推断音频群集标识符；以及根据第三时间间隔使用所述经取样音频数据的所述特征更新音频环境模型。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：里昂纳德·亨利·葛罗科普，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人