音频优化方法及设备技术

技术编号:19906143 阅读:21 留言:0更新日期:2018-12-26 03:45
提供了一种音频优化方法及设备。所述音频优化方法包括:获取适用于不同环境的多个环境噪声模型;获取音频数据;针对音频数据从所述多个环境噪声模型中选择一个环境噪声模型;使用选择的环境噪声模型对音频数据进行优化。本发明专利技术的音频优化方法和设备可从多个环境噪声模型中选择出最佳的环境噪声模型对音频数据进行优化。

【技术实现步骤摘要】
音频优化方法及设备
以下描述涉及一种音频优化方法及设备,更具体地,涉及一种可从多个环境噪声模型中选择一种环境噪声模型,并使用选择出的环境噪声模型对音频数据进行优化的方法及设备。
技术介绍
语音优化是以语音录音和播放中的干扰因素为处理对象的一种方法,其中,干扰因素包括干扰噪音、语音模糊、口音、发音错误、破音、失真等多个导致语音不清晰的情况。语音优化系统就是将这些干扰因素减少并消除的一种系统,从而从各方面提升语音通话的舒适性、便利性和适应性。在智能设备接听电话或发送语音信息时,通常会遇到有干扰的情况。干扰较大时,会影响录制的声音质量,需要对语音进行音频优化。目前的音频优化技术主要依靠硬件完成,需要搭配使用外部设备和接口,外部设备需要进行单独充电,在使用过程中多有不便。同时,硬件的音频优化方案较为固定,通常采用高通滤波、低通滤波或高斯滤波等固定方法,无法针对环境做出适应性地调整,通常优化效果较不稳定。
技术实现思路
提出本专利技术可至少解决上述缺点并提供下述优点。本专利技术的一方面在于可使用户可从预先配置的多个环境噪声模型中选择一个期望的环境噪声模型对音频数据进行优化。本专利技术的另一方面在于可通过对音频数据进行预优化处理来自动地从预先配置的环境噪声模型中选择出最佳的环境噪声模型对音频数据进行优化。本专利技术的另一方面在于可根据音频数据重新选择最佳的环境噪声模型,并使用重新选择的最佳环境噪声模型对音频数据进行优化,使得可在对音频数据进行优化的过程中始终使用最佳的环境噪声模型对音频数据进行优化。本专利技术的另一方面在于可在获取音频数据和对获取的音频数据进行优化的过程中,不断地收集数据,并将数据不同地存储在各个数据集中,并通过对收集的数据进行处理,实现对音频优化设备配置的多个环境噪声模型的进一步优化,使得环境噪声模型能够更准确地体现特定环境下的噪声特征。本专利技术的另一方面在于可使用户建立新的环境噪声模型,使得用户可在不满意现有的环境噪声模型对音频数据的优化效果的情况下,建立新的环境噪声模型对音频数据进行优化。根据本专利技术的一方面,提供了一种音频优化方法,所述方法包括:获取适用于不同环境的多个环境噪声模型;获取音频数据;针对音频数据从所述多个环境噪声模型中选择一个环境噪声模型;使用选择的环境噪声模型对音频数据进行优化。从所述多个环境噪声模型中选择一个环境噪声模型的步骤可包括:在手动选择模式下,接收用户对所述多个环境噪声模型中的一个环境噪声模型的指定的输入,并将用户指定的环境噪声模型确定为选择的环境噪声模型。从所述多个环境噪声模型中选择一个环境噪声模型的步骤可包括:在自适应选择模式下,分别使用所述多个环境噪声模型中的每个环境噪声模型对音频数据进行预优化,并根据预优化结果从所述多个环境噪声模型中选择一个环境噪声模型。分别使用所述多个环境噪声模型中的每个环境噪声模型对音频数据进行预优化,并根据预优化结果从所述多个环境噪声模型中选择一个环境噪声模型的步骤可包括:从音频数据中截取出预定长度的音频数据;分别使用所述多个环境噪声模型中的每个环境噪声模型对所述预定长度的音频数据进行优化,获取分别与所述多个环境噪声模型相应的多个优化结果;分别对多个优化结果中的每个优化结果进行评价,从所述多个环境噪声模型中选择评价结果最好的环境噪声模型。分别对多个优化结果中的每个优化结果进行评价的步骤可包括:分别计算每个优化结果的信噪比、主观语音质量评估和分段信噪比;分别计算每个优化结果的信噪比、主观语音质量评估和分段信噪比的加权平均值;将与加权平均值最高的优化结果相应的环境噪声模型确定为评价结果最好的环境噪声模型。在自适应选择模式下,使用选择的环境噪声模型对音频数据进行优化的步骤可包括:每隔预定时间间隔,对音频数据进行一次预优化,并根据预优化结果从多个环境噪声模型中选择一个环境噪声模型,使用选择的环境噪声模型对音频数据之中的从选择出该环境噪声模型的时刻起到下一次选择出环境噪声模型的时刻为止的音频数据进行优化。对音频数据进行优化的步骤可包括:通过从音频数据的频谱中减去与选择的环境噪声模型相应的噪声特征的频谱来获取优化后的音频数据。所述优化方法还可包括:在获取音频数据之后,确定音频数据是否需要被优化;如果音频数据不需要被优化,则将音频数据添加到预先设置的训练样本库中的纯净数据集中;如果音频数据需要被优化,则在使用选择的环境噪声模型对音频数据进行优化之后,将与优化后的音频数据相应的原始音频数据添加到所述训练样本库中的与选择的环境噪声模型相应的噪声数据集中;基于纯净数据集中的音频数据和与选择的环境噪声模型相应的噪声数据集中的音频数据,对选择的环境噪声模型进行优化。在使用选择的环境噪声模型对音频数据进行优化之后,将与优化后的音频数据相应的原始音频数据加入所述训练样本库中的与选择的环境噪声模型相应的噪声数据集中的步骤可包括:在自适应选择模式下,确定选择的环境噪声模型是否满足预定条件;如果选择的环境噪声模型不满足预定条件,则提示用户是否建议新的环境噪声模型;如果用户选择建立新的环境噪声模型,则建立新的环境噪声模型,并将与优化后的音频数据相应的原始音频数据加入所述训练样本库中的与新的环境噪声模型相应的噪声数据集中。确定选择的环境噪声模型是否满足预定条件的步骤可包括:计算所述预定长度的音频数据的信噪比、主观语音质量评估和分段信噪比的第一加权平均值;计算使用选择的环境噪声模型对预定长度的音频数据进行优化后的音频数据的信噪比、主观语音质量评估和分段信噪比的第二加权平均值;计算第二加权平均值与第一加权平均值的比值;如果所述比值没有达到预定值,则确定选择的环境噪声模型不满足所述预定条件。对选择的环境噪声模型进行优化的步骤可包括:将与选择的环境噪声模型相应的噪声数据集中的音频数据的音频特征与纯净数据集中的音频数据的音频特征之间的差确定为与选择的环境噪声模型相应的噪声特征。根据本专利技术的另一方面,提供了一种音频优化设备,所述设备包括:模型获取模块,被配置为获取适用于不同环境的多个环境噪声模型;数据采集模块,被配置为获取音频数据;模型选择模块,被配置为针对音频数据从所述多个环境噪声模型中选择一个环境噪声模型;音频优化模块,被配置为使用选择的环境噪声模型对音频数据进行优化。模型选择模块可被配置为:在手动选择模式下,接收用户对所述多个环境噪声模型中的一个环境噪声模型的指定的输入,并将用户指定的环境噪声模型确定为选择的环境噪声模型。模型选择模块可被配置为:在自适应选择模式下,分别使用所述多个环境噪声模型中的每个环境噪声模型对音频数据进行预优化,并根据预优化结果从所述多个环境噪声模型中选择一个环境噪声模型。模型选择模块可被配置为:从音频数据中截取出预定长度的音频数据;分别使用所述多个环境噪声模型中的每个环境噪声模型对所述预定长度的音频数据进行优化,获取分别与所述多个环境噪声模型相应的多个优化结果;分别对多个优化结果中的每个优化结果进行评价,从所述多个环境噪声模型中选择评价结果最好的环境噪声模型。模型选择模块可被配置为:分别计算每个优化结果的信噪比、主观语音质量评估和分段信噪比;分别计算每个优化结果的信噪比、主观语音质量评估和分段信噪比的加权平均值;将与加权平均值最高的优化结果相应的环境噪声模型确定为评本文档来自技高网...

【技术保护点】
1.一种音频优化方法,所述方法包括:获取适用于不同环境的多个环境噪声模型;获取音频数据;针对音频数据从所述多个环境噪声模型中选择一个环境噪声模型;使用选择的环境噪声模型对音频数据进行优化。

【技术特征摘要】
1.一种音频优化方法,所述方法包括:获取适用于不同环境的多个环境噪声模型;获取音频数据;针对音频数据从所述多个环境噪声模型中选择一个环境噪声模型;使用选择的环境噪声模型对音频数据进行优化。2.如权利要求1所述的音频优化方法,其中,从所述多个环境噪声模型中选择一个环境噪声模型的步骤包括:在手动选择模式下,接收用户对所述多个环境噪声模型中的一个环境噪声模型的指定的输入,并将用户指定的环境噪声模型确定为选择的环境噪声模型。3.如权利要求1所述的音频优化方法,其中,从所述多个环境噪声模型中选择一个环境噪声模型的步骤包括:在自适应选择模式下,分别使用所述多个环境噪声模型中的每个环境噪声模型对音频数据进行预优化,并根据预优化结果从所述多个环境噪声模型中选择一个环境噪声模型。4.如权利要求3所述的音频优化方法,其中,分别使用所述多个环境噪声模型中的每个环境噪声模型对音频数据进行预优化,并根据预优化结果从所述多个环境噪声模型中选择一个环境噪声模型的步骤包括:从音频数据中截取出预定长度的音频数据;分别使用所述多个环境噪声模型中的每个环境噪声模型对所述预定长度的音频数据进行优化,获取分别与所述多个环境噪声模型相应的多个优化结果;分别对多个优化结果中的每个优化结果进行评价,从所述多个环境噪声模型中选择评价结果最好的环境噪声模型。5.如权利要求4所述的音频优化方法,其中,分别对多个优化结果中的每个优化结果进行评价的步骤包括:分别计算每个优化结果的信噪比、主观语音质量评估和分段信噪比;分别计算每个优化结果的信噪比、主观语音质量评估和分段信噪比的加权平均值;将与加权平均值最高的优化结果相应的环境噪声模型确定为评价结果最好的环境噪声模型。6.如权利要求3所述的音频优化方法,其中,在自适应选择模式下,使用选择的环境噪声模型对音频数据进行优化的步骤包括:每隔预定时间间隔,对音频数据进行一次预优化,并根据预优化结果从多个环境噪声模型中选择一个环境噪声模型,使用选择的环境噪声模型对音频数据之中的从选择出该环境噪声模型的时刻起到下一次选择出环境噪声模型的时刻为止的音频数据进行优化。7.如权利要求1所述的音频优化方法,其中,对音频数据进行优化的步骤包括:通过从音频数据的频谱中减去与选择的环境噪声模型相应的噪声特征的频谱来获取优化后的音频数据。8.如权利要求1或权利要求4所述的音频优化方法,还包括:在获取音频数据之后,确定音频数据是否需要被优化...

【专利技术属性】
技术研发人员:叶韵
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1