音频处理方法、装置、设备和计算机可读存储介质制造方法及图纸

技术编号:33543069 阅读:21 留言:0更新日期:2022-05-21 09:56
本申请实施例公开了一种音频处理方法、装置、设备和计算机可读存储介质。该方法包括:获取待处理音频;对待处理音频对应的音频特征进行分类,得到多种音源类型,并展示多种音源类型;通过分类出多种音源类型,便于用户根据自身实际录制环境选择合适的降噪策略。针对展示的多种音源类型,响应于音源类型选择操作,选中目标音源类型,通过用户界面交互,使得降噪策略更适合于不同用户和不同环境。根据目标音源类型对待处理音频进行降噪处理,得到目标音频,提高了音频处理效果。提高了音频处理效果。提高了音频处理效果。

【技术实现步骤摘要】
音频处理方法、装置、设备和计算机可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种音频处理方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]当前终端可以随时随地的进行语音录制,得到音频信息,提高了用户体验。录制环境中会存在各种各样噪音的情况,因此,在得到音频信息之后,还需要对音频信息进行降噪处理,从而得到处理后的音频。
[0003]现有技术中,在得到音频信息之后,采用统一的降噪处理方式对音频信息进行降噪处理。然而,不同录制场景下的噪声种类是不同的,现有技术中采用相同的降噪处理方式对不同录制场景下的音频信息进行降噪处理,所能达到的降噪效果有限,降低了音频处理质量。

技术实现思路

[0004]本申请实施例提供一种音频处理方法、装置、设备和计算机可读存储介质,通过分类并展示出多种音源类型,根据选中的目标音源类型,对待处理音频进行降噪处理,使得降噪处理结果适用于不同用户和不同环境,提高了音频处理效果。
[0005]本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供一种音频处理方法,所述方法包括:获取待处理音频;对所述待处理音频对应的音频特征进行分类,得到多种音源类型,并展示所述多种音源类型;针对展示的所述多种音源类型,响应于音源类型选择操作,选中目标音源类型;根据所述目标音源类型,对所述待处理音频进行降噪处理,得到目标音频。
[0007]第二方面,本申请实施例提供一种音频处理装置,所述装置包括:获取模块,用于获取待处理音频;分类模块,用于对所述待处理音频对应的音频特征进行分类,得到多种音源类型,并展示所述多种音源类型;响应模块,用于针对展示的所述多种音源类型,响应于音源类型选择操作,选中目标音源类型;降噪模块,用于根据所述目标音源类型,对所述待处理音频进行降噪处理,得到目标音频。
[0008]第三方面,本申请实施例提供一种音频处理设备,所述设备包括存储器,用于存储可执行指令,处理器,用于执行所述存储器中存储的可执行指令时,实现上述音频处理方法。
[0009]第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有可执行指令,用于被处理器执行时,实现上述音频处理方法。
[0010]本申请实施例提供了一种音频处理方法、装置、设备和计算机可读存储介质。根据本申请实施例提供的方案,获取待处理音频;对待处理音频对应的音频特征进行分类,得到多种音源类型,并展示多种音源类型;通过分类出多种音源类型,便于用户根据自身实际录制环境选择合适的降噪策略。针对展示的多种音源类型,响应于音源类型选择操作,选中目
标音源类型,通过用户界面交互,使得降噪策略更适合于不同用户和不同环境。根据目标音源类型对待处理音频进行降噪处理,得到目标音频,提高了音频处理效果。
附图说明
[0011]图1为本申请实施例提供的一种音频处理方法的可选的流程图;
[0012]图2为本申请实施例提供的另一种音频处理方法的可选的流程图;
[0013]图3为本申请实施例提供的再一种音频处理方法的可选的流程图;
[0014]图4为本申请实施例提供的又一种音频处理方法的可选的流程图;
[0015]图5为本申请实施例提供的又一种音频处理方法的可选的流程图;
[0016]图6为本申请实施例提供的又一种音频处理方法的可选的流程图;
[0017]图7为本申请实施例提供的一种音频处理装置的结构示意图;
[0018]图8为本申请实施例提供的一种音频处理设备的结构示意图。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。应当理解的是,此处所描述的一些实施例仅仅用以解释本申请的技术方案,并不用于限定本申请的技术范围。
[0020]为便于理解本方案,在对本申请实施例进行说明之前,对本申请实施例中的应用背景(相关技术)进行说明。
[0021]为便于理解本方案,在对本申请实施例进行说明之前,对本申请实施例中的相关技术进行说明。
[0022]相关技术中的录音降噪技术,是将除语音消息之外的都认为是噪声,以语音场景和非语音场景进行划分,采用相同的降噪处理方式对所有不同场合的录制音频做同一类降噪处理。示例性的,通过某些神经网络算法或其他人工智能检测算法区分语音信号与非语音信号,对非语音信号的幅值进行弱化,从而达到降噪效果。
[0023]上述录音降噪方案可以实现对录音音频进行整体降噪的功能,但是,由于区分维度从是否为语音的角度进行考虑,比较单一,降低了音频处理效果。不同用户在不同场景下对噪声的判断并非一成不变的,是否为噪声需要用户根据实际录制环境进行判断。例如,在用户对话的场景中,风声在录制音频中是噪声,但是,在户外采集风声的场景中,风声正是要采集的音频,此种场景下风声不能再当做噪声被消除。
[0024]本申请实施例提供的音频处理方法可以应用于终端,终端可以是车载设备、可穿戴设备、个人计算机(Personal Computer,PC)、智能手机、平板电脑、便携计算机等具有显示功能的设备。
[0025]本申请实施例提供的音频处理方法可以应用于一个终端,例如,该音频处理方法承载在应用程序(Application,APP),APP),安装在终端上,终端获取待处理音频;对待处理音频对应的音频特征进行分类,得到多种音源类型。该终端具有显示功能,显示功能用于展示多种音源类型,并接收针对展示的多种音源类型所进行的音源类型选择操作。终端还用于根据所选中的目标音源类型,对待处理音频进行降噪处理,得到目标音频。
[0026]本申请实施例提供的音频处理方法也可以应用于两个设备之间,两个设备之间通
Trees)、朴素贝叶斯(Naive Bayes)和支持向量机(Support Vector Machines,SVM)。上述二分类算法,输出的是两个音源类型。本申请实施例对于分类模型的具体结构不做限制。
[0038]S103、针对展示的多种音源类型,响应于音源类型选择操作,选中目标音源类型。
[0039]在本申请实施例中,以通过用户界面(User Interface,UI)向用户展示多种音源类型为例进行说明,由用户根据展示的多种音源类型进行选择操作,选中目标音源类型,目标音源类型包括一个或多个音源类型,对此本申请实施例不做限制。
[0040]在本申请实施例中,在某些场景下背景噪声中的鸟叫声和水流声等,是用户需要的环境细节,相关技术中的录音降噪技术无法保留用户需要的环境细节,将区分得到的非语音信号均进行消除,降低了音频处理效果。
[0041]在本申请实施例中,根据音源类型,对不同类型的音源加以区分,使得用户能够根据个人需要进行定向噪声的消除,在选择消除噪声的同时还保留了有用的录制环境背景音和语音,提高了用户体验。
[0042]S104、根据目标音源类型,对待处理音频进行降噪处理,得到目标音频。
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述方法包括:获取待处理音频;对所述待处理音频对应的音频特征进行分类,得到多种音源类型,并展示所述多种音源类型;针对展示的所述多种音源类型,响应于音源类型选择操作,选中目标音源类型;根据所述目标音源类型,对所述待处理音频进行降噪处理,得到目标音频。2.根据权利要求1所述的方法,其特征在于,所述获取待处理音频之后,所述方法还包括:对所述待处理音频进行多维度的特征提取,得到多个维度特征,所述多维度包括时域、频域、空域和幅度中的至少一项;分别对各个维度特征进行归一化,得到多个归一化后的维度特征;根据所述多个归一化后的维度特征,融合得到所述音频特征。3.根据权利要求2所述的方法,其特征在于,所述对所述待处理音频进行多维度的特征提取,得到多个维度特征,包括:根据预设的特征提取模型,对所述待处理音频进行所述多维度的特征提取,得到所述多个维度特征;所述预设的特征提取模型用于特征提取。4.根据权利要求3所述的方法,其特征在于,所述根据预设的特征提取模型,对所述待处理音频进行所述多维度的特征提取,得到所述多个维度特征之前,所述方法还包括:获取预设音源类型的音频样本,所述预设音源类型包括汽笛声、鸟叫声、水流声、风声、乐曲声和设备声中至少一项;基于初始特征提取模型,对各种所述预设音源类型的音频样本分别进行所述多维度的特征提取,得到各种所述预设音源类型的多个维度特征样本;根据各种所述预设音源类型的多个维度特征样本,确定各种所述预设音源类型的音频特征样本;计算各种所述预设音源类型的音频特征样本两两之间的区分度,得到多个特征区分度;若所述多个特征区分度均大于预设阈值,则得到所述预设的特征提取模型。5.根据权利要求4所述的方法,其特征在于,所述计算各种所述预设音源类型的音频特征样本两两之间的区分度,得到多个特征区分度之后,所述方法还包括:若所述多个特征区分度存在小于或等于所述预设阈值的特征区分度,则对所述初始特征提取模型进行参数调整,得到参数调整后的特征提取模型;根据所述参数调整后的特征提取模型,持续对各种所述预设音源类型的音频样本分别进行目标维度的特征提取,直至所述多个特征区分度均大于预设阈值时,得到所述预设的特征提取模型;其中,所述目标维度为所述多维度中的至少一项。6.根据权利要求1

5任一项所述的方法,其特征在于,所述对所述待处理音频...

【专利技术属性】
技术研发人员:陈刚
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1