音频处理方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:37426033 阅读:19 留言:0更新日期:2023-04-30 09:47
本申请实施例提供了一种音频处理方法、装置、设备、存储介质及程序产品,涉及音频技术领域。所述方法包括:获取第一音频文件(110);提取所述第一音频文件的音频特征(120);通过第一用户的声学模型对所述音频特征进行处理,生成第二音频文件;其中,所述第一用户的声学模型是学习有所述第一用户的声学特征的模型,所述第二音频文件具有所述第一用户的音色(130)。采用本申请实施例提供的技术方案,能够提升音频内容的丰富性。提升音频内容的丰富性。提升音频内容的丰富性。

【技术实现步骤摘要】
【国外来华专利技术】音频处理方法、装置、设备、存储介质及程序产品


[0001]本申请实施例涉及音频
,特别涉及一种音频处理方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]目前,随着音频技术的发展,音频处理方式越来越多种多样。
[0003]在相关技术中,用户可以通过某个音频制作应用程序给自己录音、调音并播放制作的音频。
[0004]在上述相关技术中,用户只能采用自己录音得到的音频进行音频制作,制作得到的音频内容较为单一。

技术实现思路

[0005]本申请实施例提供了一种音频处理方法、装置、设备、存储介质及程序产品,能够提升音频内容的丰富性。所述技术方案如下:
[0006]根据本申请实施例的一个方面,提供了一种音频处理方法,所述方法包括:
[0007]显示第一音频文件的相关信息;
[0008]响应于针对所述第一音频文件的音色制作指令,显示通过第一用户的声学模型根据所述第一音频文件生成的第二音频文件;其中,所述第一用户的声学模型是学习有所述第一用户的声学特征的模型,所述第二音频文件具有所述第一用户的音色。
[0009]根据本申请实施例的一个方面,提供了一种音频处理装置,所述装置包括:
[0010]信息显示模块,用于显示第一音频文件的相关信息;
[0011]文件显示模块,用于响应于针对所述第一音频文件的音色制作指令,显示通过第一用户的声学模型根据所述第一音频文件生成的第二音频文件;其中,所述第一用户的声学模型是学习有所述第一用户的声学特征的模型,所述第二音频文件具有所述第一用户的音色。
[0012]根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述音频处理方法。
[0013]根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述音频处理方法。
[0014]根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品由处理器加载并执行以实现上述音频处理方法。
[0015]本申请实施例提供的技术方案可以包括如下有益效果:
[0016]通过提取第一音频文件的音频特征,并基于第一音频文件的音频特征、和用户的声学模型,将该用户的声学特征与第一音频文件融合,生成具有该用户音色的第二音频文
件,实现了对音频进行音色修改的功能,从而提升了音频内容的丰富性。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本申请一个实施例提供的音频处理方法的流程图;
[0020]图2是本申请一个实施例提供的音素的示意图;
[0021]图3是本申请一个实施例提供的声学模型的示意图;
[0022]图4是本申请一个实施例提供的音频处理装置的框图;
[0023]图5是本申请另一个实施例提供的音频处理装置的框图;
[0024]图6是本申请一个实施例提供的计算机设备的框图。
具体实施方式
[0025]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的方法的例子。
[0026]本申请实施例提供的方法,各步骤的执行主体可以是计算机设备,该计算机设备是指具备数据计算、处理和存储能力的电子设备。该计算机设备可以是诸如PC(Personal Computer,个人计算机)、平板电脑、智能手机、可穿戴设备、智能机器人等终端;也可以是服务器。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。
[0027]下面,通过几个实施例对本申请技术方案进行介绍说明。
[0028]请参考图1,其示出了本申请一个实施例提供的音频处理方法的流程图。在本实施例中,主要以该方法应用于上文介绍的计算机设备中来举例说明。该方法可以包括如下几个步骤(110~130):
[0029]步骤110,获取第一音频文件。
[0030]在一些实施例中,第一音频文件可以是歌曲、配音、诗朗诵、有声读物、广播剧等类型的音频。
[0031]在一些实施例中,获取一个或多个第一音频文件。也即,可以对单个音频文件进行音色制作;也可以对多个音频文件同时进行音色制作,从而提升音色制作效率。
[0032]在一些实施例中,第一音频文件可以是通过有线或无线传输(如网络连接)获取到的音频文件。在一些实施例中,该方法应用于终端设备的目标应用程序中(如目标应用程序的客户端)。该目标应用程序可以是音频类应用程序,如音乐制作应用程序、音频播放应用程序、音频直播应用程序、K歌应用程序等,本申请实施例对此不作具体限定。该目标应用程
序还可以是社交应用程序、支付应用程序、视频应用程序、购物应用程序、新闻应用程序、游戏应用程序等任何具有音频处理功能的应用程序。在一些实施例中,第一音频文件可以是通过目标应用程序的客户端录制和/或制作得到的音频文件。
[0033]步骤120,提取第一音频文件的音频特征。
[0034]在一些实施例中,第一音频文件中包括任意用户发出的语音内容,从第一音频文件中提取出该用户发出的语音内容的音频特征。
[0035]在一些实施例中,音频特征包括以下至少之一:
[0036]音素特征,用于表征第一音频文件中的音频内容的音素信息;
[0037]音高特征,用于表征第一音频文件中的音频内容的音高信息。
[0038]其中,音素是指是根据语音的自然属性划分出来的最小语音单位,是从音质的角度划分出来的最小的线性的语音单位。音素是具体存在的物理现象。依据音节里的发音动作来分析,一个动作构成一个音素。在一些实施例中,音素分为元音与辅音两大类。例如,汉语音节啊(
ā
)只有一个音素,爱(
à
i)有两个音素,代(d
à
i)有三个音素。在一些实施例中,音素信息包括第一音频文件中的音频内容包含的音素、以及各个音素的发音时长,这些特征共同组成了音素特征。例如,有些人发音较为饱满,则在正常语速下,元音对应的音素发音时间就相对较长;又例如,有些人语速较快,发音较为短促,则每个音素的时长都比较短;又例如,受生理音素或生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音频处理方法,其特征在于,所述方法包括:获取第一音频文件;提取所述第一音频文件的音频特征;通过第一用户的声学模型对所述音频特征进行处理,生成第二音频文件;其中,所述第一用户的声学模型是学习有所述第一用户的声学特征的模型,所述第二音频文件具有所述第一用户的音色。2.根据权利要求1所述的方法,其特征在于,所述音频特征包括以下至少之一:音素特征,用于表征所述第一音频文件中的音频内容的音素信息;音高特征,用于表征所述第一音频文件中的音频内容的音高信息。3.根据权利要求1所述的方法,其特征在于,所述通过第一用户的声学模型对所述音频特征进行处理,生成第二音频文件,包括:通过所述第一用户的声学模型对所述音频特征进行处理,生成梅尔频谱;根据所述梅尔频谱,生成所述第二音频文件。4.根据权利要求3所述的方法,其特征在于,所述声学模型包括编码器和解码器;所述通过所述第一用户的声学模型对所述音频特征进行处理,生成梅尔频谱,包括:通过所述编码器对所述音频特征中的音素特征进行处理,得到编码后的音素特征;其中,所述音素特征用于表征所述第一音频文件中的音频内容的音素信息;将所述编码后的音素特征与所述音频特征中的音高特征进行融合,得到融合特征;通过所述解码器对所述融合特征进行处理,得到所述梅尔频谱。5.根据权利要求4所述的方法,其特征在于,所述将所述编码后的音素特征与所述音频特征中的音高特征进行融合,得到融合特征之后,还包括:从所述融合特征中截取设定长度的切片特征;其中,所述切片特征用于作为所述解码器的输入,得到所述梅尔频谱。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取所述第一用户的声纹特征;所述通过所述解码器对所述融合特征进行处理,得到所述梅尔频谱,包括:通过所述解码器对所述融合特征和第一用户的声纹特征进行处理,得到所述梅尔频谱。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述第一用户的音频文件,所述第一用户的音频...

【专利技术属性】
技术研发人员:孙洪文陈传艺吴东海劳振锋关迪聆
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1