【技术实现步骤摘要】
音频合成方法、装置、电子设备和计算机可读存储介质
[0001]本专利技术涉及音频处理领域,具体涉及一种音频合成方法、装置、电子设备和计算机可读存储介质。
技术介绍
[0002]近年来,随着互联网技术的飞速发展,音频处理的方式也越来越多样化。比如,可以将同一首音乐的不同版本的音频数据进行合成,从而得到这首音乐的合唱版本的音频数据。现有的音乐合成方法可以采用人工合成的方式,或者,将不同的音频数据进行对齐,从而得到合成的音频数据。
[0003]在对相关技术的研究和实践过程中,本申请的专利技术人发现采用人工合成的方式太过于依赖人工对于歌曲或者歌曲中人声音轨的细微差别的感知度,可能存在主观上的差异,而直接将音频数据进行对齐的话,往往会受到伴奏的干扰,影响音频数据的对齐效果,因此,导致音频合成的准确度较低。
技术实现思路
[0004]本专利技术实施例提供一种音频合成方法、装置、电子设备和计算机可读存储介质,可以提高音频合成的准确度。
[0005]一种音频合成方法,包括:获取目标音乐对应的至少两个原始音频数据;对所述原始音频数据进行信源分离,得到每一原始音频数据的对象音轨特征和伴奏音轨特征;计算所述对象音轨特征之间的特征相关度,所述特征相关度表征不同对象音轨特征对应的对象音轨中不同时间点之间的关联程度;基于所述特征相关度,对所述对象音轨特征进行特征对齐,得到对齐后的对象音轨特征;将所述对齐后的对象音轨特征与所述伴奏音轨特征进行融合,得到所述目标音乐对应的合成音频数据。
[0006]相应的,本 ...
【技术保护点】
【技术特征摘要】
1.一种音频合成方法,其特征在于,包括:获取目标音乐对应的至少两个原始音频数据;对所述原始音频数据进行信源分离,得到每一原始音频数据的对象音轨特征和伴奏音轨特征;计算所述对象音轨特征之间的特征相关度,所述特征相关度表征不同对象音轨特征对应的对象音轨中不同时间点之间的关联程度;基于所述特征相关度,对所述对象音轨特征进行特征对齐,得到对齐后的对象音轨特征;将所述对齐后的对象音轨特征与所述伴奏音轨特征进行融合,得到所述目标音乐对应的合成音频数据。2.根据权利要求1所述的音频合成方法,其特征在于,所述计算所述对象音轨特征之间的特征相关度,包括:确定不同原始音频数据的所述伴奏音轨特征之间的特征相似度;当所述特征相似度大于或等于预设相似度阈值时,计算所述对象音轨特征之间的特征相关度;当所述特征相似度小于所述预设相似度阈值时,将所述伴奏音轨特征进行对齐,将对齐后的伴奏音轨特征作为所述伴奏音轨特征,并计算所述对象音轨特征之间的特征相关度。3.根据权利要求2所述的音频合成方法,其特征在于,所述计算所述对象音轨特征之间的特征相关度,包括:在所述对象音轨特征中确定出目标对象音轨特征;构建至少一个目标特征对,所述目标特征对包括所述目标对象音轨特征和所述对象音轨特征中除所述目标对象音轨特征以外的对象音轨特征;计算所述目标特征对中的对象音轨特征之间的特征相关度。4.根据权利要求3所述的音频合成方法,其特征在于,所述计算所述目标特征对中的对象音轨特征之间的特征相关度,包括:在所述目标特征对中提取出每一对象音轨特征的关联特征;根据所述关联特征,确定所述目标特征对中每一对象音轨特征的注意力权重;基于所述注意力权重,生成所述目标特征对对应的特征相关度。5.根据权利要求4所述音频合成方法,其特征在于,所述对象音轨特征包括至少一个对象音轨子特征,所述基于所述注意力权重,生成所述目标特征对对应的特征相关度,包括:基于所述注意力权重,确定所述目标特征对中不同对象音轨特征的对象音轨子特征之间的特征距离;将所述特征距离作为所述目标特征对中不同对象音轨特征的对象音轨子特征之间的初始特征相关度;将所述初始特征相关度进行组合,得到所述目标特征对对应的特征相关度。6.根据权利要求2所述的音频合成方法,其特征在于,所述基于所述特征相关度,对所述对象音轨特征进行特征对齐,得到对齐后的对象音轨特征,包括:在所述目标特征对的对象音轨特征中筛选出符合静音条件的对象音轨子特征,得到静
音特征;基于所述静音特征对所述特征相关度进行修正,得到目标特征相关度;根据所述目标特征相关度,对所述目标特征对中的对象音轨特征进行对齐,得到对齐后的对象音轨特征。7.根据权利要求6所述的音频合成方法,其特征在于,所述基于所述静音特征对所述特征相关度进行修正,得到目标特征相关度,包括:在所述特征相关度中筛选出所述静音特征对应的初始特征相关度,得到候选特征相关度;在所述特征相关度中剔除所述候选特征相关度,得到目标特征相关度。8.根据权利要求6所述的音频合成方法,其特征在于,所述根据所述目标特征相关度,对所述目标特征对中的对象音轨特征进行对齐,得到对齐后的对象音轨特征,包括:在所述目标特征对中提取出目标对象音轨特征以外的对象音轨特征,得到当前对象音轨特征;基于所述目标特征相关度,对所述当前对象音轨特征进行调整,得到调整后对象音轨特征,所述调整后对象音轨特征与所述目标对象音轨特征对齐;将所述调整后对象音轨特征和所述目标对象音轨特征作为对齐后的对象音轨特征。9.根据权利要求8所述的音频合成方法,其特征在于,所述基于所述目标特征相关度,对所述当前对象音轨特征进行调整,得到调整后对象音轨特征,包括:基于所述目标特征相关度,在当前对象音轨特征中筛选出所述目标对象音轨特征中每一对象音轨子特征对应的目标对象音轨子特征;在所述目标特征相关度中提取出所述目标对象音轨子特征对应的初始特征相关度,得到当前特征相关度;根据所述当前特征相关度,确定所述目标对象音轨子特征对应的调整参数,并将所述调整参数与所述目标对象音轨子特征进行融合,得到调整后对象音轨特征。10.根据权利要求1所述的音频合成方法,其特征在于,所述将所述对齐后的对象音轨特征与所述伴奏音轨特征进行融合,得到所述目标音乐对应的合成音频数据,包括:将所述对齐后的对象音轨特征进行特征放大,得到候选对象音轨特征;将所述候选对象音轨特征中多个放大后的对象音轨特征进行拼接,以得到合成对象音轨特征;在所述伴奏音轨...
【专利技术属性】
技术研发人员:冯鑫,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。