音频推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35739477 阅读:7 留言:0更新日期:2022-11-26 18:42
本公开关于一种音频推荐方法、装置、电子设备及存储介质,所述方法包括:确定待处理文本的目标类别;根据预设映射关系,确定与所述目标类别匹配的音频信息集,得到候选音频信息集;所述预设映射关系表征类别与音频信息集的对应关系;从所述候选音频信息集中筛选出,与所述待处理文本的目标文本特征匹配的候选音频信息,作为目标音频信息;向目标账户推荐所述目标音频信息,所述目标账户为所述待处理文本对应的账户。本公开提高了文本与音频的匹配效率,提高向待处理文本对应的目标账户推送音频信息的准确率。频信息的准确率。频信息的准确率。

【技术实现步骤摘要】
音频推荐方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种音频推荐方法、装置、电子设备及存储介质。

技术介绍

[0002]相关技术中,在短视频平台上有许多以文案为主的视频,例如小说片段朗读、简短新闻播报等。这类短视频创作者在创作时,需要人工选择与文字相匹配的音频,降低了音频与文本的匹配效率,从而降低了向文本对应的目标账户推送音频的准确率。

技术实现思路

[0003]本公开提供一种音频推荐方法、装置、电子设备及存储介质,以至少解决相关技术中文本与音频匹配效率低下的问题。本公开的技术方案如下:
[0004]根据本公开实施例的第一方面,提供一种音频推荐方法,包括:
[0005]确定待处理文本的目标类别;
[0006]根据预设映射关系,确定与所述目标类别匹配的音频信息集,得到候选音频信息集;所述预设映射关系表征类别与音频信息集的对应关系;
[0007]从所述候选音频信息集中筛选出,与所述待处理文本的目标文本特征匹配的候选音频信息,作为目标音频信息;
[0008]向目标账户推荐所述目标音频信息,所述目标账户为所述待处理文本对应的账户。
[0009]在一示例性的实施方式中,所述预设映射关系的构建方法包括:
[0010]获取至少两个音频信息;
[0011]根据所述至少两个音频信息各自对应的类别,确定每个类别对应的音频信息集;
[0012]根据所述每个类别对应的音频信息集,构建所述预设映射关系。
[0013]在一示例性的实施方式中,所述根据所述每个类别对应的音频信息集,构建所述预设映射关系,包括:
[0014]确定每个音频信息集中各个音频信息的关注度参数;每个音频信息的关注度参数表征每个音频信息的被关注程度;
[0015]将每个音频信息集中关注度参数大于预设参数阈值的音频信息,确定为热点音频信息,得到每个类别对应的热点音频信息集;
[0016]根据所述每个类别对应的热点音频信息集,构建所述预设映射关系;
[0017]所述根据预设映射关系,确定与所述目标类别匹配的音频信息集,得到候选音频信息集,包括:
[0018]根据所述预设映射关系,确定与所述目标类别匹配的热点音频信息集,得到所述候选音频信息集。
[0019]在一示例性的实施方式中,所述从所述候选音频信息集中筛选出,与所述待处理
文本的目标文本特征匹配的候选音频信息,作为目标音频信息,包括:
[0020]提取所述候选音频信息集中每个候选音频信息的音频特征,得到候选音频特征集;
[0021]提取所述待处理文本中的文本特征,得到所述目标文本特征;
[0022]计算所述目标文本特征与所述候选音频特征集中每个候选音频特征之间的特征相似度,得到每个候选音频特征对应的相似度;
[0023]将目标候选音频特征所对应的候选音频信息,确定为所述目标音频信息;所述目标候选音频特征为所述候选音频特征集中,相似度大于预设阈值的候选音频特征。
[0024]在一示例性的实施方式中,所述将目标候选音频特征所对应的候选音频信息,确定为所述目标音频信息,包括:
[0025]将所述目标候选音频特征所对应的候选音频信息,确定为初筛音频信息;
[0026]确定所述待处理文本对应的目标情绪类别;
[0027]将与所述目标情绪类别匹配的初筛音频信息,确定为所述目标音频信息。
[0028]在一示例性的实施方式中,所述从所述候选音频信息集中筛选出,与所述待处理文本的目标文本特征匹配的候选音频信息,作为目标音频信息,包括:
[0029]将所述待处理文本以及所述候选音频信息集,输入文本音频匹配模型中,进行文本音频匹配处理,得到所述目标音频信息。
[0030]在一示例性的实施方式中,所述文本音频匹配模型包括文本特征提取模型、音频特征提取模型以及多模召回模型,所述将所述待处理文本以及所述候选音频信息集,输入文本音频匹配模型中,进行文本音频匹配处理,得到所述目标音频信息,包括:
[0031]将所述待处理文本输入所述文本特征提取模型,进行文本特征提取处理,得到所述待处理文本对应的目标文本特征;
[0032]将所述候选音频信息集输入所述音频特征提取模型,进行音频特征提取处理,得到候选音频特征集;所述候选音频特征集包括所述候选音频信息集中每个候选音频信息对应的候选音频特征;
[0033]将所述目标文本特征以及所述候选音频特征集输入所述多模召回模型,进行音频信息召回处理,得到所述目标音频信息。
[0034]在一示例性的实施方式中,所述文本音频匹配模型的训练方法包括:
[0035]确定样本文本以及样本音频信息集;所述样本音频信息集为与所述样本文本对应的样本类别,相匹配的音频信息集;所述样本文本标注了样本情绪类别标签以及样本音频信息标签;所述样本情绪类别为所述样本文本对应的情绪类别;
[0036]将所述样本文本以及所述样本音频信息集,输入预设双塔模型,得到输出结果;
[0037]根据所述样本情绪类别标签、所述样本音频信息标签与所述输出结果之间的差异,对所述预设双塔模型进行训练,得到所述文本音频匹配模型。
[0038]在一示例性的实施方式中,所述方法还包括:
[0039]根据所述待处理文本以及所述目标音频信息,生成视频信息;
[0040]向所述目标账户推荐所述视频信息。
[0041]在一示例性的实施方式中,所述根据所述待处理文本以及所述目标音频信息,生成视频信息,包括:
[0042]确定所述待处理文本的文本长度;
[0043]根据所述待处理文本的文本长度,确定所述待处理文本的第一播放时长;
[0044]获取所述目标音频信息的第二播放时长;
[0045]当所述第一播放时长大于所述第二播放时长时,根据至少两个所述目标音频信息生成第一待合成音频信息;
[0046]将所述待处理文本以及所述第一待合成音频信息,合成所述视频信息。
[0047]在一示例性的实施方式中,所述方法还包括:
[0048]当所述第一播放时长小于所述第二播放时长时,计算所述第一播放时长与所述第二播放时长的时长差值;
[0049]确定所述目标音频信息中的目标音频片段,所述目标音频片段为所述目标音频信息中位于预设位置的片段;
[0050]删除所述目标音频信息中播放时长为所述时长差值的非目标音频片段,得到第二待合成音频信息;
[0051]将所述待处理文本以及所述第二待合成音频信息,合成所述视频信息。
[0052]在一示例性的实施方式中,所述将所述待处理文本以及所述第二待合成音频信息,合成所述视频信息,包括:
[0053]确定所述第二待合成音频信息中的第一目标音频以及第二目标音频,所述第一目标音频为播放音量大于第一音量阈值的音频信息,所述第二目标音频为播放音量小于第二音量阈值的音频信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频推荐方法,其特征在于,包括:确定待处理文本的目标类别;根据预设映射关系,确定与所述目标类别匹配的音频信息集,得到候选音频信息集;所述预设映射关系表征类别与音频信息集的对应关系;从所述候选音频信息集中筛选出,与所述待处理文本的目标文本特征匹配的候选音频信息,作为目标音频信息;向目标账户推荐所述目标音频信息,所述目标账户为所述待处理文本对应的账户。2.根据权利要求1所述的方法,其特征在于,所述预设映射关系的构建方法包括:获取至少两个音频信息;根据所述至少两个音频信息各自对应的类别,确定每个类别对应的音频信息集;根据所述每个类别对应的音频信息集,构建所述预设映射关系。3.根据权利要求2所述的方法,其特征在于,所述根据所述每个类别对应的音频信息集,构建所述预设映射关系,包括:确定每个音频信息集中各个音频信息的关注度参数;每个音频信息的关注度参数表征每个音频信息的被关注程度;将每个音频信息集中关注度参数大于预设参数阈值的音频信息,确定为热点音频信息,得到每个类别对应的热点音频信息集;根据所述每个类别对应的热点音频信息集,构建所述预设映射关系;所述根据预设映射关系,确定与所述目标类别匹配的音频信息集,得到候选音频信息集,包括:根据所述预设映射关系,确定与所述目标类别匹配的热点音频信息集,得到所述候选音频信息集。4.根据权利要求1所述的方法,其特征在于,所述从所述候选音频信息集中筛选出,与所述待处理文本的目标文本特征匹配的候选音频信息,作为目标音频信息,包括:提取所述候选音频信息集中每个候选音频信息的音频特征,得到候选音频特征集;提取所述待处理文本中的文本特征,得到所述目标文本特征;计算所述目标文本特征与所述候选音频特征集中每个候选音频特征之间的特征相似度,得到每个候选音频特征对应的相似度;将目标候选音频特征所对应的候选音频信息,确定为所述目标音频信息;所述目标候选音频特征为所述候选音频特征集中,相似度大于预设阈值的候选音频特征。5.根据权利要求4所述的方法,其特征在于,所述将目标候选音频特征所对应的候选音频信息,确定为所述目标音频信息,包括:将所述目标候选音频特征所对应的候选音频信息,确定为初筛音频信息;确定所述待处理文本对应的目标情绪类别;将与所述目标情绪类别匹配的初筛音频信息,确定为所述目标音频信息。6.根据权利要求1所述的方法,其特征在于,所述从所述候选音频信息集中筛选出,与所述待处理文本的目标文本特征匹配的候选音频信息,作为目标音频信息,包括:将所述待处理文本以及所述候选音频信息集,输入文本音频匹配模型中,进行文本音频匹配处理,得到所述目标音频信息。
7.根据权利要求6所述的方法,其特征在于,所述文本音频匹配模型包括文本特征提取模型、音频特征提取模型以及多模召回模型,所述将所述待处理文本以及所述候选音频信息集,输入文本音频匹配模型中,进行文本音频匹配处理,得到所述目标音频信息,包括:将所述待处理文本输入所述文本特征提取模型,进行文本特征提取处理,得到所述待处理文本对应的目标文本特征;将所述候选音频信息集输入所述音频特征提取模型,进行音频特征提取处理,得到候选音频特征集;所述候选音频特征集包括所述候选音频信息集中每个候选音频信息对应的候选音频特征;将所述目标文本特征以及所述候选音频特征集输入所述多模召回模型,进行音频信息召回处理,得到所述目标音频信息。8.根据权利要求6或7所述的方法,其特征在于,所述文本音频匹配模型的训练方法包括:确定样本文本以及样本音频信息集;所述样本音频信息集为与所述样本文本对应的样本类别,相匹配的音频信息集;所述样本文本标注了样本情绪类别标签以及样本音频信息标签;所述样本情绪类别为所述样本...

【专利技术属性】
技术研发人员:陈珺闽
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1