一种音频的相似度确定方法及相关装置制造方法及图纸

技术编号：43308234 阅读：0 留言：0更新日期：2024-11-12 16:25

本申请公开了一种音频的相似度确定方法及相关装置，涉及数据处理技术领域。该方法首先确定目标音频的音频特征分别与预设音频库中至少一个音频的音频特征的音频相似度，确定目标音频的文本特征分别与至少一个音频的文本特征的文本相似度，基于音频相似度和文本相似度，确定目标音频分别与所述至少一个音频的相似度。音频特征是从音频中分离出的纯音乐音频的特征，文本特征是从音频中分离出的人声音频对应的文本的含义文本的特征，音频特征和文本特征均是音频本身的客观属性，能够反映各音频之间的内在联系。因此，综合考虑音频特征和文本特征，有利于提高音频的相似度的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种音频的相似度确定方法及相关装置。

技术介绍

1、随着互联网和数字技术的飞速发展，海量音频资源广泛传播。这些音频不仅数量庞大，而且内容多样化，为了有效利用这些音频，很多场景下需要确定音频的相似度。

2、目前，一般通过各音频的作者或者所属分类确定各音频之间的相似度。

3、但是，作者的音频风格可能会随着时间发生变化，并且分类标准往往具有一定的主观性，使得目前的音频相似度确定方法存在较大的局限性，从而导致相似度的准确性较差。

技术实现思路

1、鉴于上述问题，本申请提供了一种音频的相似度确定方法及相关装置，为了提高音频的相似度的准确性。具体方案如下：

2、本申请第一方面提供一种音频的相似度确定方法，包括：

3、确定目标音频的音频特征分别与预设音频库中至少一个音频的音频特征的音频相似度，所述音频特征是从音频中分离出的纯音乐音频的特征；

4、获得从音频中分离出的人声音频对应的文本；

5、对所述文本进行语义分析，得到所述文本的含义文本；

6、获得所述含义文本的特征，并将所述含义文本的特征作为所述音频的文本特征；

7、确定所述目标音频的文本特征分别与所述至少一个音频的文本特征的文本相似度；

8、基于所述音频相似度和所述文本相似度，确定所述目标音频分别与所述至少一个音频的相似度。

9、在一种可能的实现中，在所述基于所述音频相似度和所述文本相似度，确定所

10、基于所述相似度对所述至少一个音频进行排序，得到排序后的至少一个音频；

11、将所述排序后的至少一个音频推荐至用户。

12、在一种可能的实现中，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

13、对所述文本进行分词得到分词结果；

14、对所述分词结果进行预处理，得到多个关键词和关键词顺序；

15、通过预设字典获取各所述关键词的含义文本；

16、将各所述关键词的含义文本按照所述关键词顺序进行组合，得到所述文本的含义文本。

17、在一种可能的实现中，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

18、对所述文本进行分词得到分词结果；

19、对所述分词结果进行预处理，得到多个关键词和所述关键词的词性；

20、通过预设字典获取各所述关键词的含义文本；

21、将各所述关键词的含义文本按照各所述关键词的词性进行组合，得到所述文本的含义文本。

22、在一种可能的实现中，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

23、将所述文本输入至预先训练好的含义文本提取模型，得到所述文本的含义文本。

24、在一种可能的实现中，所述含义文本提取模型的训练过程包括：

25、获得多个带有含义文本标签的训练样本，每个所述训练样本包括多个历史文本；

26、使用多个所述训练样本对初始模型进行训练，得到所述含义文本提取模型，其中，所述含义文本提取模型的输入为所述文本，所述含义文本提取模型的输出为所述文本的含义文本。

27、本申请第二方面提供一种音频的相似度确定装置，其特征在于，包括：

28、第一确定单元，用于确定目标音频的音频特征分别与预设音频库中至少一个音频的音频特征的音频相似度，所述音频特征是从音频中分离出的纯音乐音频的特征；

29、第一获得单元，用于获得从音频中分离出的人声音频对应的文本；

30、语义分析单元，用于对所述文本进行语义分析，得到所述文本的含义文本；

31、第二获得单元，用于获得所述含义文本的特征，并将所述含义文本的特征作为所述音频的文本特征；

32、第二确定单元，用于确定所述目标音频的文本特征分别与所述至少一个音频的文本特征的文本相似度；

33、第三确定单元，用于基于所述音频相似度和所述文本相似度，确定所述目标音频分别与所述至少一个音频的相似度。

34、本申请第三方面提供一种计算机程序产品，包括计算机可读指令，当所述计算机可读指令在电子设备上运行时，使得所述电子设备实现上述第一方面或第一方面任一实现方式的音频的相似度确定方法。

35、本申请第四方面提供一种电子设备，包括至少一个处理器和与所述处理器连接的存储器，其中：

36、所述存储器用于存储计算机程序；

37、所述处理器用于执行所述计算机程序，以使所述电子设备能够实现上述第一方面或第一方面任一实现方式的音频的相似度确定方法。

38、本申请第五方面提供一种计算机存储介质，所述存储介质承载有一个或多个计算机程序，当所述一个或多个计算机程序被电子设备执行时，能够使所述电子设备上述第一方面或第一方面任一实现方式的音频的相似度确定方法。

39、借由上述技术方案，本申请提供的一种音频的相似度确定方法及相关装置。该方法首先确定目标音频的音频特征分别与预设音频库中至少一个音频的音频特征的音频相似度，确定目标音频的文本特征分别与至少一个音频的文本特征的文本相似度，基于音频相似度和文本相似度，确定目标音频分别与所述至少一个音频的相似度。音频特征是从音频中分离出的纯音乐音频的特征，文本特征是从音频中分离出的人声音频对应的文本的含义文本的特征，音频特征和文本特征均是音频本身的客观属性，能够反映各音频之间的内在联系。因此，综合考虑音频特征和文本特征，有利于提高音频的相似度的准确性。

本文档来自技高网...

【技术保护点】

1.一种音频的相似度确定方法，其特征在于，包括：

2.根据权利要求1所述的音频的相似度确定方法，其特征在于，在所述基于所述音频相似度和所述文本相似度，确定所述目标音频分别与所述至少一个音频的相似度之后，所述方法还包括：

3.根据权利要求1所述的音频的相似度确定方法，其特征在于，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

4.根据权利要求1所述的音频的相似度确定方法，其特征在于，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

5.根据权利要求1所述的音频的相似度确定方法，其特征在于，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

6.根据权利要求5所述的音频的相似度确定方法，其特征在于，所述含义文本提取模型的训练过程包括：

7.一种音频的相似度确定装置，其特征在于，包括：

8.一种计算机程序产品，其特征在于，包括计算机可读指令，当所述计算机可读指令在电子设备上运行时，使得所述电子设备实现如权利要求1至6中任意一项所述的音频的相似度确定方法。

9.一

10.一种计算机存储介质，其特征在于，所述存储介质承载有一个或多个计算机程序，当所述一个或多个计算机程序被电子设备执行时，能够使所述电子设备实现如权利要求1至6中任意一项所述的音频的相似度确定方法。

...

【技术特征摘要】

1.一种音频的相似度确定方法，其特征在于，包括：

3.根据权利要求1所述的音频的相似度确定方法，其特征在于，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

4.根据权利要求1所述的音频的相似度确定方法，其特征在于，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

5.根据权利要求1所述的音频的相似度确定方法，其特征在于，所述对所述文本进行语义分析，得到所述文本的含义文本，包括：

6.根据...

【专利技术属性】
技术研发人员：王运航，孙铭鸿，孙礼鑫，郭玉杰，
申请(专利权)人：长城汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人