本发明专利技术公开了一种获取人声音高数据的方法和装置,属于计算机技术领域。所述方法包括:提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据;在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据;基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据。采用本发明专利技术,可以提高获取的人声音高数据的准确度。
【技术实现步骤摘要】
本专利技术涉及计算机
,特别涉及一种获取人声音高数据的方法和装置。
技术介绍
随着计算机技术的发展,歌唱类应用程序得到了广泛的应用。很多歌唱类应用程序为用户提供了歌唱打分功能。歌唱类应用程序进行歌唱打分的过程是:在原唱歌曲音频(由原唱人声音频和伴奏音频组成)中提取人声音高数据,并在用户歌唱的人声音频中提取人声音高数据,将分别提取的人声音高数据进行对比,基于它们之间的匹配度,确定打分的分值。其中,人声音高数据是音频中不同时间点处的人声音高,一般可以用频率来表示,即音频中提取出来的人声音高数据可以是一组频率数据。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:原唱歌曲音频由原唱人声音频和伴奏音频两部分组成,由于唱片公司提供的原唱歌曲音频中这两部分一般是混合好的,无法分离,所以,无法单独在原唱人声音频中提取人声音高数据,只能在混合好的原唱歌曲音频中提取人声音高数据,而由于原唱歌曲音频中混有伴奏音频,这就会影响人声音高数据的提取准确度,人声音高数据准确度受影响最突出的一种表现形式是音高丢失,即原唱歌曲音频中某个时间点实际存在人声歌唱,可是提取出来的人声音高数据在此时间点的音高值为0。在原唱歌曲音频中提取的人声音高数据的音高丢失率比较高,其中,缺少很多音高值,从而,在原唱歌曲音频中提取的人声音高数据的准确度较差。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种获取人声音高数据的方法和装置。所述技术方案如下:第一方面,提供了一种获取人声音高数据的方法,所述方法包括:提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据;在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据;基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据。可选的,所述在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据,包括:确定所述多个人声音频的人声音高数据中每个人声音高数据,与所述原唱歌曲音频的人声音高数据之间的数据距离;在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据。这样,通过数据距离确定人声音高数据之间的匹配度,可以使匹配度计算更精确。可选的,所述在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据,包括:如果确定出的数据距离中存在小于预设阈值的数据距离,则在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据。这样,可以保证选取的目标人声音高数据与原唱歌曲音频的人声音高数据,具有足够的匹配度,可以提高修正后的人声音高数据的准确性。可选的,所述数据距离为范数距离、欧式距离或余弦距离。可选的,所述基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据,包括:在所述原唱歌曲音频的人声音高数据所对应的各时间点中,确定包含于所述目标歌曲的歌词时间段内、且在所述原唱歌曲音频的人声音高数据中对应的音高值为0的目标时间点;将所述原唱歌曲音频的人声音高数据中所述目标时间点对应的音高值,替换为所述目标人声音高数据中所述目标时间点对应的音高值,得到所述原唱歌曲音频的修正后的人声音高数据。这样,可以更准确的确定原唱歌曲音频的人声音高数据中丢失音高值的时间点。可选的,所述提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据,包括:通过多音部音高提取算法,提取目标歌曲的原唱歌曲音频的人声音高数据,并通过单音部音高提取算法,分别提取所述目标歌曲的多个人声音频的人声音高数据。可选的,所述方法还包括:接收多个终端分别上传的所述目标歌曲的多个人声音频。这样,可以获取到更多人声音频,有助于提高选取的目标人声音高数据与原唱歌曲音频的人声音高数据的匹配度。第二方面,提供了一种获取人声音高数据的装置,所述装置包括:提取模块,用于提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据;选取模块,用于在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据;修正模块,用于基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据。可选的,所述选取模块,用于:确定所述多个人声音频的人声音高数据中每个人声音高数据,与所述原唱歌曲音频的人声音高数据之间的数据距离;在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据。可选的,所述选取模块,用于:如果确定出的数据距离中存在小于预设阈值的数据距离,则在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据。可选的,所述数据距离为范数距离、欧式距离或余弦距离。可选的,所述修正模块,用于:在所述原唱歌曲音频的人声音高数据所对应的各时间点中,确定包含于所述目标歌曲的歌词时间段内、且在所述原唱歌曲音频的人声音高数据中对应的音高值为0的目标时间点;将所述原唱歌曲音频的人声音高数据中所述目标时间点对应的音高值,替换为所述目标人声音高数据中所述目标时间点对应的音高值,得到所述原唱歌曲音频的修正后的人声音高数据。可选的,所述提取模块,用于:通过多音部音高提取算法,提取目标歌曲的原唱歌曲音频的人声音高数据,并通过单音部音高提取算法,分别提取所述目标歌曲的多个人声音频的人声音高数据。可选的,所述装置还包括:接收模块,用于接收多个终端分别上传的所述目标歌曲的多个人声音频。本专利技术实施例提供的技术方案带来的有益效果是:本专利技术实施例中,提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取目标歌曲的多个人声音频的人声音高数据,在多个人声音频的人声音高数据中,选取与原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据,基于目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到原唱歌曲音频的修正后的人声音高数据。这样,可以通过人声音频的人声音高数据,对原唱歌曲音频的人声音高数据进行丢失音高值的补偿,从而,可以提高获取的人声音高数据的准确度。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种获取人声音高数据的方法的流程示意图;图2A是本专利技术实施例提供的原唱歌曲音频的人声音高数据的示意图;图2B是本专利技术实施例提供的目标人声音高数据的示意图;图2C是本专利技术实施例提供的修正后的人声音高数据的示意图;图3是本专利技术实施例提供的一种获取人声音高数据的装置的结构示意图;图4是本专利技术实施例提供的一种服务器的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本专利技术实施例提供了一种获取人本文档来自技高网...
【技术保护点】
一种获取人声音高数据的方法,其特征在于,所述方法包括:提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据;在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据;基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据。
【技术特征摘要】
1.一种获取人声音高数据的方法,其特征在于,所述方法包括:提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据;在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据;基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据。2.根据权利要求1所述的方法,其特征在于,所述在所述多个人声音频的人声音高数据中,选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据,包括:确定所述多个人声音频的人声音高数据中每个人声音高数据,与所述原唱歌曲音频的人声音高数据之间的数据距离;在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据。3.根据权利要求2所述的方法,其特征在于,所述在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据,包括:如果确定出的数据距离中存在小于预设阈值的数据距离,则在所述多个人声音频的人声音高数据中,选取对应数据距离最小的目标人声音高数据。4.根据权利要求2所述的方法,其特征在于,所述数据距离为范数距离、欧式距离或余弦距离。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标人声音高数据,对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充,得到所述原唱歌曲音频的修正后的人声音高数据,包括:在所述原唱歌曲音频的人声音高数据所对应的各时间点中,确定包含于所述目标歌曲的歌词时间段内、且在所述原唱歌曲音频的人声音高数据中对应的音高值为0的目标时间点;将所述原唱歌曲音频的人声音高数据中所述目标时间点对应的音高值,替换为所述目标人声音高数据中所述目标时间点对应的音高值,得到所述原唱歌曲音频的修正后的人声音高数据。6.根据权利要求1所述的方法,其特征在于,所述提取目标歌曲的原唱歌曲音频的人声音高数据,并分别提取所述目标歌曲的多个人声音频的人声音高数据,包括:通过多音部音高提取算法,提取目标歌曲的原唱歌曲音频的人声音高数据,并通过单音部音高提取算法,分别提取所述...
【专利技术属性】
技术研发人员:张超钢,
申请(专利权)人:广州酷狗计算机科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。