一种获取人声音高数据的方法和装置制造方法及图纸

技术编号：14058474 阅读：90 留言：0更新日期：2016-11-27 11:27

本发明专利技术公开了一种获取人声音高数据的方法和装置，属于计算机技术领域。所述方法包括：提取目标歌曲的原唱歌曲音频的人声音高数据，并分别提取所述目标歌曲的多个人声音频的人声音高数据；在所述多个人声音频的人声音高数据中，选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据；基于所述目标人声音高数据，对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充，得到所述原唱歌曲音频的修正后的人声音高数据。采用本发明专利技术，可以提高获取的人声音高数据的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别涉及一种获取人声音高数据的方法和装置。
技术介绍
随着计算机技术的发展，歌唱类应用程序得到了广泛的应用。很多歌唱类应用程序为用户提供了歌唱打分功能。歌唱类应用程序进行歌唱打分的过程是：在原唱歌曲音频(由原唱人声音频和伴奏音频组成)中提取人声音高数据，并在用户歌唱的人声音频中提取人声音高数据，将分别提取的人声音高数据进行对比，基于它们之间的匹配度，确定打分的分值。其中，人声音高数据是音频中不同时间点处的人声音高，一般可以用频率来表示，即音频中提取出来的人声音高数据可以是一组频率数据。在实现本专利技术的过程中，专利技术人发现现有技术至少存在以下问题：原唱歌曲音频由原唱人声音频和伴奏音频两部分组成，由于唱片公司提供的原唱歌曲音频中这两部分一般是混合好的，无法分离，所以，无法单独在原唱人声音频中提取人声音高数据，只能在混合好的原唱歌曲音频中提取人声音高数据，而由于原唱歌曲音频中混有伴奏音频，这就会影响人声音高数据的提取准确度，人声音高数据准确度受影响最突出的一种表现形式是音高丢失，即原唱歌曲音频中某个时间点实际存在人声歌唱，可是提取出来的人声音高数据在此时间点的音高值为0。在原唱歌曲音频中提取的人声音高数据的音高丢失率比较高，其中，缺少很多音高值，从而，在原唱歌曲音频中提取的人声音高数据的准确度较差。
技术实现思路
为了解决现有技术的问题，本专利技术实施例提供了一种获取人声音高数据的方法和装置。所述技术方案如下：第一方面，提供了一种获取人声音高数据的方法，所述方法包括：提取目标歌曲的原唱歌曲音频的人声音高数据，并分别提取所述目标歌曲...

【技术保护点】
一种获取人声音高数据的方法，其特征在于，所述方法包括：提取目标歌曲的原唱歌曲音频的人声音高数据，并分别提取所述目标歌曲的多个人声音频的人声音高数据；在所述多个人声音频的人声音高数据中，选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据；基于所述目标人声音高数据，对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充，得到所述原唱歌曲音频的修正后的人声音高数据。

【技术特征摘要】
1.一种获取人声音高数据的方法，其特征在于，所述方法包括：提取目标歌曲的原唱歌曲音频的人声音高数据，并分别提取所述目标歌曲的多个人声音频的人声音高数据；在所述多个人声音频的人声音高数据中，选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据；基于所述目标人声音高数据，对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充，得到所述原唱歌曲音频的修正后的人声音高数据。2.根据权利要求1所述的方法，其特征在于，所述在所述多个人声音频的人声音高数据中，选取与所述原唱歌曲音频的人声音高数据匹配度最高的目标人声音高数据，包括：确定所述多个人声音频的人声音高数据中每个人声音高数据，与所述原唱歌曲音频的人声音高数据之间的数据距离；在所述多个人声音频的人声音高数据中，选取对应数据距离最小的目标人声音高数据。3.根据权利要求2所述的方法，其特征在于，所述在所述多个人声音频的人声音高数据中，选取对应数据距离最小的目标人声音高数据，包括：如果确定出的数据距离中存在小于预设阈值的数据距离，则在所述多个人声音频的人声音高数据中，选取对应数据距离最小的目标人声音高数据。4.根据权利要求2所述的方法，其特征在于，所述数据距离为范数距离、欧式距离或余弦距离。5.根据权利要求1所述的方法，其特征在于，所述基于所述目标人声音高数据，对所述原唱歌曲音频的人声音高数据中丢失的音高值进行补充，得到所述原唱歌曲音频的修正后的人声音高数据，包括：在所述原唱歌曲音频的人声音高数据所对应的各时间点中，确定包含于所述目标歌曲的歌词时间段内、且在所述原唱歌曲音频的人声音高数据中对应的音高值为0的目标时间点；将所述原唱歌曲音频的人声音高数据中所述目标时间点对应的音高值，替换为所述目标人声音高数据中所述目标时间点对应的音高值，得到所述原唱歌曲音频的修正后的人声音高数据。6.根据权利要求1所述的方法，其特征在于，所述提取目标歌曲的原唱歌曲音频的人声音高数据，并分别提取所述目标歌曲的多个人声音频的人声音高数据，包括：通过多音部音高提取算法，提取目标歌曲的原唱歌曲音频的人声音高数据，并通过单音部音高提取算法，分别提取所述...

【专利技术属性】
技术研发人员：张超钢，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人