确定音高特征的方法、装置、设备及存储介质制造方法及图纸

技术编号:23935864 阅读:15 留言:0更新日期:2020-04-25 03:08
本申请公开了一种确定音高特征的方法、装置、设备及存储介质,属于音频处理技术领域。所述方法包括:提取歌曲中的目标字符的多个第一音高特征值,该目标字符为该歌曲中的任意一个或者多个字符;基于该多个第一音高特征值,确定该目标字符的多个第一MIDI音高值;获取该多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值,得到多个第二MIDI音高值;根据该多个第二MIDI音高值,从该多个第一音高特征值中确定该目标字符的第二音高特征值。本申请确定的第二音高特征值对应的第二音高特征比较可靠,即准确度比较高。

Method, device, equipment and storage medium for determining pitch characteristics

【技术实现步骤摘要】
确定音高特征的方法、装置、设备及存储介质
本申请涉及音频处理
,特别涉及一种确定音高特征的方法、装置、设备及存储介质。
技术介绍
音高特征在语音合成技术中是一项比较重要的特征,其可以直接决定所合成的语音的质量,当音高特征不准确时,将导致所合成的语音中出现杂音,因此,需要能够准确地确定出音高特征。在歌曲中,一个字符的音高特征可能包括多个,所以,如何准确地确定歌曲中的字符的音高特征成为研究的热点。
技术实现思路
本申请实施例提供了一种确定音高特征的方法、装置、设备及存储介质,可以解决如何准确地确定歌曲中的字符的音高特征问题。所述技术方案如下:一方面,提供了一种确定音高特征的方法,所述方法包括:提取歌曲中的目标字符的多个第一音高特征值,所述目标字符为所述歌曲中的任意一个或者多个字符;基于所述多个第一音高特征值,确定所述目标字符的多个第一MIDI音高值;获取所述多个第一MIDI音高值中的时间靠后的指定阈值个属于人声范围内的第一MIDI音高值,得到多个第二MIDI音高值;根据所述多个第二MIDI音高值,从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。在本申请一种可能的实现方式中,所述根据所述多个第二MIDI音高值,从所述多个第一音高特征值中确定所述目标字符的第二音高特征值,包括:根据所述多个第二MIDI音高值,确定所述目标字符的音高范围;将所述多个第一音高特征值中处于所述音高范围内的第一音高特征值确定为所述目标字符的第二音高特征值。在本申请一种可能的实现方式中,所述根据所述多个第二MIDI音高值,确定所述目标字符的音高范围,包括:确定所述多个第二MIDI音高值中的最大值和最小值;将所述最小值作为下限、以及将所述最大值作为上限,确定第一数值范围;从所述多个第一MIDI音高值中筛选属于所述第一数值范围的第一MIDI音高值,得到多个第三MIDI音高值;基于所述多个第三MIDI音高值,确定所述目标字符的音高范围。在本申请一种可能的实现方式中,所述基于所述多个第三MIDI音高值,确定所述目标字符的音高范围,包括:从所述多个第三MIDI音高值中选择数量最多的第三MIDI音高值;将所选择的第三MIDI音高值与第一指定阈值相加,得到第一数值,以及将所选择的第三MIDI音高值与第二指定阈值相减,得到第二数值;将所述第一数值作为上限、以及将所述第二数值作为下限,确定第二数值范围;将所述第二数值范围转换为所述目标字符的音高范围。在本申请一种可能的实现方式中,所述提取歌曲中的目标字符的多个第一音高特征值,包括:从所述目标字符中确定清声部分,所述清声部分是指不包括音高特征的声母或辅音;提取所述目标字符中除所述清声部分之外的其他部分的音高特征值,得到所述多个第一音高特征值。另一方面,提供了一种确定音高特征的装置,所述装置包括:提取模块,用于提取歌曲中的目标字符的多个第一音高特征值,所述目标字符为所述歌曲中的任意一个或者多个字符;第一确定模块,用于基于所述多个第一音高特征值,确定所述目标字符的多个第一MIDI音高值;获取模块,用于获取所述多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值,得到多个第二MIDI音高值;第二确定模块,用于根据所述多个第二MIDI音高值,从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。在本申请一种可能的实现方式中,所述第二确定模块用于:根据所述多个第二MIDI音高值,确定所述目标字符的音高范围;将所述多个第一音高特征值中处于所述音高范围内的第一音高特征值确定为所述目标字符的第二音高特征值。在本申请一种可能的实现方式中,所述第二确定模块用于:确定所述多个第二MIDI音高值中的最大值和最小值;将所述最小值作为下限、以及将所述最大值作为上限,确定第一数值范围;从所述多个第一MIDI音高值中筛选属于所述第一数值范围的第一MIDI音高值,得到多个第三MIDI音高值;基于所述多个第三MIDI音高值,确定所述目标字符的音高范围。在本申请一种可能的实现方式中,所述第二确定模块用于:从所述多个第三MIDI音高值中选择数量最多的第三MIDI音高值;将所选择的第三MIDI音高值与第一指定阈值相加,得到第一数值,以及将所选择的第三MIDI音高值与第二指定阈值相减,得到第二数值;将所述第一数值作为上限、以及将所述第二数值作为下限,确定第二数值范围;将所述第二数值范围转换为所述目标字符的音高范围。在本申请一种可能的实现方式中,所述提取模块用于:从所述目标字符中确定清声部分,所述清声部分是指不包括音高特征的声母或辅音;提取所述目标字符中除所述清声部分之外的其他部分的音高特征值,得到所述多个第一音高特征值。另一方面,提供了一种设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为实现上述一方面所述的任一方法的步骤。另一方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,所述指令被处理器执行时实现上述一方面所述的任一方法的步骤。另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述一方面所述的任一方法的步骤。本申请实施例提供的技术方案带来的有益效果是:提取歌曲中的目标字符的多个第一音高特征值,基于该多个第一音高特征值,确定该目标字符的多个第一MIDI音高值。获取该多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值,得到多个第二MIDI音高值,也即是,该多个第二MIDI音高值为目标字符的后半部分的音高特征对应的值。由于目标字符的后半部分往往是音高特征比较稳定的部分,即该多个第二MIDI音高值是从音高特征比较稳定的部分中确定的,所以,可以根据该多个第二MIDI音高值,从该多个第一音高特征值中确定该目标字符的第二音高特征值,如此确定的第二音高特征值对应的第二音高特征比较可靠,即准确度比较高。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种确定音高特征的方法流程图;图2是根据另一示例性实施例示出的一种确定音高特征的装置的结构示意图;图3是根据一示例性实施例示出的一种终端的结构示意图;图4是根据一示例性实施例示出的一种服务器的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地本文档来自技高网...

【技术保护点】
1.一种确定音高特征的方法,其特征在于,所述方法包括:/n提取歌曲中的目标字符的多个第一音高特征值,所述目标字符为所述歌曲中的任意一个或者多个字符;/n基于所述多个第一音高特征值,确定所述目标字符的多个第一乐器数字化接口MIDI音高值;/n获取所述多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值,得到多个第二MIDI音高值;/n根据所述多个第二MIDI音高值,从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。/n

【技术特征摘要】
1.一种确定音高特征的方法,其特征在于,所述方法包括:
提取歌曲中的目标字符的多个第一音高特征值,所述目标字符为所述歌曲中的任意一个或者多个字符;
基于所述多个第一音高特征值,确定所述目标字符的多个第一乐器数字化接口MIDI音高值;
获取所述多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值,得到多个第二MIDI音高值;
根据所述多个第二MIDI音高值,从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。


2.如权利要求1所述的方法,其特征在于,所述根据所述多个第二MIDI音高值,从所述多个第一音高特征值中确定所述目标字符的第二音高特征值,包括:
根据所述多个第二MIDI音高值,确定所述目标字符的音高范围;
将所述多个第一音高特征值中处于所述音高范围内的第一音高特征值确定为所述目标字符的第二音高特征值。


3.如权利要求2所述的方法,其特征在于,所述根据所述多个第二MIDI音高值,确定所述目标字符的音高范围,包括:
确定所述多个第二MIDI音高值中的最大值和最小值;
将所述最小值作为下限、以及将所述最大值作为上限,确定第一数值范围;
从所述多个第一MIDI音高值中筛选属于所述第一数值范围的第一MIDI音高值,得到多个第三MIDI音高值;
基于所述多个第三MIDI音高值,确定所述目标字符的音高范围。


4.如权利要求3所述的方法,其特征在于,所述基于所述多个第三MIDI音高值,确定所述目标字符的音高范围,包括:
从所述多个第三MIDI音高值中选择数量最多的第三MIDI音高值;
将所选择的第三MIDI音高值与第一指定阈值相加,得到第一数值,以及将所选择的第三MIDI音高值与第二指定阈值相减,得到第二数值;
将所述第一数值作为上限、以及将所述第二数值作为下限,确定第二数值范围;
将所述第二数值范围转换为所述目标字符的音高范围。


5.如权利要求1所述的方法,其特征在于,所述提取歌...

【专利技术属性】
技术研发人员:劳振锋肖纯智
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1