确定音高特征的方法、装置、设备及存储介质制造方法及图纸

技术编号：23935864 阅读：15 留言：0更新日期：2020-04-25 03:08

本申请公开了一种确定音高特征的方法、装置、设备及存储介质，属于音频处理技术领域。所述方法包括：提取歌曲中的目标字符的多个第一音高特征值，该目标字符为该歌曲中的任意一个或者多个字符；基于该多个第一音高特征值，确定该目标字符的多个第一MIDI音高值；获取该多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值，得到多个第二MIDI音高值；根据该多个第二MIDI音高值，从该多个第一音高特征值中确定该目标字符的第二音高特征值。本申请确定的第二音高特征值对应的第二音高特征比较可靠，即准确度比较高。

Method, device, equipment and storage medium for determining pitch characteristics

全部详细技术资料下载

【技术实现步骤摘要】
确定音高特征的方法、装置、设备及存储介质
本申请涉及音频处理
，特别涉及一种确定音高特征的方法、装置、设备及存储介质。
技术介绍
音高特征在语音合成技术中是一项比较重要的特征，其可以直接决定所合成的语音的质量，当音高特征不准确时，将导致所合成的语音中出现杂音，因此，需要能够准确地确定出音高特征。在歌曲中，一个字符的音高特征可能包括多个，所以，如何准确地确定歌曲中的字符的音高特征成为研究的热点。
技术实现思路
本申请实施例提供了一种确定音高特征的方法、装置、设备及存储介质，可以解决如何准确地确定歌曲中的字符的音高特征问题。所述技术方案如下：一方面，提供了一种确定音高特征的方法，所述方法包括：提取歌曲中的目标字符的多个第一音高特征值，所述目标字符为所述歌曲中的任意一个或者多个字符；基于所述多个第一音高特征值，确定所述目标字符的多个第一MIDI音高值；获取所述多个第一MIDI音高值中的时间靠后的指定阈值个属于人声范围内的第一MIDI音高值，得到多个第二MIDI音高值；根据所述多个第二MIDI音高值，从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。在本申请一种可能的实现方式中，所述根据所述多个第二MIDI音高值，从所述多个第一音高特征值中确定所述目标字符的第二音高特征值，包括：根据所述多个第二MIDI音高值，确定所述目标字符的音高范围；将所述多个第一音高特征值中处于所述音高范围内的第一音高特征值确定为所述目标字符的第二音高特...

【技术保护点】
1.一种确定音高特征的方法，其特征在于，所述方法包括：/n提取歌曲中的目标字符的多个第一音高特征值，所述目标字符为所述歌曲中的任意一个或者多个字符；/n基于所述多个第一音高特征值，确定所述目标字符的多个第一乐器数字化接口MIDI音高值；/n获取所述多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值，得到多个第二MIDI音高值；/n根据所述多个第二MIDI音高值，从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。/n

【技术特征摘要】
1.一种确定音高特征的方法，其特征在于，所述方法包括：
提取歌曲中的目标字符的多个第一音高特征值，所述目标字符为所述歌曲中的任意一个或者多个字符；
基于所述多个第一音高特征值，确定所述目标字符的多个第一乐器数字化接口MIDI音高值；
获取所述多个第一MIDI音高值中时间靠后的指定阈值个属于人声范围内的第一MIDI音高值，得到多个第二MIDI音高值；
根据所述多个第二MIDI音高值，从所述多个第一音高特征值中确定所述目标字符的第二音高特征值。

2.如权利要求1所述的方法，其特征在于，所述根据所述多个第二MIDI音高值，从所述多个第一音高特征值中确定所述目标字符的第二音高特征值，包括：
根据所述多个第二MIDI音高值，确定所述目标字符的音高范围；
将所述多个第一音高特征值中处于所述音高范围内的第一音高特征值确定为所述目标字符的第二音高特征值。

3.如权利要求2所述的方法，其特征在于，所述根据所述多个第二MIDI音高值，确定所述目标字符的音高范围，包括：
确定所述多个第二MIDI音高值中的最大值和最小值；
将所述最小值作为下限、以及将所述最大值作为上限，确定第一数值范围；
从所述多个第一MIDI音高值中筛选属于所述第一数值范围的第一MIDI音高值，得到多个第三MIDI音高值；
基于所述多个第三MIDI音高值，确定所述目标字符的音高范围。

4.如权利要求3所述的方法，其特征在于，所述基于所述多个第三MIDI音高值，确定所述目标字符的音高范围，包括：
从所述多个第三MIDI音高值中选择数量最多的第三MIDI音高值；
将所选择的第三MIDI音高值与第一指定阈值相加，得到第一数值，以及将所选择的第三MIDI音高值与第二指定阈值相减，得到第二数值；
将所述第一数值作为上限、以及将所述第二数值作为下限，确定第二数值范围；
将所述第二数值范围转换为所述目标字符的音高范围。

5.如权利要求1所述的方法，其特征在于，所述提取歌...

【专利技术属性】
技术研发人员：劳振锋，肖纯智，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人