单声道多音音乐信号的自动转录方法及装置制造方法及图纸

技术编号:10121780 阅读:263 留言:0更新日期:2014-06-12 11:05
本发明专利技术提供了一种单声道多音音乐信号的自动转录方法及装置,该自动转录方法包括:接收单通道多音音乐信号;对所述单声道多音音乐信号进行分离,得到多路单音音乐信号;对各路单音音乐信号进行音色提取,确定演奏乐器信息;对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。上述单声道多音音乐信号的自动转录方法及装置,通过将多音音乐信号分离成多路单音音乐信号,对分离出的各路单音音乐信号分别进行音色和旋律、节奏及节拍的提取,获得演奏乐器信息和音频信息,进而根据所述演奏乐器信息和所述音频信息获得高准确率的多音音乐乐谱。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种单声道多音音乐信号的自动转录方法及装置,该自动转录方法包括:接收单通道多音音乐信号;对所述单声道多音音乐信号进行分离,得到多路单音音乐信号;对各路单音音乐信号进行音色提取,确定演奏乐器信息;对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。上述单声道多音音乐信号的自动转录方法及装置,通过将多音音乐信号分离成多路单音音乐信号,对分离出的各路单音音乐信号分别进行音色和旋律、节奏及节拍的提取,获得演奏乐器信息和音频信息,进而根据所述演奏乐器信息和所述音频信息获得高准确率的多音音乐乐谱。【专利说明】单声道多音音乐信号的自动转录方法及装置
本专利技术涉及数字信号处理
,尤其涉及一种单声道多音音乐信号的自动转录方法及装置。
技术介绍
随着数字信号处理技术的进步,音乐信号的传播及保存方式也变得多样化。一段音乐信号的乐谱几乎包含了乐曲中的所有信息,包括旋律、节奏、节拍等。利用某些音频软件,甚至可以通过对乐谱的创作或修改,不需真实乐器演奏就可以生成新的音乐信号。如果计算机能够自动从时域音乐信号中得到乐谱,那么对于音乐的进一步发展将有着非常重要的意义。随着音乐信号处理技术的发展,产生了多种音乐信号自动转录装置。但目前存在的音乐信号自动转录装置都存在着各自的局限性。例如,有些装置只针对乐器数字接口(MIDI)格式的音乐信号,然而众所周知,MIDI信号中包含了很丰富的乐谱信息,从MIDI格式的音乐信号中提取乐谱只是一种逻辑转换,并不包含音符识别或节奏提取等具体工作;有些装置只针对单音音乐信号,即音乐信号在任何一个时间点只有不超过一个音符存在,当这些装置面对多音音乐的输入信号,就会失去原有的功能。有些装置可以对多音音乐信号进行乐谱的自动转录,但由于多音信号自身的复杂性及装置的特性,会造成乐谱信息的不准确。因此,针对不包含乐谱信息的音乐格式(如wav格式)的多音音乐信号进行高质量的乐谱的自动转录的装置是合乎需要的。
技术实现思路
本专利技术提供了一种单声道多音音乐信号的自动转录方法及装置,以解决现有的自动转录装置无法针对多音音乐信号进行转录或乐谱准确率不高的问题。本专利技术提供了一种单声道多音音乐信号的自动转录方法,该方法包括:接收单通道多音音乐信号;对所述单声道多音音乐信号进行分离,得到多路单音音乐信号;对各路单音音乐信号进行音色提取,确定演奏乐器信息;对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。优选地,所述对单声道多音音乐信号进行分离,得到多路单音音乐信号,包括:将多音音乐信号进行分帧处理,获得多个音频帧,对各音频帧进行静音检测确定是否为静音帧,对每一非静音帧进行多基频检测,获得音符信息和基频检测值;对不同音符进行谐波数及幅度的估计,获得各音符的幅度和谐波信息,依据贝叶斯谐波模型,利用所述基频估计值,获得时域分音信号;依据预设的帧移及帧数,逐帧对时域分音信号进行合成;或者所述对各路单音音乐信号进行音色提取,确定演奏乐器信息,包括:将各路单音音乐信号分帧,将各帧单音音乐信号进行转换,得到各单音信号的内禀模态函数集合;利用非线性音色模型,提取各帧单音音乐信号的模型参数;将获得的模型参数与预存数据进行对比,判断演奏各路单音音乐信号的乐器信息;或者所述对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息,包括:将各路单音音乐信号分帧,按照启发式规则和各帧单音音乐信号频谱峰值信息,进行基频检测,得到音高和对应音符;将各帧单音音乐信号归一化,得到一阶差分包络,利用能量突起进行音符起始点检测;对差分后的边沿信号进行处理,得到其自相关信号和自相关相位熵序列,利用二者信息计算节拍检测待检信号;对音符起始点序列进行处理,根据音乐速度范围和音符之间关系将音符节拍分类,并利用各类在待检信号的峰值找出节拍长度作为候选节拍;选取不同的检测起点和节拍值,对整首音乐进行设定权值的多路径跟踪,得到与开始音符匹配的节拍值及节拍起始位置和各个节拍的位置。优选地,所述对每一非静音帧进行多基频检测,获得音符信息和基频检测值,包括:对每一非静音帧,通过短时傅里叶变换(STFT),获得对应的频谱;在对应的频谱中,提取波峰位置及其对应幅度;按照启发式规则和已提取的波峰位置及其对应幅度进行多基频检测,获得多个音符信息;对相互之间没有倍数关系的基频进行估计,获得第一估计值,对相互之间有倍数关系的基频进行估计,获得第二估计值,根据所述第一估计值和所述第二估计值获得基频估计值;或者所述非线性音色模型为基于正弦频率调制的非线性音色模型,该基于正弦频率调制的非线性音色模型为:【权利要求】1.一种单声道多音音乐信号的自动转录方法,其特征在于,该方法包括: 接收单通道多音音乐信号; 对所述单声道多音音乐信号进行分离,得到多路单音音乐信号; 对各路单音音乐信号进行音色提取,确定演奏乐器信息; 对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及 根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。2.根据权利要求1所述的方法,其特征在于: 所述对单声道多音音乐信号进行分离,得到多路单音音乐信号,包括:将多音音乐信号进行分帧处理,获得多个音频帧,对各音频帧进行静音检测确定是否为静音帧,对每一非静音帧进行多基频检测,获得音符信息和基频检测值;对不同音符进行谐波数及幅度的估计,获得各音符的幅度和谐波信息,依据贝叶斯谐波模型,利用所述基频估计值,获得时域分音信号;依据预设的帧移及帧数,逐帧对时域分音信号进行合成;或者所述对各路单音音乐信号进行音色提取,确定演奏乐器信息,包括: 将各路单音音乐信号分帧,将各帧单音音乐信号进行转换,得到各单音信号的内禀模态函数集合;利用非线性音色模型,提取各帧单音音乐信号的模型参数;将获得的模型参数与预存数据进行对比,判断演奏各路单音音乐信号的乐器信息;或者 所述对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息,包括: 将各路单音音乐信号分帧,按照启发 式规则和各帧单音音乐信号频谱峰值信息,进行基频检测,得到音高和对应音符;将各帧单音音乐信号归一化,得到一阶差分包络,利用能量突起进行音符起始点检测;对差分后的边沿信号进行处理,得到其自相关信号和自相关相位熵序列,利用二者信息计算节拍检测待检信号;对音符起始点序列进行处理,根据音乐速度范围和音符之间关系将音符节拍分类,并利用各类在待检信号的峰值找出节拍长度作为候选节拍;选取不同的检测起点和节拍值,对整首音乐进行设定权值的多路径跟踪,得到与开始音符匹配的节拍值及节拍起始位置和各个节拍的位置。3.根据权利要求2所述的方法,其特征在于: 所述对每一非静音帧进行多基频检测,获得音符信息和基频检测值,包括: 对每一非静音帧,通过短时傅里叶变换(STFT),获得对应的频谱;在对应的频谱中,提取波峰位置及其对应幅度;按照启发式规则和已提取的波峰位置及其对应幅度进行多基频检测,获得多个音符信息;对相互之间没有倍数关系的基频进行估计,获得第一估计值,对相互之间有倍数关系的基频进行估计,获得第二估计值,根据所本文档来自技高网
...

【技术保护点】
一种单声道多音音乐信号的自动转录方法,其特征在于,该方法包括:接收单通道多音音乐信号;对所述单声道多音音乐信号进行分离,得到多路单音音乐信号;对各路单音音乐信号进行音色提取,确定演奏乐器信息;对各路单音音乐信号进行旋律、节奏及节拍的提取,获得音频信息;以及根据所述演奏乐器信息和所述音频信息获得多音音乐乐谱。

【技术特征摘要】

【专利技术属性】
技术研发人员:王晖王雨田朱兵王颖宫妍竹
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1