音频转录方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：38515829 阅读：10 留言：0更新日期：2023-08-19 16:57

本发明专利技术涉及语音分析领域，尤其涉及一种音频转录方法、装置、计算机设备及存储介质。其方法包括：通过对待转录音频进行傅里叶变换，得到傅里叶频谱；通过基于注意力机制的多任务特征融合模型对所述傅里叶频谱进行多任务特征提取，得到多任务特征；根据所述多任务特征，对所述傅里叶频谱进行多任务预测，得到多任务预测结果；根据所述预测结果，生成与所述待转录音频对应的转录文件。本发明专利技术得到的多任务预测结果考虑了多个任务特征之间的隐藏信息，使得多任务预测结果更加准确。进而，使基于多任务预测结果生成的转录文件更加准确，提高了音频转录的准确率。转录的准确率。转录的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
音频转录方法、装置、计算机设备及存储介质

[0001]本专利技术涉及语音分析领域，尤其涉及一种音频转录方法、装置、计算机设备及存储介质。

技术介绍

[0002]在音乐领域，音乐主要以音频的形式存储和传播，只有极少部分音乐以曲谱的形式呈现，供用户对与该曲谱对应的音乐做进一步的研究和学习。
[0003]目前，现有的将音频转换为曲谱的手段包括模板法和深度学习方法。
[0004]其中，模板法通过对比输入音频数据和数据库中对应模板的相似度来判别输入声音的音高类别，最终得到转录曲谱。但模板法针对和弦较多和速度较快的音乐时，检测效果较差，导致音频转录准确率较低。深度学习方法通过将输入的音频数据转换为短时傅里叶变换(STFT)频谱或者梅尔频谱，然后将得到的频谱当作图像进行特征提取，进而进行逐帧的音高分类，最终得到转录曲谱。但深度学习方法针对不同音色以及不同录音环境的音乐片段，识别精度度不同。且，深度学习方法最大的不足在于：无法检测音符起始点和结束点的准确时间，使得转录曲谱无法用于用户学习和研究。因此，现有将音频转换为曲谱的手段均存在转录准确率较低以及效果较差的问题。

技术实现思路

[0005]基于此，有必要针对上述技术问题，提供一种音频转录方法、装置、计算机设备及存储介质，以解决现有将音频转换为曲谱的手段存在转录准确率较低以及效果较差的问题。
[0006]一种音频转录方法，包括：
[0007]对待转录音频进行傅里叶变换，得到傅里叶频谱；
[0008]通过基于注意力机制的多任务特...

【技术保护点】

【技术特征摘要】
1.一种音频转录方法，其特征在于，包括：对待转录音频进行傅里叶变换，得到傅里叶频谱；通过基于注意力机制的多任务特征融合模型对所述傅里叶频谱进行多任务特征提取，得到多任务特征；根据所述多任务特征，对所述傅里叶频谱进行多任务预测，得到多任务预测结果；根据所述预测结果，生成与所述待转录音频对应的转录文件。2.如权利要求1所述的音频转录方法，其特征在于，所述多任务特征融合模型包括起始点预测模型、结束点预测模型、音高预测模型和力度预测模型；所述多任务特征包括起始点特征、结束点特征、音高特征和力度特征；所述通过基于注意力机制的多任务特征融合模型对所述傅里叶频谱进行多任务特征提取，得到多任务特征，包括：通过所述起始点预测模型对所述傅里叶频谱进行起始点特征提取，得到所述起始点特征；通过所述结束点预测模型对所述傅里叶频谱进行结束点特征提取，得到所述结束点特征；通过所述音高预测模型对所述傅里叶频谱进行音高特征提取，得到所述音高特征；通过所述力度预测模型对所述傅里叶频谱进行力度特征提取，得到所述力度特征。3.如权利要求2所述的音频转录方法，其特征在于，所述任务预测结果包括音高预测结果；所述根据所述多任务特征，对所述待转录音频进行多任务预测，得到多任务预测结果，包括：通过所述注意力机制提取所述起始点特征和所述结束点特征的隐藏特征；将所述隐藏特征、所述音高特征和所述力度特征进行特征融合，得到融合特征；通过所述音高预测模型的音高长短期神经网络以及音高全连接分类器对所述融合特征进行音高预测处理，得到所述音高预测结果。4.如权利要求2所述的音频转录方法，其特征在于，所述任务预测结果包括起始点预测结果、结束点预测结果和力度预测结果；所述根据所述多任务特征，对所述待转录音频进行多任务预测，得到多任务预测结果，包括：通过所述起始点预测模型的起始点长短期神经网络以及起始点全连接分类器对所述起始点特征进行起始点预测处理，得到所述起始点预测结果；通过所述结束点预测模型的结束点长短期神经网络以及结束点全连接分类器对所述结束点特征进行结束点预测处理，得到所述结束点预测结果；通过所述力度预测模型的力度全连接分类器对所述力度特征进行力度预测处理，得到所述力度预测结...

【专利技术属性】
技术研发人员：张旭龙，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人