信号处理装置、信号处理方法和程序制造方法及图纸

技术编号:35092910 阅读:15 留言:0更新日期:2022-10-01 16:52
本技术涉及使得能够获取具有较高声音质量信号的信号处理装置、信号处理方法和程序。该信号处理装置配备有:差分信号生成单元,基于预测系数和输入信号生成与输入信号对应的差分信号,该预测系数通过使用通过重新量化原声音信号获得的学习重新量化信号和原声音信号的差分信号作为教师数据进行学习而获得的;以及组合单元,被配置为组合所生成的差分信号和输入信号。本技术可应用于信号处理装置。本技术可应用于信号处理装置。本技术可应用于信号处理装置。

【技术实现步骤摘要】
【国外来华专利技术】信号处理装置、信号处理方法和程序


[0001]本技术涉及信号处理装置、信号处理方法和程序,并且具体地,涉及使得能够获取具有较高声音质量的信号的信号处理装置、信号处理方法和程序。

技术介绍

[0002]对音乐等的音频信号的适当比特扩展导致获取具有较高声音质量的信号。例如,在正弦信号上,比特扩展可以通过例如DAC(数模转换器)的滤波来实现。
[0003]此外,作为与高声音质量相关的技术,已经提出了以下技术:利用多个级联全通滤波器对压缩声源信号进行滤波,增益调节作为结果获得的信号,并且将增益调节的信号和压缩声源信号相加以生成具有更高声音质量的信号(例如,参见专利文献1)。
[0004]现有技术文件
[0005]专利文献
[0006]专利文献1:日本专利申请公开号2013

7944

技术实现思路

[0007]本专利技术要解决的问题
[0008]然而,还没有针对音乐的典型信号提出实现基于数学的位扩展的技术,导致难以获得具有更高声音质量的信号。
[0009]例如,在专利文献1中描述的技术中,人类重复收听和增益值调整,以确定听觉效果可被加到的最终增益值,仿佛比特扩展被执行。因此,由于没有用于确定增益值的数学基础,所以存在未获得具有高声音质量的信号的情况。
[0010]本技术鉴于这种情况做出,并且能够获取具有较高声音质量的信号。
[0011]问题的解决方案
[0012]根据本技术的一个方面的信号处理装置包括:差值信号生成单元,被配置为基于输入信号和预测系数生成与输入信号对应的差值信号,预测系数是通过以基于通过原始声音信号的重新量化获得的用于学习的重新量化信号和原始声音信号的差分信号作为训练数据进行学习而获得的;以及组合单元,被配置为将组合生成的差分信号和输入信号。
[0013]根据本技术的一个方面的信号处理方法或程序包括:基于输入信号和预测系数生成与输入信号对应的差值信号的步骤,预测系数是通过以基于通过原始声音信号的重新量化获得的用于学习的重新量化信号和原始声音信号的差分信号作为训练数据进行学习而获得的;以及组合所生成的差分信号和输入信号的步骤。
[0014]在本技术的一个方面,基于输入信号和预测系数生成与所述输入信号对应的差分信号,预测系数是通过以基于原始声音信号的重新量化获得的基于用于学习的重新量化信号和原始声音信号的差分信号作为训练数据进行学习而获得的,并且组合生成的差分信号和输入信号。
附图说明
[0015]图1示出了差分信号的产生。
[0016]图2示出了示例性24位信号、16位信号和差分信号。
[0017]图3示出了信号处理装置的示例性配置。
[0018]图4示出了差分信号生成单元的示例性配置。
[0019]图5是信号生成处理的说明性流程图。
[0020]图6示出了差分信号生成单元的示例性配置。
[0021]图7示出了差分信号生成单元的示例性配置。
[0022]图8示出了差分信号生成单元的示例性配置。
[0023]图9示出了计算机的示例性配置。
具体实施方式
[0024]在下文中,将参考附图描述应用本技术的实施方式。
[0025]<第一实施方式>
[0026]<关于本技术>
[0027]高解析(以下称为高解析)音乐内容的传播至今已有数年。然而,这种高解析内容大多包括如60年代中的老声源和新录制的声源,并且在光盘(CD)的heyday几乎没有内容,例如,在音乐最流行的80年代。
[0028]这是因为当时的CD是使用16位/44.1kHz的CD主控装置制作的,并且仅存在与CD具有相同格式的16位/44.1kHz的主声源。
[0029]由此,即使当人们希望收听高解析的当时的CD的内容时,人们也无法收听高解析的这样的内容。因此,这样人在收听时只能施加听觉效果,使得使其听起来好像是高解析内容。
[0030]因此,在本技术中,例如,作为新记录的高解析原始声音信号的脉冲码调制(PCM)信号与从原始声音信号生成的低质量重新量化的信号之间的差的差分信号被用作训练数据,并且从重新量化的信号学习差分信号使得音乐等的典型音频信号能够成为高声音质量(高解析)信号。
[0031]以这种方式,例如,没有高解析主声源的CD的典型16位信号被转换为高解析信号,使得例如,可以获得具有高声音质量的24位信号。
[0032]具体地,在本技术中,例如,使用考虑了音频信号的特征的网络的机器学习被执行为差分信号的学习。
[0033]应注意,在下文中,将通过重新量化24位信号(例如,作为原始声音信号的音乐的24位PCM信号)获取的16位信号(16位PCM信号)作为重新量化的信号执行机器学习的情况作为实例进行描述。
[0034]具体地,在下文中,用于机器学习的用于学习的24位信号(原始声音信号)也被称为用于学习的24位信号(用于学习的原始声音信号)。类似地,从用于学习的原始声音信号获得的16位信号(重新量化的信号)也被称为用于学习的16位信号(重新量化的信号用于学习)。此外,在以下描述中,从用于学习的原始声音信号和用于学习的重新量化的信号获得并用作训练数据的差分信号还特别地被称为用于学习的差分信号。
[0035]在基于用于学习的16位信号和用于学习的差分信号执行机器学习的情况下,例如,CD的典型16位信号被用作输入信号,并且输入信号被带入高声音质量以获取高声音质量信号作为24位信号。注意,这种16位信号和24位信号是均具有量化位长度的音频信号,即,针对一个样本的位长度是16位或24位。
[0036]首先,将描述用于学习的差分信号的生成。
[0037]例如,如图1所示,准备24位信号作为高声音质量的用于学习的原始声音信号。
[0038]接着,通过例如简单截断、抖动舍入或用不同噪声整形器进行噪声整形来重新量化24位信号,以生成16位信号作为比24位信号的声音质量低的用于学习的重新量化的信号。即,对24位信号执行重新量化,并生成量化位长度比24位信号小的16位信号作为用于学习的重新量化信号。
[0039]此外,通过获得24位信号和16位信号之间的差来生成作为用于学习的差分信号的8位信号。利用所获得的用于学习的差分信号作为训练数据,通过机器学习生成用于从16位信号预测(生成)差分信号的预测系数(预测器)。
[0040]例如,在机器学习时,用深度神经网络(DNN)执行学习,该DNN具有考虑音频信号的特征(诸如几百毫秒的相关性、频谱中的谐波结构、和节奏)的配置。即,用于DNN等中的差分信号的预测计算的预测系数被作为参数学习。
[0041]使用通过这种机器学习获取的预测系数,利用自由选择的16位音频信号(16位信号)作为输入信号,通过基于输入信号和预测系数的预测,可以获得与输入信号的差分信号。
[0042]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信号处理装置,包括:差分信号生成单元,被配置为基于输入信号和预测系数生成与所述输入信号对应的差分信号,所述预测系数是通过以基于通过原始声音信号的重新量化获得的用于学习的重新量化信号和所述原始声音信号的差分信号作为训练数据进行学习而获得的;以及组合单元,被配置为组合所生成的所述差分信号和所述输入信号。2.根据权利要求1所述的信号处理装置,其中,所述学习对应于机器学习。3.根据权利要求1所述的信号处理装置,其中,所述输入信号在量化比特长度上与所述用于学习的重新量化信号相同。4.根据权利要求1所述的信号处理装置,其中,所述差分信号生成单元包括预测单元,所述预测单元被配置为基于所述预测系数和所述输入信号预测时域的所述差分信号。5.根据权利要求4所述的信号处理装置,其中,所述预测单元包括深度神经网络DNN。6.根据权利要求1所述的信号处理装置,其中,所述差分信号生成单元包括:复数快速傅里叶变换FFT处理单元,被配置为对所述输入信号执行复数FFT;以及预测单元,被配置为基于所述预测系数和从所述复数FFT获得的信号来预测频域的所述差分信号。7.根据权利要求6所述的信号处理装置,其中,所述预测单元包括DNN。8.根据权利要求1所述的信号处理装置,其中,所述差分信号生成单元包括:第一预测单元,被配置为基于所述预测系数和所述输入信号预测时域的所述差分信号;复数FFT处理单元,被配置为对所述输入信号执行复数FFT;第二预测单元,被配置为基于所述预测系数和从所述复数FFT获得的信号来预测频域的所述差分信号;以及第三预测单元,被配置为基于所述预测系数、来自所述第一预测单元的预测结果和来自所述第二预测单元的预测结果将所述差分信号预测为最终差分信号。9.根据权利要求8所述的信号处理...

【专利技术属性】
技术研发人员:福井隆郎
申请(专利权)人:索尼集团公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1