当前位置: 首页 > 专利查询>索尼公司专利>正文

信号处理装置和方法以及程序制造方法及图纸

技术编号:10054128 阅读:124 留言:0更新日期:2014-05-16 03:14
本发明专利技术涉及信号处理装置和方法以及程序。信号处理装置包括:特征量提取单元,配置成从对语音信号进行频率转换所获得的频域信号中提取所述频域信号的特征量;以及确定单元,配置成基于所提取的特征量来确定预定区间内在所述语音信号中是否存在噪声。特征量是由多个元素组成的。所述多个元素包括基于以下两者之间的相关值所定义的元素:作为与所述预定区间内所述语音信号的频域信号相关的波形的特征量波形,以及在时间上与所述预定区间相继的另一区间内的特征量波形。

【技术实现步骤摘要】
信号处理装置和方法相关申请的交叉引用本申请要求在2012年10月26日提交的日本优先权专利申请JP2012-236313的权益,该日本优先权专利申请的全部内容通过引用结合于此。
本技术涉及信号处理装置和方法以及程序,并且具体地涉及使得能够以高准确度去除在记录语音时出现的噪声的信号处理装置和方法以及程序。
技术介绍
在用于记录语音(包括运动图像)的设备之中,已知视频摄像机、具有拍摄运动图像功能的数码相机、智能电话和数码录音笔等。在操作这些设备时,从设备主体中出现的声音有时污染所记录的语音。在拍摄运动图像时出现例如变焦驱动声音、自动对焦驱动声音和孔径光阑驱动声音等。这些声音由于对设备内部的部件的驱动而出现,并且根据驱动方式和控制方式而具有各种声学特性。此外,近年来,压电元件响应于所施加的电压的变形通常用于根据自动对焦和变焦来驱动镜头。由于压电元件而产生的驱动声音有时与现有的那些具有不同的特性。这种驱动声音所引起的噪声有时称为突发性噪声。污染所记录的语音的突发性噪声对于耳朵极其刺耳,因而期望用于降低该声音的措施或去除噪声的措施等。已经提出了一些针对突发性噪声的措施。例如,提出了一种技术,该技术用于响应于已经被发送的驱动信号,根据驱动信号被发送的时刻之前的时间段的语音信号来生成合成的语音信号,并且将合成的语音信号与驱动信号被发送的时刻之后的时间段中的语音信号合成(例如,日本专利特开No.2011-002723,在下文中将其称为专利文献1)。此外,还提出了一种技术,该技术用于根据驱动命令从在某个时间段内来自麦克风的输出语音中提取光学元件的驱动的频率分量特性,检测具有某个水平以上的区间,并且基于在该区间之前和之后的语音来执行预测和插值(例如,日本专利特开No.2012-114842,在下文中将其称为专利文献2)。从而,能够以高准确度来去除伴随着成像光学系统的驱动的驱动噪声。
技术实现思路
然而,专利文献1的技术不考虑从驱动信号的发送到设备操作的延迟以及声音从驱动声音源到达麦克风的时间等。由于这个原因,即使在没有驱动噪声的区间中也执行噪声降低处理,这有时导致原始声音的保真度的劣化。此外,专利文献2的技术旨在在关注主要不小于10kHz的高频带中的功率的情况下确定噪声去除区间。然而,在实际的图像拍摄环境中,在10kHz频带内,除了驱动声音之外的各种类型的声音不计其数,这可能导致错误确定。此外,近年来在诸如智能电话的电子设备中内置的、节能并且低高度的相机功能单元中,压电元件用于根据自动对焦和变焦来驱动镜头。虽然由于这样的压电元件而产生的驱动声音所引起的噪声是突发性噪声,但在驱动时该噪声通常能够接连发生数次。当这样接连发生的突发性噪声中的一部分未被去除时,有时更给人不舒服的感觉。期望能够以高准确度来去除在记录语音时出现的噪声。根据本技术的实施例,提供了一种信号处理装置,包括:特征量提取单元,配置成从对语音信号进行频率转换而获得的频域信号中提取频域信号的特征量;以及确定单元,配置成基于所提取的特征量来确定预定区间内语音信号中是否存在噪声,其中,特征量是由多个元素组成的,并且其中,多个元素包括基于以下两者之间的相关值所定义的元素:作为与预定区间内语音信号的频域信号相关的波形的特征量波形,以及在时间上与预定区间相继的另一区间内的特征量波形。特征量的多个元素中的每一个元素均可基于预定区间内的特征量波形而计算。预定区间内的特征量波形可以是通过从频域信号中提取预设频带的信号强度而获得的一维信号的波形。特征量的多个元素还可以包括特征量波形的幅度的最大值、或表示特征量波形的突发性的值。信号处理装置还可以包括从频率转换之前的语音信号中提取特征量的另一特征量提取单元。确定单元可以将基于电子控制而驱动的部件的驱动声音确定为噪声,该信号处理装置还可以包括控制信号提供单元,控制信号提供单元配置成将表示是否存在部件的驱动的控制信号提供给特征量提取单元。信号处理装置还可以包括因数保持单元,因数保持单元配置成保持用于确定单元进行的确定、并且预先通过学习来获得的因数。确定单元可以将基于电子控制而驱动的部件的驱动声音确定为噪声,该信号处理装置还包括:驱动信息提供单元,配置成将表示部件的驱动方式的信息提供给因数保持单元,并且该因数保持单元基于从驱动信息提供单元提供的信息来将因数提供给确定单元。确定单元可以基于将特征量的多个元素的各个元素乘以在因数保持单元中保持的因数的乘积和运算的运算结果来确定是否存在噪声。确定单元可以基于在因数保持单元中保持的因数来针对特征量的多个元素中的各个元素进行阈值确定,并基于通过阈值确定所获得的确定结果来确定是否存在噪声。信号处理装置还可以包括噪声去除单元,当确定单元确定预定区间内在语音信号中存在噪声时,该噪声去除单元去除该预定区间内的噪声。噪声去除单元可以从频域信号中提取预设频带,并且仅对所提取的频带执行去除噪声的处理。由麦克风所采集的语音信号可以被输入。预先记录的语音信号可以被输入。根据本技术的实施例,提供了一种信息处理方法,包括:通过特征量提取单元,从对语音信号进行频率转换而获得的频域信号中提取该频域信号的特征量;以及通过确定单元,基于所提取的特征量来确定预定区间内在语音信号中是否存在噪声。特征量是由多个元素组成的,并且该多个元素包括基于以下两者之间的相关值而定义的元素:作为与预定区间内语音信号的频域信号相关的波形的特征量波形,以及在时间上与预定区间相继的另一区间内的特征量波形。根据本技术的实施例,提供了一种使得计算机用作信号处理装置的程序,该信号处理装置包括:特征量提取单元,配置成从对语音信号进行频率转换而获得的频域信号中提取该频域信号的特征量,以及确定单元,配置成基于所提取的特征量来确定预定区间内在语音信号中是否存在噪声。特征量是由多个元素组成的,并且该多个元素包含基于以下两者之间的相关值而定义的元素:作为与预定区间内语音信号的频域信号相关的波形的特征量波形,以及在时间上与预定区间相继的另一区间内的特征量波形。根据本技术的实施例,通过特征量提取单元,从对语音信号进行频率转换而获得的频域信号中提取该频域信号的特征量,并且通过确定单元,基于所提取的特征量来确定预定区间内在语音信号中是否存在噪声。特征量是由多个元素组成的,并且该多个元素包含基于以下两者之间的相关值而定义的元素:作为与预定区间内语音信号的频域信号相关的波形的特征量波形,以及在时间上与预定区间相继的另一区间内的特征量波形。根据本技术,能够以高准确度来去除在记录语音时出现的噪声。附图说明图1是示出了根据本技术的实施例的信号处理装置的例示性配置的框图;图2A和图2B是用于阐述驱动声音的图;图3是用于阐述表格确定的示例的图;图4是示出了从频率转换单元输出的频域中的信号的示例的图;图5是示出了特征量波形的示例的图;图6是用于阐述幅度值的计算的图;图7是用于阐述突发性值的计算的图;图8是用于阐述周期性值的计算的图;图9是用于阐述噪声去除单元进行的处理的细节的图;图10是用于阐述噪声去除单元进行的处理的细节的图;图11是用于阐述噪声去除单元进行的处理的细节的图;图12是用于阐述噪声降低处理的示例的流程图;图13是用于阐述特征量提取处理的示例的流程图;图14是示出了根据本本文档来自技高网
...
信号处理装置和方法以及程序

【技术保护点】

【技术特征摘要】
2012.10.26 JP 2012-2363131.一种信号处理装置,包括:特征量提取单元,配置成从对语音信号进行频率转换而获得的频域信号中提取所述频域信号的特征量;以及确定单元,配置成基于所提取的特征量来确定预定区间内所述语音信号中是否存在噪声,其中,所述特征量是由多个元素组成的,并且其中,所述多个元素包括基于以下两者之间的相关值所定义的元素:作为与所述预定区间内所述语音信号的频域信号相关的波形的特征量波形,以及在时间上与所述预定区间相继的另一区间内的特征量波形。2.根据权利要求1所述的信号处理装置,其中,所述特征量的多个元素中的每一个元素是基于所述预定区间内的特征量波形而计算的。3.根据权利要求2所述的信号处理装置,其中,所述预定区间内的特征量波形是通过从所述频域信号中提取预设频带的信号强度而获得的一维信号的波形。4.根据权利要求1所述的信号处理装置,其中,所述特征量的多个元素还包括所述特征量波形的幅度的最大值、或表示所述特征量波形的突发性的值。5.根据权利要求1所述的信号处理装置,还包括:另一特征量提取单元,其从所述频率转换之前的语音信号中提取特征量。6.根据权利要求1所述的信号处理装置,其中,所述确定单元将基于电子控制而驱动的部件的驱动声音确定为噪声,所述信号处理装置还包括:控制信号提供单元,配置成将表示是否存在所述部件的驱动的控制信号提供给所述特征量提取单元。7.根据权利要求1所述的信号处理装置,还包括:因数保持单元,配置成保持用于所述确定单元进行的确定、并且预先通过学习来获得的因数。8.根据权利要求7所述的信号处理装置,其中,所述确定单元将基于电子控制而驱动的部件的驱动声音确...

【专利技术属性】
技术研发人员:大迫庆一安部素嗣
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1