一种信号处理设备用于增加输入的声音中的语音标识的精确性,该信号处理设备具有:转换装置,该转换装置将输入信号转换成在频域中的振幅分量信号;计算装置,该计算装置计算在频率方向上的振幅分量信号的改变的范数;累加装置,该累加装置对如由计算装置计算出的在频率方向上的振幅分量信号的改变的范数累加;以及分析装置,该分析装置根据如由累加装置计算出的在频率方向上的振幅分量信号的改变的范数的累加值来分析在输入信号中的语音。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种检测输入信号中的人语音的技术。
技术介绍
在以上
中,专利文献1公开了一种通过确定输入语音帧的背景噪声电平 并且比较输入语音帧的音量与对应于噪声电平的阈值来检测语音的技术。
技术实现思路
引用列表 专利文献1 :日本专利待审公开号2013-005418 非专利文献 非专利文献 I :Masakiyo Fujimoto, "The Fundamentals and Recent Progress of Voice Activity Detection",the Institute of Electronics, Information and Communication Engineers, IEICE Technical Report SP2010-23, 2010 年 6 月 非专利文献 2 :Tsuneo Kato, Shingo Kuroiwa, Tohru Shimizu, and Norio Higuchi, "Tree-Based Clustering for Gaussian Mixture HMMs", IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences D-II, Vol. J83-D-II, No. 11,第 2128-2136 页,200011 月 非专利文献 3 :Ken Hanazawa and Ryosuke Isotani, 〃Gender_Independent Speech Recognition by Look-Ahead Model Selection",Proceedings of the Acoustical Society of Japan,第 197-198 页,2004 年 9 月 非专利文献 4 :"Speaker Verification Using Adapted Gaussian Mixture Models",Douglas A.Reynolds, Thomas F.Quatieri, Robert B.Dunn, Digital Signal Processing 10,19-41(2000) 技术问题 然而,在以上文献中描述的技术中,简单地通过比较音量来确定语音的存在/不 存在,并且因此如果噪声大,则根本不能检测语音。即使噪声小,通过按照音量检测语音而 获得的检测准确性也并未充分地高。 本专利技术实现了提供一种解决以上描述的问题的技术。 对问题的解决方案 本专利技术的一个方面提供了一种信号处理装置,该信号处理装置包括: 变换器,该变换器将输入信号变换成频域中的振幅分量信号; 计算器,该计算器计算在频率方向上的振幅分量信号的改变的范数; 累加器,该累加器累加由计算器计算出的改变的范数;以及 分析器,该分析器根据由累加器计算出的累加值来分析输入信号中的声音。 本专利技术的另一方面提供了一种信号处理方法,该信号处理方法包括: 将输入信号变换成频域中的振幅分量信号; 计算在频率方向上的振幅分量信号的改变的范数;以及 累加在计算中计算出的改变的范数。 本专利技术的又一方面提供了一种用于使得计算机执行方法的信号处理程序,该方法 包括: 将输入信号变换成频域中的振幅分量信号; 计算在频率方向上的振幅分量信号的改变的范数;以及 累加在计算中计算出的改变的范数。 本专利技术的有利效果 根据本专利技术,有可能提尚声首确定准确性。【附图说明】 图1是示出了根据本专利技术的第一实施例的信号处理装置的布置的框图; 图2是示出了根据本专利技术的第二实施例的信号处理装置的布置的框图; 图3是示出了根据本专利技术的第三实施例的信号处理装置的布置的框图; 图4是示出了根据本专利技术的第四实施例的信号处理装置的布置的框图; 图5是示出了根据本专利技术的第五实施例的信号处理装置的布置的示例的框图; 图6是示出了根据本专利技术的第五实施例的信号处理装置的布置的另一示例的框 图; 图7是示出了根据本专利技术的第五实施例的变换器的布置的框图; 图8是示出了根据本专利技术的第五实施例的逆变换器的布置的框图; 图9是示出了根据本专利技术的第五实施例的逆变换器的语音检测器的布置的示例 的框图; 图10是用于说明根据本专利技术的第五实施例的语音检测器的示例的图形; 图11是用于说明根据本专利技术的第五实施例的语音检测器的示例的图形; 图12是示出了根据本专利技术的第五实施例的语音检测器的布置的另一示例的框 图; 图13是用于说明根据本专利技术的第五实施例的语音检测器的另一示例的视图; 图14是示出了根据本专利技术的第五实施例的信号处理装置的信号处理结果的视 图; 图15是示出了根据本专利技术的第六实施例的替换单元的布置的框图; 图16是示出了根据本专利技术的第七实施例的替换单元的布置的框图; 图17是示出了根据本专利技术的第八实施例的替换单元的布置的框图; 图18是示出了根据本专利技术的第九实施例的替换单元的布置的框图; 图19是示出了根据本专利技术的第十实施例的替换单元的布置的框图;以及 图20是示出了在根据本专利技术的实施例的信号处理装置由软件实施时的布置的框 图。【具体实施方式】 现在将参照附图描述本专利技术的优选实施例。应当注意,在这些实施例中阐述的部 件的相对布置、数值表达式和数值除非具体地另有陈述则并未限制本专利技术的范围。注意,在 以下说明中的"语音信号"指示根据语音或者另一声音的影响而出现的直接电改变。语音 信号传输语音或者另一声音并且不限于语音。 将参照图1描述根据本专利技术的第一实施例的信号处理装置100。信号处理装置10 是用于确定在输入信号中语音的存在的装置。 如图1中所示,信号处理装置100包括变换器101、频率方向差值计算器102、累加 器103和分析器104。变换器101将输入信号110变换成频域中的振幅分量信号130。频 率方向差值计算器102计算在频率方向上的频率方向差值计算器102的改变的范数。累加 器103累加由计算器102计算出的改变的范数。分析器104根据由累加器103计算出的累 加值150分析在输入信号110中的语音。 利用以上描述的布置,有可能更正确地确定语音在输入信号中的存在的可能性或 者语首的属性。 这一布置关注语音在频率方向上大量地改变而噪声在频率方向上平滑这样的事 实。例如,通过使用在频率方向上的改变的范数的累加值,确定语音随着累加值更大而以更 高概率存在。可以通过比较累加值与阈值来执行硬判定(0/1),或者可以通过对累加值本身 取整(round)来执行软判定(0至256)。 将参照图2描述根据本专利技术的第二实施例的信号处理装置。图2是用于说明根据 这一实施例的信号处理装置的功能布置的框图。 如图2中所示,信号处理装置200包括变换器201、频率方向差值计算器202、累加 器203、分析器204和频率方向平滑器205。变换器201将输入信号210变换成频域中的振 幅分量信号230。频率方向平滑器205在频率方向上平滑振幅分量信号230。频率方向差 值计算器202计算在频率方向上的平滑的振幅分量信号230的改变的范数。累加器203累 加由频率方向差值计算器202计算出的改变的范数。本文档来自技高网...
【技术保护点】
一种信号处理装置,包括:变换器,所述变换器将输入信号变换成频域中的振幅分量信号;计算器,所述计算器计算在频率方向上的所述振幅分量信号的改变的范数;累加器,所述累加器累加由所述计算器计算出的所述改变的所述范数;以及分析器,所述分析器根据由所述累加器计算出的累加值来分析所述输入信号中的声音。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:加藤正德,杉山昭彦,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。