使用预编程的语音特征的语音转换器制造技术

技术编号:3046306 阅读:278 留言:0更新日期:2012-04-11 18:40
语音处理系统按照多种预编程的语音类型中用户所选类型来修改输入语音的各个方面。开始,语音转换器接收表示输入语音信号的共振峰信号和表示输入信号的基本频率的音调信号。以下一个或两个也可以被接收:包括指示输入信号是有声的、无声的或混合的发声信号,以及/或者表示输入语音信号的能量的增益信号。语音转换器也接收多个预编程的语音类型中用户所选类型,每个类型规定修改一个或多个接收信号(即,共振峰、发声、音调、增益)的一个方式。语音转换器按所选语音类型修改共振峰、发音、音调和/或增益信号中至少一个。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
1.专利
本专利技术涉及语音处理,尤其涉及按照多种预编程的特征中用户所选特征修改接收语音信号的多个方面的语音转换器。2.相关领域描述语音转换是将一说话者的语音转换为另一说话者的语音,诸如将一男性的语音转换为一女性的语音,反之亦然。语音转换系统是一新概念,多数语音转换系统仍处于研究阶段。创新技术有限公司的SOUNDBLASTER软件包是少数能在个人计算机上运行用于修改语音的已知声响效果产品。此产品使用了包括以宽带PCM形式的数字化模拟波形的输入信号,并且用于根据用户输入以多种方式修改输入信号。一些示例性效果被命名为女声变男声、男声变女声、神声(Zeus)以及小松鼠声(chipmunk)。尽管诸如这些的产品对于一些应用有用,当考虑用于比个人计算机更小型的应用中时,或者当考虑用于要求语音转换的更高级模式时,它们不是很适当。也就是,个人计算机提供大量的存储、宽带采样频率、巨大的处理功率以及在诸如无线电话的小型应用中并非总存在的其它这样的资源。根据转换的期望复杂性,为这样小型的应用开发语音转换系统非常困难或不可能。伴随已知的语音调节软件的一附加问题是经转换的语音并非总听起来自然。尽管造成此的原因可能对其它人未知,本专利技术者已经发现问题在于到诸如音调和共振峰的语音质量的相同转换的应用。结果,由于某些未解决的问题,已知语音转换系统并非对于所有应用总完全适当。专利技术摘要大致上,本专利技术涉及按照多种预编程的特征(“语音类型”)中用户所选特征规定修改输入语音的多个方面的语音转换方法。开始,语音转换器接收信号,此信号包括表示输入语音信号的共振峰信号和表示输入信号的基本频率的音调信号。可选地,一个或两个下列信号也被另外接收包括指示语音信号是有声的或无声的或混合的发声信号,以及/或者表示输入信号的能量的增益信号。语音转换器也接收多种语音类型中用户所选的一类型,每个语音类型规定一种修改一个或多个接收信号(即,共振峰、发声、音调、增益)的方式。例如,不同的语音类型可以规定信号的修改以创建单调语音、低沉的语音、女性语音、悦耳的语音、耳语语音或其它效果。语音转换器按照所选语音类型规定修改一个或多个接收信号。本专利技术向它的用户提供几个明显的优点。例如,本专利技术提供特征上为小型但功能强大的语音转换器。另外,语音转换器与诸如车载的无线电话所使用的信号的窄带信号相兼容。本专利技术的另一个优点是可以开分修改语音质量,诸如音调和共振峰。这避免了传统语音转换包产生的非自然语音,统语音转换包将同一转换率应用于音调和共振峰信号。本专利技术也提供几个其它优点和好处,它们通过本专利技术的下列描述将变得明显。附图的简要描述附图说明图1是语音处理系统的硬件组件和互连的框图。图2是数字数据处理机器的框图。图3示出了示例性信号承载媒体。图4是包括语音转换器的无线电话的框图。图5是按照多种预编程的特征中用户所选特征规定,通过修改输入语音信号而语音转换的操作顺序流程图。优选实施例的详细描述通过考虑下面提出的结合附图的详细描述,对于本领域的技术人员本专利技术的特征、性质和优点将变得更加明显。硬件组件与互连整体结构本专利技术的一方面涉及语音处理系统,可以由多种硬件组件和互连实施,一示例由图1中示出的语音处理系统100描述。语音处理系统100包括多种子组件,每个子组件可用硬件设备、软件设备、硬件或软件设备的一部分、或者上述的组合来实现。下面结合示例性的数字数据处理装置、逻辑电路以及信号承载媒体更加详细地描述这些子组件的组成。大致上,系统100接收输入语音108,使用编码器102对输入语音编码,使用语音转换器104修改经编码的语音,使用解码器106对经修改的语音解码,以及可选地再使用语音转换器104修改经解码的语音。结果为输出语音136。不像诸如SOUNDBLASTER软件包的先前产品,系统100使用语音产生类型来描述正由系统100处理的语音。语音产生类型在人造语音生成领域公知,它认为语音能够按激励源、表示声道的频率响应的滤声器以及嘴唇的多种辐射特性建模。激励源可以包括有声源和无声源或者它们的组合,有声源是喉脉冲的准周期串,无声源是在声道的不同地方产生的随机变化的噪声。一个全极点无线冲激响应滤波器对声道传递函数建模,其中极点被用于描述声道的共振频率或共振峰频率。对于每个个体,激励源由于有声语音的基本频率而被区分。共振峰频率由于声道的几何结构而被区分。为了独立地修改共振峰和音调,本专利技术将编码器内的共振峰和音调分离,编码器是基于语音产生类型被设计的。编码器102和解码器106可以使用多种商用产品的原理来实现。例如,编码器102可以使用被提供在车上的无线电话的多种已知信号编码器来实现。解码器106可以使用已知实现在基站、集线器、交换器或者无线电话网络的其它网络设施处的多种信号编码器的原理来实现。数字无线电话学中的每个连接实现某种类型的编码器和解码器。然而系统100不像编码器和解码器,它包括语音转换器104包含的中频组件,下面更详细地描述。而且,如下面更详细地描述,编码器和解码器都被提供在同一无线电话或其它计算单元中。编码器更加详细地参考图1,编码器102分析输入语音108以标识输入语音的多种属性,所述输入语音包括共振峰、发声、音调和增益。这些特性被提供在输出112a、114a、116a和118a上。可任选地,对于不试图修改语音的这些方面的应用,发声和/或增益信号以及随后它们的处理被忽略。编码器102包括预滤波器110,此预滤波器将输入语音分为适当大小的窗,如20毫秒。在示出的实施例中,输入语音的随后处理按逐个窗执行。而且,预滤波器110可以执行其它功能,诸如阻止DC信号或抑制噪声。LPC分析器112将线性预测编码(LPC)应用于预滤波器110的输出。如所说明,LPC分析器112和随后的处理阶段每时刻一窗地处理输入语音。然而为了参考简单,处理大致按照输入语音和它的副产品被讨论。LPC分析是将源信号从语音的声道特性中分离的已知技术,在多个参考中有说明,包括文本L.Rabinger&B.Juang所著的语音识别基础。此参考通过引用完全被结合与此。LPC分析器112提供LPC系数(在输出112a上)和输出112b上的残余信号。LPC系数是描述共振峰的特性。残余信号被指向发声检测器114、音调搜索器116和增益计算器118,在各个输出114a、116a、118a处提供输出信号。组件114、116、118处理残余信号以提取分别表示发声、音调和增益的源信息。在一示例中,“发声”表示输入语音108是有声的、无声的或混合的;“音调”表示输入语音108的基本频率;“增益”表示输入语音108的能量,以dB或其它适当的单位表示。可任选地,发声检测器114和增益计算器118的一个或两个可以从编码器102中被忽略。语音转换器大致上,语音转换器104从编码器102接收共振峰、发声、音调和增益信号,然后按照语音类型库130中包括的多种预编程的语音类型中用户所选类型规定而修改这些信号的一个、一些或全部。库130可以使用电路存储、磁盘存储、诸如磁带的顺序媒体或者任何其它存储媒体来实现。每个语音类型表示不同的特性,这些特性包含关于如何修改规定的一个或多个共振峰、发声、音调和/或增益的指令,以达到期望的语音转换结本文档来自技高网...

【技术保护点】
一种用于语音信号转换的方法,包括操作:接收信号,所述信号包括:表示输入语音信号的共振峰信号;包括指示输入信号是有声的、无声的或混合的发声信号;包括表示输入语音信号的基本频率的音调信号;包括表示输入语音 信号内能量的增益信号;接收多个语音类型的至少一个的用户选择,每个类型规定修改至少一个接收信号的一个方式;按照所选语音类型修改至少一个接收信号;提供包括所述修改的接收信号的输出。

【技术特征摘要】
【国外来华专利技术】US 2002-2-19 10/080,0591.一种用于语音信号转换的方法,包括操作接收信号,所述信号包括表示输入语音信号的共振峰信号;包括指示输入信号是有声的、无声的或混合的发声信号;包括表示输入语音信号的基本频率的音调信号;包括表示输入语音信号内能量的增益信号;接收多个语音类型的至少一个的用户选择,每个类型规定修改至少一个接收信号的一个方式;按照所选语音类型修改至少一个接收信号;提供包括所述修改的接收信号的输出。2.如权利要求1所述的方法,其特征在于,修改操作包括通过执行各种操作而修改共振峰信号,所执行的各种操作包括将共振峰信号的线性预测编码系数转换为线性频谱对;按照所选语音类型所规定修改线性频谱对;将经修改的线性频谱对转换为线性预测编码系数。3.如权利要求1所述的方法,修改操作包括修改音调信号,所执行的操作包括下列之一将音调信号与预定的系数相乘;将音调信号随时间与微分系数的矩阵相乘;用一个或多个电平的固定音调模式代替音调信号。4.如权利要求1所述的方法,修改操作包括将增益信号标准化为一固定值。5.如权利要求1所述的方法,修改操作包括将发声信号改变至有声的、无声的或混合的不同值。6.如权利要求1所述的方法,每个语音类型还规定滤波器类型,操作还包括按照所选语音类型规定将输出滤波。7.如权利要求1所述的方法,修改操作包括将第一转换应用于共振峰信号;将第二转换应用于音调信号,第二转换不同于第一转换。8.一种用于语音信号转换的方法,包括操作接收信号,所述信号包括表示输入语音信号的共振峰信号;包括表示输入语音信号的基本频率的音调信号;接收多个语音类型中至少一个的用户选择,每个类型规定修改共振峰信号的一个方式和修改音调信号的一不同方式;按所选语音类型规定修改接收信号;按照修改提供接收信号的输出。9.一种处理语音的方法,包括操作将线性预测编码应用于输入语音,以产生共振峰输出和残余输出;处理残余输出,以产生表示输入语音的音调、增益和发声的各个输出;接收多个预定语音类型中至少一个的用户选择,每个语音类型规定修改共振峰、音调、增益和发声输出中至少一个的一个方式和按照所选语音类型修改共振峰、音调、增益和发声中一个或多个的一个方式;再组合包括任何修改的共振峰、音调、增益和发声输出,以形成经编码的输出信号。10.信号承载媒体有形地体现为数字处理装置可执行的机器可读指令的程序,以执行语音转换操作,所述操作包括接收信号,所述信号包括表示输入语音信号的共振峰信号;包括指示输入信号是有声的、无声的或混合的发声信号;包括表示输入语音信号的基本频率的音调信号;包括表示输入语音信号内能量的增益信号;接收多个语音类型的至少一个的用户选择,每个类型规定修改至少一个接收信号的一个方式;按照所选语音类型修改至少一个接收信号;提供包括所述修改的接收信号的输出。11.如权利要求10所述的媒体,其特征在于,修改操作包括通过执行各种操作修改共振峰信号,所执行的各种操作包括将共振峰信号的线性预测编码系数转换为线性频谱对;按照所选语音类型所规定修改线性频谱对;将经修改的线性频谱对转换为线性预测编码系数。12.如权利要求10所述的媒体,修改操作包括修改音调信号,所执行的操作包括下列之一将音调信号与预定的系数相乘;将音调信号随时间与微分系数的矩阵相乘;用一个或多个电平的固定音调模式代替音调信号。13.如权利要求10所述的媒体,修改操作包括将增益信号标准化为一固定值。14.如权利要求10所述的媒体,修改操作包括将发声信号改变至有声的、无声的或混合的不同值。15.如权利要求10所述的媒体,每个语音类型还规定滤波器类型,操作还包括按照所选语音类型规定将输出滤波。16.如权利要求10所述的媒体,修改操作包括将第一转换应用于共振峰信号;将第二转换应用于音调信号,第二转换不同于第一转换。17.信号承载媒体有形地体现为数字处理装置可执行的机器可读指令的程序,以执行语音转换操作,所述操作包括接收信号,所述信号包括表示输入语音信号的共振峰信号;包括表示输入语音信号的基本频率的音调信号;接收多个语音类型中至少一个的用户选择,每个类型规定修改共振峰信号的一个方式和修改音调信号的一不同方式;按所选语音类型规定修改接收信号;按照修改提供接收信号的输出。18.信号承载媒体有形地体现为数字处理装置可执行的机器可读指令的程序,以执行语音转换操作,所述操作包括将线性预测编码应用于输入语音,以产生共振峰输出和残余输出;处理残余输出,以产生表示输入语音的音调、增益和发声的各个输出;接收多个预定语音类型中至少一个的用户选择,每个语音类型规定修改共振峰、音调、增益和发声输出中至少一个的一个方式和按照所选语音类型修改共振峰、音调、增益和发声中一个或多个的一个方式;再组合包括任何修改的共振峰、音调、增益和发声输出,以形成经编码的输出信号。19.多个互连的导电元件的电路被配置用于执行语音转换操作,所述操作包括接收信号,所述信号包括表示输入语音信号的共振峰信号;包括指示输入信号是有声的、无声的或混合的发声信号;包括表示输入语音信号的基本频率的音调信号;包括表示输入语音信号内能量的增益信号;接收多个语音类型的至少一个的用户选择,每个类型规定修改至少一个接收信号的一个方式;按照所选语音类型修改至少一个接收信号;提供包括所述修改的接收信号的输出。20.如权利要求19所述的电路,其特征在于,修改操作包括通过执行各种操作修改共振峰信号,所执行的各种操作包括将共振峰信号的线性预测编码系数转换为线性频谱对;按照所选语音类型所规定修改线性频谱对;将经修改的线性频谱对转换为线性预测编码系数。21.如权利要求19所述的电路,修改操作包括修改音调信号,所执行的操作包括下列之一将音调信号与预定的系数相乘;将音调信号随时间与微分系数的矩阵相乘;用一个或多个电平的固定音调模式代替音调信号。22.如权利要求19所述的电路,修改操作包括将增益信号标准化为一固定值。23.如权利要求19所述的电路,修改操作包括将发声信号改变至有声的、无声的或混合的不同值。24.如权...

【专利技术属性】
技术研发人员:N毕AP德加科
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1