使用预编程的语音特征的语音转换器制造技术

技术编号：3046306 阅读：288 留言：0更新日期：2012-04-11 18:40

语音处理系统按照多种预编程的语音类型中用户所选类型来修改输入语音的各个方面。开始，语音转换器接收表示输入语音信号的共振峰信号和表示输入信号的基本频率的音调信号。以下一个或两个也可以被接收：包括指示输入信号是有声的、无声的或混合的发声信号，以及／或者表示输入语音信号的能量的增益信号。语音转换器也接收多个预编程的语音类型中用户所选类型，每个类型规定修改一个或多个接收信号（即，共振峰、发声、音调、增益）的一个方式。语音转换器按所选语音类型修改共振峰、发音、音调和／或增益信号中至少一个。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
1.专利
本专利技术涉及语音处理，尤其涉及按照多种预编程的特征中用户所选特征修改接收语音信号的多个方面的语音转换器。2.相关领域描述语音转换是将一说话者的语音转换为另一说话者的语音，诸如将一男性的语音转换为一女性的语音，反之亦然。语音转换系统是一新概念，多数语音转换系统仍处于研究阶段。创新技术有限公司的SOUNDBLASTER软件包是少数能在个人计算机上运行用于修改语音的已知声响效果产品。此产品使用了包括以宽带PCM形式的数字化模拟波形的输入信号，并且用于根据用户输入以多种方式修改输入信号。一些示例性效果被命名为女声变男声、男声变女声、神声(Zeus)以及小松鼠声(chipmunk)。尽管诸如这些的产品对于一些应用有用，当考虑用于比个人计算机更小型的应用中时，或者当考虑用于要求语音转换的更高级模式时，它们不是很适当。也就是，个人计算机提供大量的存储、宽带采样频率、巨大的处理功率以及在诸如无线电话的小型应用中并非总存在的其它这样的资源。根据转换的期望复杂性，为这样小型的应用开发语音转换系统非常困难或不可能。伴随已知的语音调节软件的一附加问题是经转换的语音并非总听起来自然。尽管造成此的原因可能对其它人未知，本专利技术者已经发现问题在于到诸如音调和共振峰的语音质量的相同转换的应用。结果，由于某些未解决的问题，已知语音转换系统并非对于所有应用总完全适当。专利技术摘要大致上，本专利技术涉及按照多种预编程的特征(“语音类型”)中用户所选特征规定修改输入语音的多个方面的语音转换方法。开始，语音转换器接收信号，此信号包括表示输入语音信号的共振峰信号和表示输入信...

【技术保护点】
一种用于语音信号转换的方法，包括操作：接收信号，所述信号包括：表示输入语音信号的共振峰信号；包括指示输入信号是有声的、无声的或混合的发声信号；包括表示输入语音信号的基本频率的音调信号；包括表示输入语音信号内能量的增益信号；接收多个语音类型的至少一个的用户选择，每个类型规定修改至少一个接收信号的一个方式；按照所选语音类型修改至少一个接收信号；提供包括所述修改的接收信号的输出。

【技术特征摘要】
【国外来华专利技术】US 2002-2-19 10/080,0591.一种用于语音信号转换的方法，包括操作接收信号，所述信号包括表示输入语音信号的共振峰信号；包括指示输入信号是有声的、无声的或混合的发声信号；包括表示输入语音信号的基本频率的音调信号；包括表示输入语音信号内能量的增益信号；接收多个语音类型的至少一个的用户选择，每个类型规定修改至少一个接收信号的一个方式；按照所选语音类型修改至少一个接收信号；提供包括所述修改的接收信号的输出。2.如权利要求1所述的方法，其特征在于，修改操作包括通过执行各种操作而修改共振峰信号，所执行的各种操作包括将共振峰信号的线性预测编码系数转换为线性频谱对；按照所选语音类型所规定修改线性频谱对；将经修改的线性频谱对转换为线性预测编码系数。3.如权利要求1所述的方法，修改操作包括修改音调信号，所执行的操作包括下列之一将音调信号与预定的系数相乘；将音调信号随时间与微分系数的矩阵相乘；用一个或多个电平的固定音调模式代替音调信号。4.如权利要求1所述的方法，修改操作包括将增益信号标准化为一固定值。5.如权利要求1所述的方法，修改操作包括将发声信号改变至有声的、无声的或混合的不同值。6.如权利要求1所述的方法，每个语音类型还规定滤波器类型，操作还包括按照所选语音类型规定将输出滤波。7.如权利要求1所述的方法，修改操作包括将第一转换应用于共振峰信号；将第二转换应用于音调信号，第二转换不同于第一转换。8.一种用于语音信号转换的方法，包括操作接收信号，所述信号包括表示输入语音信号的共振峰信号；包括表示输入语音信号的基本频率的音调信号；接收多个语音类型中至少一个的用户选择，每个类型规定修改共振峰信号的一个方式和修改音调信号的一不同方式；按所选语音类型规定修改接收信号；按照修改提供接收信号的输出。9.一种处理语音的方法，包括操作将线性预测编码应用于输入语音，以产生共振峰输出和残余输出；处理残余输出，以产生表示输入语音的音调、增益和发声的各个输出；接收多个预定语音类型中至少一个的用户选择，每个语音类型规定修改共振峰、音调、增益和发声输出中至少一个的一个方式和按照所选语音类型修改共振峰、音调、增益和发声中一个或多个的一个方式；再组合包括任何修改的共振峰、音调、增益和发声输出，以形成经编码的输出信号。10.信号承载媒体有形地体现为数字处理装置可执行的机器可读指令的程序，以执行语音转换操作，所述操作包括接收信号，所述信号包括表示输入语音信号的共振峰信号；包括指示输入信号是有声的、无声的或混合的发声信号；包括表示输入语音信号的基本频率的音调信号；包括表示输入语音信号内能量的增益信号；接收多个语音类型的至少一个的用户选择，每个类型规定修改至少一个接收信号的一个方式；按照所选语音类型修改至少一个接收信号；提供包括所述修改的接收信号的输出。11.如权利要求10所述的媒体，其特征在于，修改操作包括通过执行各种操作修改共振峰信号，所执行的各种操作包括将共振峰信号的线性预测编码系数转换为线性频谱对；按照所选语音类型所规定修改线性频谱对；将经修改的线性频谱对转换为线性预测编码系数。12.如权利要求10所述的媒体，修改操作包括修改音调信号，所执行的操作包括下列之一将音调信号与预定的系数相乘；将音调信号随时间与微分系数的矩阵相乘；用一个或多个电平的固定音调模式代替音调信号。13.如权利要求10所述的媒体，修改操作包括将增益信号标准化为一固定值。14.如权利要求10所述的媒体，修改操作包括将发声信号改变至有声的、无声的或混合的不同值。15.如权利要求10所述的媒体，每个语音类型还规定滤波器类型，操作还包括按照所选语音类型规定将输出滤波。16.如权利要求10所述的媒体，修改操作包括将第一转换应用于共振峰信号；将第二转换应用于音调信号，第二转换不同于第一转换。17.信号承载媒体有形地体现为数字处理装置可执行的机器可读指令的程序，以执行语音转换操作，所述操作包括接收信号，所述信号包括表示输入语音信号的共振峰信号；包括表示输入语音信号的基本频率的音调信号；接收多个语音类型中至少一个的用户选择，每个类型规定修改共振峰信号的一个方式和修改音调信号的一不同方式；按所选语音类型规定修改接收信号；按照修改提供接收信号的输出。18.信号承载媒体有形地体现为数字处理装置可执行的机器可读指令的程序，以执行语音转换操作，所述操作包括将线性预测编码应用于输入语音，以产生共振峰输出和残余输出；处理残余输出，以产生表示输入语音的音调、增益和发声的各个输出；接收多个预定语音类型中至少一个的用户选择，每个语音类型规定修改共振峰、音调、增益和发声输出中至少一个的一个方式和按照所选语音类型修改共振峰、音调、增益和发声中一个或多个的一个方式；再组合包括任何修改的共振峰、音调、增益和发声输出，以形成经编码的输出信号。19.多个互连的导电元件的电路被配置用于执行语音转换操作，所述操作包括接收信号，所述信号包括表示输入语音信号的共振峰信号；包括指示输入信号是有声的、无声的或混合的发声信号；包括表示输入语音信号的基本频率的音调信号；包括表示输入语音信号内能量的增益信号；接收多个语音类型的至少一个的用户选择，每个类型规定修改至少一个接收信号的一个方式；按照所选语音类型修改至少一个接收信号；提供包括所述修改的接收信号的输出。20.如权利要求19所述的电路，其特征在于，修改操作包括通过执行各种操作修改共振峰信号，所执行的各种操作包括将共振峰信号的线性预测编码系数转换为线性频谱对；按照所选语音类型所规定修改线性频谱对；将经修改的线性频谱对转换为线性预测编码系数。21.如权利要求19所述的电路，修改操作包括修改音调信号，所执行的操作包括下列之一将音调信号与预定的系数相乘；将音调信号随时间与微分系数的矩阵相乘；用一个或多个电平的固定音调模式代替音调信号。22.如权利要求19所述的电路，修改操作包括将增益信号标准化为一固定值。23.如权利要求19所述的电路，修改操作包括将发声信号改变至有声的、无声的或混合的不同值。24.如权...

【专利技术属性】
技术研发人员：N毕，AP德加科，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人