语音分析器和相关方法技术

技术编号：34005261 阅读：30 留言：0更新日期：2022-07-02 13:12

公开了一种语音分析器和相关方法，所述语音分析器包括：输入模块，用于基于语音信号提供语音数据；主要特征提取器，用于提供语音数据的主要特征指标；次要特征提取器，用于提供与语音数据相关联的次要特征指标；以及语音模型模块，所述语音模型模块包括具有模型层的神经网络，所述模型层包括输入层、包括第一中间层的一个或多个中间层、以及用于提供说话者指标的输出层，其中，所述语音模型模块被配置为基于次要特征指标来调节中间层，用于提供来自中间层的输出，作为在神经网络中的中间层之后的模型层的输入。的模型层的输入。的模型层的输入。

全部详细技术资料下载

【技术实现步骤摘要】
语音分析器和相关方法

[0001]本公开涉及语音处理和相关工具和方法，以及尤其用于分析、监控和/或评估一个或多个说话者的语音的系统。因此，提供了一种语音分析器和相关方法，特别是确定说话者指标的方法。

技术介绍

[0002]情感计算社区长期以来一直在寻找一种有效的方法来使用多模态信息的组合来自动识别说话者的状态和/或特点。例如，先前在情绪表达和感知方面的研究表明，包括视觉、文本和声学模态在内的不同模态在有效的说话者状态和/或特点确定中起作用。
[0003]然而，存在许多应用场景，这些场景中，只有这些模态的子集可用。

技术实现思路

[0004]因此，需要具有改进的说话者指标确定/识别的系统、电子装置和方法。
[0005]提供了一种语音分析器，该语音分析器包括：输入模块，用于基于语音信号提供语音数据；主要特征提取器，用于提供语音数据的主要特征指标；次要特征提取器，用于提供与语音数据相关联的次要特征指标；以及语音模型模块，所述语音模型模块包括具有模型层的神经网络，所述模型层包括输入层、包括第一中间层的一个或多个中间层、以及用于提供说话者指标的输出层。所述语音模型模块可选地被配置为调节一个或多个模型层，例如，被配置为基于次要特征指标来调节中间层，用于提供来自中间层的输出，作为在神经网络中的中间层之后的模型层的输入。
[0006]还公开了一种确定说话者指标的方法，所述方法包括：获得语音数据；基于语音数据确定主要特征指标；确定与语音数据相关联的次要特征指标；并且基于主要特征指标和次要特征指标...

【技术保护点】

【技术特征摘要】
1.一种语音分析器，包括：输入模块，用于基于语音信号提供语音数据；主要特征提取器，用于提供所述语音数据的主要特征指标；次要特征提取器，用于提供与所述语音数据相关联的次要特征指标；以及语音模型模块，包括具有模型层的神经网络，所述模型层包括输入层、包括第一中间层的一个或多个中间层以及用于提供说话者指标的输出层，其中，所述语音模型模块被配置为基于所述次要特征指标来调节中间层，用于提供来自所述中间层的输出，作为到在神经网络中的所述中间层之后的模型层的输入。2.根据权利要求1所述的语音分析器，其中，所述语音模型包括多个中间层，并且其中，所述语音模型模块被配置为基于所述次要特征指标来调节所述多个中间层中的至少两个。3.根据权利要求2所述的语音分析器，其中，所述语音模型包括至少三个中间层，并且其中，所述语音模型模块被配置为基于所述次要特征指标来调节每个中间层。4.根据权利要求3所述的语音分析器，其中，所述语音模型的中间层具有相同维度的输出，并且其中，调节中间层包括通过线性坐标变换来调整所述次要特征指标的维度，用于将所述次要特征指标匹配到所述中间层的输出。5.根据权利要求1
‑
4中任一项所述的语音分析器，其中，所述语音模型模块被配置为基于所述次要特征指标来调节所述输入层，用于提供来自所述输入层的输出。6.根据权利要求5所述的语音分析器，其中，调节所述输入层包括将所述次要特征指标与所述主要特征指标融合，用于向输入层处理提供输入。7.根据权利要求1
‑
6中任一项所述的语音分析器，其中，基于所述次要特征指标来调节中间层包括将所述次要特征指标与所述中间层的中间层处理的输出融合，用于提供来自所述中间层的输出，作为到所述神经网络中的所述中间层之后...

【专利技术属性】
技术研发人员：弗洛里安，
申请(专利权)人：艾于德埃林公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人