本发明专利技术提供了一种基于重音的语音质量评价设备、方法和系统,数据处理设备和方法,语音处理设备和方法,以及移动终端,以克服现有的语音技术在评价用户的发音情况时未考虑有关语音重音的信息的问题。语音质量评价设备包括:存储单元,适于存储预定文本和预定文本对应的参考重音特征,该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;用户语音接收单元,适于接收用户针对预定文本所录入的用户语音;特征获取单元,适于获取用户语音的用户重音特征;以及语音质量计算单元,适于基于参考重音特征与用户重音特征之间的相关性,计算用户语音的语音质量。本发明专利技术的上述技术可应用于语音技术领域。
【技术实现步骤摘要】
本专利技术涉及语音
,尤其涉及一种基于重音的语音质量评价设备、方法和系统,数据处理设备和方法,语音处理设备和方法,以及移动终端。
技术介绍
随着互联网的发展,基于互联网的语言学习应用也得到了快速的发展。在一些语言学习应用中,应用提供商通过互联网将学习材料发送到客户端,用户经由客户端获取学习材料,并根据学习材料的指示而在客户端上进行操作,例如输入文字、输入语音或者进行选择等,并获得反馈,从而提高自己的语言能力。对于语言学习,除了学习语法和词汇等之外,一个重要的方面是学习语言的听说能力,尤其是说的能力。对于每种语言来说,在不同的场景下说话时往往具有不同的说话重音,例如,不同的语句和不同的单词都具有根据场景而改变的重音。一般来说,重音是指在一整句话中应当重读哪些单词(下文称为说话重音),或者在一个单词中应当对哪个音节进行重读(下文称为发音重音)。因此,用户在学习用该语言说话时,还需要学习这种说话和/或发音的重读。在现有的语音技术中,用户通过客户端的录音设备录制语音,系统根据与该语音相对应的文本,对用户录制的语音进行拆分,并逐个单词地就用户的语音和现有声学模型进行比较,从而向用户提供该单词读音是否正确的反馈。然而,现有的这种语音技术在评价用户的发音情况时忽略了有关语音重音方面的信息,因此也不能够让学习者学习说话重音和/或发音重音。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。鉴于此,本专利技术提供了一种基于重音的语音质量评价设备、方法和系统,数据处理设备和方法,语音处理设备和方法以及移动终端,以至少解决现有的语音技术在评价用户的发音情况时忽略了有关语音重音的信息的问题。根据本专利技术的一个方面,提供了一种基于重音的语音质量评价设备,包括:存储单元,适于存储预定文本和预定文本对应的参考重音特征,该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;用户语音接收单元,适于接收用户针对预定文本所录入的用户语音;特征获取单元,适于获取用户语音的用户重音特征;以及语音质量计算单元,适于基于参考重音特征与用户重音特征之间的相关性,计算用户语音的语音质量。根据本专利技术的另一个方面,还提供了一种数据处理设备,该设备适于在服务器中执行,并包括:服务器存储单元,适于存储预定文本以及与预定文本对应的至少一段参考语音;以及重音计算单元,适于根据参考语音计算该段参考语音的特征参数,或根据该特征参数计算至少一段参考语音的参考重音特征以保存在服务器存储单元中。根据本专利技术的另一个方面,还提供了一种语音处理设备,该设备适于在计算机中执行,并包括:参考语音接收单元,适于接收特定用户针对预定文本所录入的语音作为参考语音;以及重音计算单元,适于根据参考语音计算参考语音的特征参数,以将该特征参数与预定文本相关联地发送至预定服务器,或根据该特征参数获得参考语音的参考重音特征、以将参考重音特征与预定文本相关联地发送至预定服务器。根据本专利技术的另一个方面,还提供了一种基于重音的语音质量评价方法,该方法包括如下步骤:接收用户针对预定文本所录入的用户语音,该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;获取用户语音的用户重音特征;以及基于预定文本对应的参考重音特征与用户重音特征之间的相关性,计算用户语音的语音质量。根据本专利技术的另一个方面,还提供了一种数据处理方法,该方法适于在服务器中执行,并包括如下步骤:存储预定文本和与预定文本对应的至少一段参考语音;以及根据该参考语音计算该段参考语音的特征参数以保存,或根据该特征参数获得至少一段参考语音的参考重音特征以保存。根据本专利技术的另一个方面,还提供了一种语音处理方法,该方法适于在计算机中执行,并包括如下步骤:接收特定用户针对预定文本所录入的语音作为参考语音;以及根据该参考语音计算参考语音的特征参数,以将该特征参数与预定文本相关联地发送至预定服务器,或根据该特征参数计算参考语音的参考重音特征、以将参考重音特征与预定文本相关联地发送至预定服务器。根据本专利技术的另一个方面,还提供了一种移动终端,包括如上所述的基于重音的语音质量评价设备。根据本专利技术的又一个方面,还提供了一种基于重音的语音质量评价系统,包括如上所述的基于重音的语音质量评价设备和如上所述的数据处理设备。上述根据本专利技术实施例的基于重音的语音质量评价方案,其基于获取的用户语音的用户重音特征和参考重音特征之间的相关性,来计算用户语音的语音质量,能够获得至少以下益处之一:在计算用户语音的语音质量的过程中考虑了有关语音重音的信息,能够使用户根据计算结果来获知自己所录制的语音在重音方面的准确度,进而有利于用户判断是否需要纠正自己的说话重音和/或发音重音;对用户语音的计算和评价在客户端计算机或客户端移动终端上完成,使用户可以进行离线学习;计算量较小;节省时间;操作更加简单、方便;以及当用户重音特征的表示形式改变时,能够方便地将根据参考语音的重音信息所计算的参考重音特征表示成与用户重音特征相同的形式,使得语音质量评价设备的处理更加灵活、方便,实用性更强。通过以下结合附图对本专利技术的最佳实施例的详细说明,本专利技术的这些以及其他优点将更加明显。附图说明本专利技术可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本专利技术的优选实施例和解释本专利技术的原理和优点。在附图中:图1是示意性地示出移动终端100的结构框图;图2是示意性地示出根据本专利技术一个实施例的基于重音的语音质量评价设备200的一种示例性结构的框图;图3是示意性地示出图2所示的特征获取单元230的一种可能结构的框图;图4是示意性地示出根据本专利技术另一个实施例的基于重音的语音质量评价设备400的一种示例性结构的框图;图5是示意性地示出根据本专利技术一个实施例的数据处理设备500的一种示例性结构的框图;图6是示意性地示出根据本本文档来自技高网...
【技术保护点】
一种基于重音的语音质量评价设备,包括:存储单元,适于存储预定文本和所述预定文本对应的参考重音特征,该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;用户语音接收单元,适于接收用户针对预定文本所录入的用户语音;特征获取单元,适于获取所述用户语音的用户重音特征;以及语音质量计算单元,适于基于所述参考重音特征与所述用户重音特征之间的相关性,计算所述用户语音的语音质量。
【技术特征摘要】
1.一种基于重音的语音质量评价设备,包括:
存储单元,适于存储预定文本和所述预定文本对应的参考重音特征,
该预定文本包括一个或者多个语句,且每个语句包括一个或者多个词;
用户语音接收单元,适于接收用户针对预定文本所录入的用户语音;
特征获取单元,适于获取所述用户语音的用户重音特征;以及
语音质量计算单元,适于基于所述参考重音特征与所述用户重音特征
之间的相关性,计算所述用户语音的语音质量。
2.根据权利要求1所述的语音质量评价设备,其中,所述特征获取
单元包括:
对齐子单元,适于利用预定声学模型将所述用户语音与所述预定文本
进行强制对齐,以确定所述预定文本中的每个词和/或每个词中的每个音
节和/或每个音节的每个音素与所述用户语音的部分之间的对应关系;以
及
特征计算子单元,适于基于所述对应关系计算所述用户语音的用户重
音特征。
3.根据权利要求2所述的语音质量评价设备,其中,所述特征计算
子单元适于:
针对所述预定文本的每个语句:
基于所述对应关系,获取每个词和/或每个词中的每个音节在所
述用户语音中所对应的语音块的特征参数;以及
利用经过训练的预定专家模型以及每个语音块的特征参数,获得
每个语音块的重读属性;以及
基于所获得的各语句的各词和/或各词中的各个音节对应的语音块的
重读属性,形成所述用户语音的重音特征。
4.根据权利要求3所述的语音质量评价设备,其中,每个语音块包
\t括一段声波,且该语音块的特征参数包括以下参数中的至少一种:
该语音块对应声波波形的波峰和波谷;
该语音块对应声波波形的波峰和波谷的绝对值以及波形的能量
值;
该语音块的持续时长或该语音块的归一化的持续时长;
从该语音块中获得的音调信息的平均值;
对从该语音块中获得的音调信息进行差分而得到的差分值的平
均值;以及
通过将从该语音块中获得的音调信息的形状和预定义的多个音
...
【专利技术属性】
技术研发人员:林晖,
申请(专利权)人:上海流利说信息技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。