语音评价的方法和装置制造方法及图纸

技术编号:21037400 阅读:24 留言:0更新日期:2019-05-04 06:48
本申请实施例提供了一种语音评价的方法和装置。该方法包括:获取待评价语音;根据音素评分模型确定所述待评价语音的音素的评分结果,述音素的评分结果包括所述音素相对于所述音素的正确音素的评分和所述音素相对于所述音素的相似音素的评分;根据所述音素的评分结果确定所述待评价语音的评价结果。本申请实施例的语音评价的方法和装置,能够提升用户的体验。

【技术实现步骤摘要】
语音评价的方法和装置
本申请涉及语音信号处理
,并且更为具体地,涉及一种语音评价的方法和装置。
技术介绍
随着全球经济一体化的发展,世界各国之间的交流越来越频繁,越来越多的人也开始学习外语。应用户对外语学习的需求,出现了各种各样的学习软件。例如,对于学习英语的用户来说,“英语流利说”可以作为一个很好的软件进行学习,但是这种软件只能显示总体的得分情况让用户知道大概发音有哪些问题,不能反馈一个明确的、精准的指示,不利于用户及时准确的纠正发音。因此,需要提供一种有效的语音评价的方案,以提升用户的体验。
技术实现思路
本申请提供一种语音评价的方法和装置,能够提升用户的体验。第一方面,本申请提供一种语音评价的方法,该方法包括:获取待评价语音;根据音素评分模型确定所述待评价语音的音素的评分结果,所述音素的评分结果包括所述音素相对于所述音素的正确音素的评分和所述音素相对于所述音素的相似音素的评分;根据所述音素的评分结果确定所述待评价语音的评价结果。在本申请提供的语音评价的方法中,音素的评分结果中包括相对于正确音素的评分和相对于相似音素的评分,因此能够提供相似音素的反馈,有利于用户及时准确的纠正发音,提升用户的体验。结合第一方面,在第一方面的一种可能的实现方式中,所述待评价语音的评价结果包括:所述音素的发音是否正确;和/或,所述音素的发音错发为哪个发音;其中,所述根据所述音素的评分结果确定所述待评价语音的评价结果,包括:若所述音素相对于所述音素的正确音素的评分在所述音素的评分结果中最高,则确定所述音素的发音正确;和/或,若所述音素相对于所述音素的相似音素中的第一相似音素的评分在所述音素的评分结果中最高,则确定所述音素的发音错发为所述第一相似音素的发音。结合第一方面,在第一方面的一种可能的实现方式中,所述待评价语音的评价结果还包括所述待评价语音的评分;其中,所述根据所述音素的评分结果确定所述待评价语音的评价结果,包括:根据所述音素相对于所述音素的正确音素的评分,确定所述待评价语音的评分。结合第一方面,在第一方面的一种可能的实现方式中,所述根据音素评分模型确定所述待评价语音的音素的评分结果,包括:确定所述音素的正确音素的音素评分模型和所述音素的相似音素的音素评分模型;根据所述音素的正确音素的音素评分模型,确定所述音素相对于所述音素的正确音素的评分;根据所述音素的相似音素的音素评分模型,确定所述音素相对于所述音素的相似音素的评分。结合第一方面,在第一方面的一种可能的实现方式中,在所述根据音素评分模型确定所述待评价语音的音素的评分结果之前,所述方法还包括:对所述待评价语音进行音素对齐,得到所述待评价语音的音素的特征。在本申请提供的语音评价的方法中,在确定待评价语音的音素的评分结果之前,先对待评价语音进行音素对齐,以便于音素评分模型对待评价语音进行音素的评分。结合第一方面,在第一方面的一种可能的实现方式中,所述对所述待评价语音进行音素对齐,包括:对所述待评价语音进行切分,得到切分后的帧特征;根据对齐模型,对所述切分后的帧特征进行音素对齐,得到所述待评价语音的音素的特征。结合第一方面,在第一方面的一种可能的实现方式中,所述音素的相似音素包括与所述音素的相似度高于预定阈值的音素。结合第一方面,在第一方面的一种可能的实现方式中,所述方法还包括:根据音素相似度矩阵,获取所述音素的相似音素,其中,所述音素相似度矩阵包括所有音素之间的相似度。结合第一方面,在第一方面的一种可能的实现方式中,所述音素的相似音素包括除所述音素外的所有音素。第二方面,提供了一种语音评价的装置,包括执行上述第一方面或其任意可能的实现方式中的方法的模块。第三方面,本申请还提供了一种计算机(或手机等设备),包含上述的语音评价装置。第四方面,本申请还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为执行上述的语音评价的方法。第五方面,本申请还提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述的语音评价的方法。第六方面,本申请还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器执行上述的语音评价的方法。附图说明图1是应用本申请实施例的技术方案的一个场景的示意图;图2是本申请一个实施例的语音评价的方法的示意性流程图;图3是本申请实施例的音素相似度矩阵的示意图;图4是本申请另一个实施例的语音评价的方法的示意性流程图;图5是本申请实施例的语音的评价结果的示意图;图6是本申请一个实施例的语音评价的装置的示意性框图;图7是本申请另一个实施例的语音评价的装置的示意性框图;以及图8是本申请实施例提供的电子设备的结构示意图。具体实施方式下面结合附图,对本申请实施例中的技术方案进行描述。应理解,本说明书中的具体的例子只是为了帮助本领域技术人员更好地理解本申请实施例,而非限制本申请实施例的范围。应理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。还应理解,本说明书中描述的各种实施方式,既可以单独实施,也可以组合实施,本申请实施例对此不作限定。除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的
的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。下面结合图1,对本申请实施例的应用场景进行举例说明。图1示出了应用本申请实施例的语音评价的方法的一个场景的示意图。如图1所示,语音评价的装置110与输入设备120通信连接,待评价语音通过输入设备120输入至装置110,装置110可以对输入的待评价语音进行评价。例如,待评价语音可以是初学者录制的一段语音或一个单词。输入设备120可以输入一段语音也可以同时输入多段语音,本申请实施例对此不作限定。装置110可以是具有信息处理能力的电子设备或系统,例如计算机。装置110包括处理器,用于实现信息的处理,例如,采用本申请实施例的技术方案对语音进行待评。处理器可以为任意种类的处理器,本申请实施例对此不作限定。装置110还可以包括存储器。该存储器可用于存储信息和指令,例如,实现本申请实施例的技术方案的计算机可执行指令。该存储器可以为任意种类的存储器,本申请实施例对此也不作限定。装置110还可以包括通信接口,通过通信接口与输入设备120通信连接,该通信连接可以是有线方式,也可以是无线方式。装置110还可以包括显示设备,用于显示处理结果,例如待评价语音的音素的发音是否正确、错发为哪个音素或得分情况等。图2示出了本申请实施例的语音评价的方法200的示意性流程图。该方法200可以由图1中的装置110执行。210,获取待评价语音。所述待评价语音可以是初学者学习外语的一段录音或一个单词,也可以是普通用户的一段录音,本申请对此不作限定,只要是用户想要评价的语音均可应用本申请实施例。所述待评价语音的语本文档来自技高网
...

【技术保护点】
1.一种语音评价的方法,其特征在于,包括:获取待评价语音;根据音素评分模型确定所述待评价语音的音素的评分结果,所述音素的评分结果包括所述音素相对于所述音素的正确音素的评分和所述音素相对于所述音素的相似音素的评分;根据所述音素的评分结果确定所述待评价语音的评价结果。

【技术特征摘要】
1.一种语音评价的方法,其特征在于,包括:获取待评价语音;根据音素评分模型确定所述待评价语音的音素的评分结果,所述音素的评分结果包括所述音素相对于所述音素的正确音素的评分和所述音素相对于所述音素的相似音素的评分;根据所述音素的评分结果确定所述待评价语音的评价结果。2.根据权利要求1所述的方法,其特征在于,所述待评价语音的评价结果包括:所述音素的发音是否正确;和/或,所述音素的发音错发为哪个发音;其中,所述根据所述音素的评分结果确定所述待评价语音的评价结果,包括:若所述音素相对于所述音素的正确音素的评分在所述音素的评分结果中最高,则确定所述音素的发音正确;和/或,若所述音素相对于所述音素的相似音素中的第一相似音素的评分在所述音素的评分结果中最高,则确定所述音素的发音错发为所述第一相似音素的发音。3.根据权利要求2所述的方法,其特征在于,所述待评价语音的评价结果还包括所述待评价语音的评分;其中,所述根据所述音素的评分结果确定所述待评价语音的评价结果,包括:根据所述音素相对于所述音素的正确音素的评分,确定所述待评价语音的评分。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据音素评分模型确定所述待评价语音的音素的评分结果,包括:确定所述音素的正确音素的音素评分模型和所述音素的相似音素的音素评分模型;根据所述音素的正确音素的音素评分模型,确定所述音素相对于所述音素的正确音素的评分;根据所述音素的相似音素的音素评分模型,确定所述音素相对于所述音素的相似音素的评分。5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述根据音素评分模型确定所述待评价语音的音素的评分结果之前,所述方法还包括:对所述待评价语音进行音素对齐,得到所述待评价语音的音素的特征。6.根据权利要求5所述的方法,其特征在于,所述对所述待评价语音进行音素对齐,包括:对所述待评价语音进行切分,得到切分后的帧特征;根据对齐模型,对所述切分后的帧特征进行音素对齐,得到所述待评价语音的音素的特征。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述音素的相似音素包括与所述音素的相似度高于预定阈值的音素。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:根据音素相似度矩阵,获取所述音素的相似音素,其中,所述音素相似度矩阵包括所有音素之间的相似度。9.根据权利要求1至6中任一项所述的方法,其特征在于,所述音...

【专利技术属性】
技术研发人员:高芸刘雷欧志刚刁少帅程建峰谢寅峰
申请(专利权)人:北京精鸿软件科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1