System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音处理方法、装置及电子设备制造方法及图纸_技高网

语音处理方法、装置及电子设备制造方法及图纸

技术编号:41685126 阅读:7 留言:0更新日期:2024-06-14 15:36
本公开提供一种语音处理方法、装置及电子设备,该方法包括:显示口音转换页面,所述口音转换页面中包括目标口音相关联的口音控件和语音获取控件;响应于对所述口音控件的触控操作,确定所述目标口音的标识;响应于对所述语音获取控件的触控操作,获取所述第一语音,所述目标口音与所述第一语音的口音不同;基于第一语音和所述目标口音的标识,对所述第一语音进行口音转换处理,得到第二语音,所述第二语音的口音为所述目标口音,所述口音转换处理是基于语音处理模型实现的,所述语音处理模型是基于非平行数据的样本语音训练得到的;播放所述第二语音。提高口音转换的准确度。

【技术实现步骤摘要】

本公开实施例涉及语音处理,尤其涉及一种语音处理方法、装置及电子设备


技术介绍

1、口音转换是指将一段语音的口音改变,其中,口音指对词或特殊音节的模块化强调程度的变化特征。例如,口音可以包括陕普、港普等。

2、目前,在电子设备将原语音的口音转换为其它口音时,电子设备可以基于原语音的文本内容,在数据库中获取与该文本内容相同的其它口音的语音,并对其它口音的语音进行音色转换,使得其它口音的语音的音色与原语音的音色相同,进而实现原语音的口音转换。

3、但是,上述方法实际为语音的音色转换,若数据库中不存在与原语音的文本内容相同的其它口音的语音,则电子设备无法准确的进行口音转换,进而导致口音转换的准确度较低。


技术实现思路

1、本公开提供一种语音处理方法、装置及电子设备,用于解决现有技术中口音转换的准确度较低的技术问题。

2、第一方面,本公开提供一种语音处理方法,该方法包括:

3、显示口音转换页面,所述口音转换页面中包括目标口音相关联的口音控件和语音获取控件;

4、响应于对所述口音控件的触控操作,确定所述目标口音的标识;

5、响应于对所述语音获取控件的触控操作,获取所述第一语音,所述目标口音与所述第一语音的口音不同;

6、基于第一语音和所述目标口音的标识,对所述第一语音进行口音转换处理,得到第二语音,所述第二语音的口音为所述目标口音,所述口音转换处理是基于语音处理模型实现的,所述语音处理模型是基于非平行数据的样本语音训练得到的;

7、播放所述第二语音。

8、第二方面,本公开提供一种语音处理装置,该语音处理装置包括显示模块、响应模块、处理模块和播放模块,其中:

9、所述显示模块用于,显示口音转换页面,所述口音转换页面中包括目标口音相关联的口音控件和语音获取控件;

10、所述响应模块用于,响应于对所述口音控件的触控操作,确定所述目标口音的标识;

11、所述响应模块还用于,响应于对所述语音获取控件的触控操作,获取所述第一语音,所述目标口音与所述第一语音的口音不同;

12、所述处理模块用于,基于第一语音和所述目标口音的标识,对所述第一语音进行口音转换处理,得到第二语音,所述第二语音的口音为所述目标口音,所述口音转换处理是基于语音处理模型实现的,所述语音处理模型是基于非平行数据的样本语音训练得到的;

13、所述播放模块用于,播放所述第二语音。

14、第三方面,本公开实施例提供一种电子设备包括:处理器和存储器;

15、所述存储器存储计算机执行指令;

16、所述处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能涉及的所述语音处理方法。

17、第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能涉及的所述语音处理方法。

18、第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能涉及的所述语音处理方法。

19、本公开提供一种语音处理方法、装置及电子设备,电子设备可以显示口音转换页面,口音转换页面中包括目标口音相关联的口音控件和语音获取控件,响应于对口音控件的触控操作,确定目标口音的标识,响应于对所述语音获取控件的触控操作,获取第一语音,其中,目标口音与第一语音的口音不同,基于第一语音和目标口音的标识,对第一语音进行口音转换处理,得到第二语音,并播放第二语音,其中,第二语音的口音为目标口音,口音转换处理是基于语音处理模型实现的,语音处理模型是基于非平行数据的样本语音训练得到的。在上述方法中,由于语音处理模型是基于非平行数据的样本语音训练得到的,因此,语音处理模型可以对任意一段语音进行口音转换,并且在进行语音转换时,电子设备无需在数据库中获取与该文本内容相同的其它口音的语音,语音处理模型可以准确的对任意一段语音进行口音转换,并且可以保留语音的音色和内容,提高口音转换的准确度。

本文档来自技高网...

【技术保护点】

1.一种语音处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于第一语音和所述目标口音的标识,对所述第一语音进行口音转换处理,得到第二语音,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述响应于对所述语音获取控件的触控操作,获取所述第一语音,包括:

4.根据权利要求1或2所述的方法,其特征在于,所述响应于对所述语音获取控件的触控操作,获取所述第一语音,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,所述语音处理模型是通过以下步骤确定的:

6.根据权利要求5所述的方法,其特征在于,语音处理模型包括文本提取模块、音色提取模块和口音合成模块;针对于目标样本语音,基于所述目标样本语音对所述语音处理模型进行更新,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述口音合成模块、所述目标样本语音、所述目标样本文本特征、所述目标样本音色特征和所述第一目标音频特征,对所述语音处理模型进行更新,包括:

8.根据权利要求6所述的方法,其特征在于,针对于非目标样本语音,基于所述非目标样本语音对所述语音处理模型进行更新,包括:

9.一种语音处理装置,其特征在于,包括显示模块、响应模块、处理模块和播放模块,其中:

10.一种电子设备,其特征在于,包括:处理器和存储器;

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-8任一项所述的语音处理方法。

...

【技术特征摘要】

1.一种语音处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于第一语音和所述目标口音的标识,对所述第一语音进行口音转换处理,得到第二语音,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述响应于对所述语音获取控件的触控操作,获取所述第一语音,包括:

4.根据权利要求1或2所述的方法,其特征在于,所述响应于对所述语音获取控件的触控操作,获取所述第一语音,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,所述语音处理模型是通过以下步骤确定的:

6.根据权利要求5所述的方法,其特征在于,语音处理模型包括文本提取模块、音色提取模块和口音合成模块;针对于目标样本语音,基于所述目标样本语音对所述语音处...

【专利技术属性】
技术研发人员:贾东亚田乔李佳鑫陈远哲马明博王玉平王雨轩
申请(专利权)人:抖音视界有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1