语音处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37182372 阅读：28 留言：0更新日期：2023-04-20 22:47

本公开提供了一种语音处理方法、装置、电子设备及存储介质，涉及语音合成技术领域。该方法包括获取第一语音的声音特征；根据第一语音的声音特征，将第一语音的转写文本转换为第二语音，第二语音的声音特征与第一语音的声音特征相同，且第二语音的语种与第一语音的语种不同。本公开实施例能够使不同语种的语音在转换过程中，保留原始说话人的声音特征，以便听众能够根据不同的声音特征区分不同的说话人。众能够根据不同的声音特征区分不同的说话人。众能够根据不同的声音特征区分不同的说话人。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置、电子设备及存储介质

[0001]本公开涉及语音合成
，尤其涉及一种语音处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着语音合成技术的快速发展，语音合成技术在人们的生活和工作中扮演着越来越重要的角色。在跨语种实时交流的场景中，相关技术虽然能够实时通过机器翻译，并根据翻译结果合成语音，但是由机器实时合成的声音无法体现出不同说话人的音色特点，从而使听众容易产生听觉疲劳，甚至由于无法区分说话人而对语音传达的内容产生误解。

技术实现思路

[0003]有鉴于此，本公开提供一种语音处理方法、装置、电子设备及存储介质，可以在跨语种实时交流的场景下，对说话人的语音进行转换时，保留说话人的声音特征。
[0004]第一方面，提供一种语音处理方法，包括：获取第一语音的声音特征；根据第一语音的声音特征，将第一语音的转写文本转换为第二语音，第二语音的声音特征与第一语音的声音特征相同，且第二语音的语种与第一语音的语种不同。
[0005]在一些实施例中，获取第一语音的声音特征，包括：对第一语音进行语音端点检测，得到第一语音中的语音端点；根据第一语音中的语音端点，将第一语音划分为多个语音片段；根据多个语音片段的转写文本，在多个语音片段中筛选满足预设语音条件的语音片段；对满足预设语音条件的语音片段进行声音特征提取，得到第一语音的声音特征。
[0006]在一些实施例中，语音处理方法还包括：获取第一语音的情绪特征；在第一语音的情绪特征发生变化的情况下，将发生变化后的第一语音的...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法，其特征在于，包括：获取第一语音的声音特征；根据第一语音的声音特征，将所述第一语音的转写文本转换为第二语音，所述第二语音的声音特征与所述第一语音的声音特征相同，且所述第二语音的语种与所述第一语音的语种不同。2.根据权利要求1所述的方法，其特征在于，所述获取第一语音的声音特征，包括：对所述第一语音进行语音端点检测，得到所述第一语音中的语音端点；根据所述第一语音中的语音端点，将所述第一语音划分为多个语音片段；根据所述多个语音片段的转写文本，在所述多个语音片段中筛选满足预设语音条件的语音片段；对所述满足预设语音条件的语音片段进行声音特征提取，得到所述第一语音的声音特征。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述第一语音的情绪特征；在所述第一语音的情绪特征发生变化的情况下，将发生变化后的所述第一语音的情绪特征标注至所述第一语音的转写文本中。4.根据权利要求3所述的方法，其特征在于，所述获取所述第一语音的情绪特征，包括：分别计算多个预设情绪标签与所述第一语音与之间的相似度；将所述多个预设情绪标签中，与所述第一语音之间相似度最高的预设情绪标签，作为所述第一语音的情绪特征。5.根据权利要求3所述的方法，其特征在于，在所述获取第一语音的声音特征之后，还包括：在所述第一语音的情绪...

【专利技术属性】
技术研发人员：黄爽，潘青华，张为泰，黄明登，
申请(专利权)人：科大讯飞股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人