一种身份加密的情感语音合成方法及系统技术方案

技术编号：42605243 阅读：17 留言：0更新日期：2024-09-03 18:14

本发明专利技术涉及语音合成技术领域，具体涉及一种身份加密的情感语音合成方法及系统；包括输入模块、语音特征提取模块、情感分析模块、文本转换模块、语音合成模块、加密处理模块和输出模块，情感分析模块用于根据声学特征识别出用户的情感倾向，得到情感分析结果；文本转换模块用于分别将情感分析结果、原始语音数据进行文本转换，分别得到情感分析文本数据、原始语音文本数据；语音合成模块用于将情感分析文本数据、原始语音文本数据转换为合成语音；加密处理模块用于对合成语音进行加密；通过上述方式，实现在保留语音自然度和表达丰富性的同时，保证语音消息隐私安全。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成，尤其涉及一种身份加密的情感语音合成方法及系统。

技术介绍

1、在信息技术快速发展的今天，语音识别与合成技术已广泛应用于智能设备、虚拟助手、远程通信等多个领域，成为现代通信不可或缺的一部分。现有的技术通过高度复杂的算法，能够准确识别和模拟人类的语音，实现人机交互的自然流畅。在语音合成领域，文本到语音(tts)技术的发展已从最初的拼接合成发展到基于深度学习的端到端生成模型，能够生成极为自然的语音，几乎无法与真人语音区分。

2、虽然现有的语音识别与合成技术已经取得了显著进展，但在个人隐私保护方面仍存在不少挑战。当前技术主要关注于提高识别准确度和合成自然度，较少考虑语音数据本身可能携带的敏感信息。现有的语音加密技术多数聚焦于信号级别的加密，虽然在一定程度上可以保护语音内容不被轻易理解，但往往会导致语音品质下降，甚至在一些情况下，经过专业分析仍然可能恢复出原始语音内容，导致隐私泄露。

3、因此，提出一种在保留语音自然度和表达丰富性的同时，保证语音消息隐私安全的情感语音合成方法及系统是十分有必要的。

技术实现思路

1、本专利技术的目的在于提供一种身份加密的情感语音合成方法及系统，实现在保留语音自然度和表达丰富性的同时，保证语音消息隐私安全。

2、为实现上述目的，本专利技术采用的一种身份加密的情感语音合成系统，包括输入模块、语音特征提取模块、情感分析模块、文本转换模块、语音合成模块、加密处理模块和输出模块，所述输入模块分别与所述语音特征

3、所述输入模块用于用户输入原始语音数据；

4、所述语音特征提取模块用于从原始语音数据中提取出声学特征；

5、所述情感分析模块用于根据声学特征识别出用户的情感倾向，得到情感分析结果；

6、所述文本转换模块用于分别将情感分析结果、原始语音数据进行文本转换，分别得到情感分析文本数据、原始语音文本数据；

7、所述语音合成模块用于将情感分析文本数据、原始语音文本数据转换为合成语音；

8、所述加密处理模块用于对合成语音进行加密；

9、所述输出模块用于对用户输出合成语音。

10、其中，所述语音特征提取模块包括语音预处理单元、语音特征提取单元、语音特征融合单元和综合声学特征输出单元，所述语音预处理单元与所述输入模块连接，所述语音特征提取单元与所述语音预处理单元连接，所述语音特征融合单元分别与所述语音特征提取单元和所述综合声学特征输出单元连接。

11、其中，所述语音预处理单元用于对原始语音数据进行去噪和增强处理；

12、所述语音特征提取单元用于提取原始语音数据中的声学特征，包括音高、音色、语速、节奏、强度；

13、所述语音特征融合单元用于将提取到的声学特征进行融合，得到综合声学特征；

14、所述综合声学特征输出单元用于输出综合声学特征。

15、其中，所述情感分析模块包括情感特征提取单元、情感特征融合单元、对抗性训练单元、元学习策略单元和情感状态输出单元，所述情感特征提取单元与所述语音特征提取模块连接，所述情感特征融合单元分别与所述情感特征提取单元和所述对抗性训练单元连接，所述元学习策略单元与所述对抗性训练单元连接，所述情感状态输出单元与所述元学习策略单元连接。

16、其中，所述情感特征提取单元用于从声学特征中提取情感特征；

17、所述情感特征融合单元用于融合情感特征；

18、所述对抗性训练单元用于引入扰动，对识别融合情感特征进行训练；

19、所述元学习策略单元用于在多种识别任务进行训练，并得到情感分析结果；

20、所述情感状态输出单元用于输出情感分析结果。

21、其中，所述语音合成模块包括文本预处理单元、情感编码单元、数据处理单元、语音生成单元、优化单元、评估单元和合成语音输出单元，所述文本预处理单元与所述输入模块连接，所述情感编码单元与所述情感分析模块连接，所述数据处理单元分别与所述文本预处理单元和所述情感编码单元连接，所述语音生成单元与所述数据处理单元连接，所述优化单元分别与所述语音生成单元和所述评估单元连接，所述合成语音输出单元与所述评估单元连接。

22、其中，所述文本预处理单元用于将原始语音数据进行文本转换，得到原始语音文本数据；

23、所述情感编码单元用于将情感分析结果进行文本转换，得到情感分析文本数据；

24、所述数据处理单元用于分别对原始语音文本数据和情感分析文本数据进行处理；

25、所述语音生成单元用于分别根据处理后的原始语音文本数据和情感分析文本数据生成语音数据；

26、所述优化单元用于对生成的语音数据进行优化处理；

27、所述评估单元用于对生成的语音数据进行语音质量评估；

28、所述合成语音输出单元用于将生成的语音数据进行合成。

29、其中，所述加密处理模块包括格式转换单元、同态加密处理单元、量子密钥单元、属性加密单元、轻量加密单元和加密数据存储单元，所述格式转换单元分别与所述语音合成模块、所述同态加密处理单元、所述量子密钥单元、所述属性加密单元和所述轻量加密单元连接，所述加密数据存储单元分别与所述语音合成模块、所述同态加密处理单元、所述量子密钥单元、所述属性加密单元、所述轻量加密单元连接和所述输出模块连接。

30、其中，所述格式转换单元用于对合成语音进行格式的转换；

31、所述同态加密处理单元用于提供第一种加密方式，对合成语音进行加密，得到加密数据；

32、所述量子密钥单元用于提供第二种加密方式，对合成语音进行加密，得到加密数据；

33、所述属性加密单元用于提供第三种加密方式，对合成语音进行加密，得到加密数据；

34、所述轻量加密单元用于提供第四种加密方式，对合成语音进行加密，得到加密数据；

35、所述加密数据存储单元用于存储，得到加密数据。

36、本专利技术还提供一种身份加密的情感语音合成方法，包括如下步骤：

37、输入原始语音数据；

38、提取声学特征，并根据声学特征识别出用户的情感倾向，得到情感分析结果；

39、分别将情感分析结果、原始语音数据进行文本转换，分别得到情感分析文本数据、原始语音文本数据；

40、将情感分析文本数据、原始语音文本数据转换为合成语音；

41、对合成语音进行加密，并对用户输出合成语音。

42、本专利技术的一种身份加密的情感语音合成方法及系统，通过所述输入模块用于用户输入原始语音数据；所述语音特征提取模块用于从原始语音数据中提取出声学特本文档来自技高网...

【技术保护点】

1.一种身份加密的情感语音合成系统，其特征在于，

2.如权利要求1所述的身份加密的情感语音合成系统，其特征在于，

3.如权利要求2所述的身份加密的情感语音合成系统，其特征在于，

4.如权利要求1所述的身份加密的情感语音合成系统，其特征在于，

5.如权利要求4所述的身份加密的情感语音合成系统，其特征在于，

6.如权利要求1所述的身份加密的情感语音合成系统，其特征在于，

7.如权利要求6所述的身份加密的情感语音合成系统，其特征在于，

8.一种身份加密的情感语音合成方法，应用于如权利要求1所述的身份加密的情感语音合成系统，其特征在于，包括如下步骤：

【技术特征摘要】

1.一种身份加密的情感语音合成系统，其特征在于，

2.如权利要求1所述的身份加密的情感语音合成系统，其特征在于，

3.如权利要求2所述的身份加密的情感语音合成系统，其特征在于，

4.如权利要求1所述的身份加密的情感语音合成系统，其特征在于，

5.如权利要求4所述的身份...

【专利技术属性】
技术研发人员：赵胜，丁卓，潘友健，
申请(专利权)人：南京龙垣信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人