一种音频信号处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号：44295414 阅读：7 留言：0更新日期：2025-02-18 20:15

本发明专利技术实施例公开了一种音频信号处理方法、装置、电子设备和存储介质，该方法包括：接收到用户发送的开始指令时，响应于开始指令获取当前时刻的至少一个人声音频信息；基于预先获取到的音效指导文本和当前时刻的各人声音频信息，得到当前时刻的目标人声音频信息；根据当前时刻的目标人声音频信息和预先确定的当前时刻的背景音频信息确定当前时刻的目标音频信息；基于目标音频信息生成并播放目标音频。本发明专利技术中，通过实时灵活地调整文本演绎场景中的人声音频信息以匹配场景变化，能够灵活应对演出过程中的细微变化和情感波动，使音频内容更加贴合实际演绎情况，提高用户整体的听觉体验和沉浸感。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及音频信号处理，尤其涉及一种音频信号处理方法、装置、电子设备和存储介质。

技术介绍

1、在现代多媒体和娱乐行业中，根据复杂场景和多角色文本等生成对应的音频，以丰富用户的听觉体验已经成为一项很重要的工作。这种技术的实现涉及多个方面，包括自然语言处理、情感计算和音频信号处理等。

2、现在音频生成方法主要依赖于对详细描述场景的文本进行文本分析，根据文本分析的结果和预先录制的音频片段和人工编辑等，生成与文本对应的音频。但是这种方式只能根据确定好的场景文本生成固定的背景音频，例如一些人工智能角色或演员进行现场场景演绎过程中，只能是按照一定的时间安排播放一些固定的背景音频或者人声音频。但是演出过程中演员的表现或者实际的场景演绎过程中的情感等有可能会发生细微的变化，导致这种方式不够灵活，难以实时响应演绎过程的变化，从而影响了整体的听觉体验和沉浸感。

技术实现思路

1、本专利技术实施例提供一种音频信号处理方法、装置、电子设备和存储介质，能够实时灵活地调整文本演绎场景中的人声音频信息，捕捉到演绎过程中的细微变化，提高用户整体的听觉体验和沉浸感。

2、第一方面，本专利技术实施例提供一种音频信号处理方法，包括：

3、接收到用户发送的开始指令时，响应于所述开始指令获取当前时刻的至少一个人声音频信息；

4、基于预先获取到的音效指导文本和所述当前时刻的各人声音频信息，得到所述当前时刻的目标人声音频信息；

5、根据所述当前时刻的目标人

6、基于所述目标音频信息生成并播放目标音频。

7、第二方面，本专利技术实施例提供一种音频信号处理装置，所述装置包括：

8、信息获取模块，用于接收到用户发送的开始指令时，响应于所述开始指令获取当前时刻的至少一个人声音频信息；

9、第一确定模块，用于基于预先获取到的音效指导文本和所述当前时刻的各人声音频信息，得到所述当前时刻的目标人声音频信息；

10、第二确定模块，用于根据所述当前时刻的目标人声音频信息和预先确定的当前时刻的背景音频信息确定所述当前时刻的目标音频信息；

11、音频播放模块，用于基于所述目标音频信息生成并播放目标音频。

12、第三方面，本专利技术实施例还提供了一种电子设备，所述电子设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如本专利技术实施例中任一所述的音频信号处理方法。

13、第四方面，本专利技术实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本专利技术实施例中任一所述的音频信号处理方法。

14、第五方面，本专利技术实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如本专利技术实施例中任一所述的音频信号处理方法。

15、本专利技术实施例中，接收到用户发送的开始指令时，响应于开始指令获取当前时刻的至少一个人声音频信息；基于预先获取到的音效指导文本和当前时刻的各人声音频信息，得到当前时刻的目标人声音频信息；根据当前时刻的目标人声音频信息和预先确定的当前时刻的背景音频信息确定当前时刻的目标音频信息；基于目标音频信息生成并播放目标音频。本专利技术实施例的方法，通过实时灵活地调整文本演绎场景中的人声音频信息以匹配场景变化，能够灵活应对演出过程中的细微变化和情感波动，使音频内容更加贴合实际演绎情况，提高用户整体的听觉体验和沉浸感。

本文档来自技高网...

【技术保护点】

1.一种音频信号处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述音效指导文本包括各个时间段的场景内容，在接收到用户发送的开始指令之前，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，基于预先获取到的音效指导文本和所述当前时刻的各人声音频信息，得到所述当前时刻的目标人声音频信息，包括：

4.根据权利要求3所述的方法，其特征在于，基于所述目标场景内容的各角色特征和所述当前时刻的各人声音频信息，得到所述当前时刻的目标人声音频信息，包括：

5.根据权利要求4所述的方法，其特征在于，基于所述情感分析结果对所述当前人声音频信息进行调整，得到所述当前时刻的目标人声音频信息，包括：

6.根据权利要求1所述的方法，其特征在于，根据所述当前时刻的目标人声音频信息和预先确定的当前时刻的背景音频信息确定所述当前时刻的目标音频信息，包括：

7.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的一种音频信号处理方法。

<...

【技术特征摘要】

1.一种音频信号处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述音效指导文本包括各个时间段的场景内容，在接收到用户发送的开始指令之前，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，基于所述情感分析结果对所述当前人声音频信息进行调整，得到所述当前时刻的目标人声音频信息，包括：

6.根据权利要求...

【专利技术属性】
技术研发人员：杨帅军，王腾飞，
申请(专利权)人：上海极豆科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人