System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于AI的智能声音模拟系统技术方案_技高网
当前位置: 首页 > 专利查询>李超专利>正文

一种基于AI的智能声音模拟系统技术方案

技术编号:44125261 阅读:6 留言:0更新日期:2025-01-24 22:44
本发明专利技术属于声音模拟制作技术领域,本发明专利技术公开了一种基于AI的智能声音模拟系统;采集用户声音数据集和播放声音数据,并进行预处理,用户声音数据集包括用户录音数据、用户日常声音数据和用户演讲声音数据;对用户声音数据集进行特征提取,得到用户声音特征;依据用户声音特征,建立声音合成模型;依据声音合成模型,输入播放声音数据,得到语音输出数据,配合声音合成模块,将播放声音数据输出得到以用户声音特征为基准的音频文件,不仅在学习过程中可以提升用户的接受度,且可以通过替换影视作品中特定人物的声音,增加观影的沉浸感和趣味性,总而言之,本发明专利技术具有辅助学习能力强、用户适用范围广和娱乐趣味性高的显著优点。

【技术实现步骤摘要】

本专利技术涉及声音模拟制作,更具体地说,本专利技术涉及一种基于ai的智能声音模拟系统。


技术介绍

1、人工智能,英文缩写为ai,是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,人工智能是智能学科重要的组成部分,它企图了解智能的实质,并生产出一种新的能以与人类智能相似的方式做出反应的智能机器,人工智能是十分广泛的科学,包括机器人、语言识别、图像识别、自然语言处理、专家系统、机器学习,计算机视觉等,随着我国科技行业的快速发展,人工智能的日渐成熟,ai这种前端科技也逐步走向千家万户,并在社会的各行各业得到了广泛的应用,在日常生活中,学习于大多数人是一件较为苦闷的事情,如何能够使学习过程降低其枯燥乏味的程度,也成为了当今社会的一大问题。

2、申请公开号为cn117354444a的专利公开了一种基于ai智能和影音模拟复原技术的影视制作系统,通过其设立的采集模块,进行线上或线下的资料收集,将线上收集的电子档类型的资料,线下通过对实体化图片进行扫描后,一同输入至导入模块进行初步制作,通过导出模块对导入模块所合成的影视作品进行质量审核把控并做出反馈,最后通过管理模块对ai模块进行学习和更新,达到智能化剪辑视频的目的。

3、虽然上述一种基于ai智能和影音模拟复原技术的影视制作系统,通过对视频的智能化剪辑,从而达到降低人工剪辑成本的目的,但难以完成对音频的多方面转换,在当下社会对学习要求不断增高的情况下,如何有效提升学习的舒适度、可接受性和趣味性,则成为了众多相关从业人员的一大难题。

4、鉴于此,本专利技术提出一种基于ai的智能声音模拟系统以解决上述问题。


技术实现思路

1、为了克服现有技术的上述缺陷,为实现上述目的,本专利技术提供如下技术方案:包括

2、声音采集模块,用于采集用户声音数据集和播放声音数据,并进行预处理,用户声音数据集包括用户录音数据、用户日常声音数据和用户演讲声音数据;

3、进一步地,采集用户声音数据集和播放声音数据的方式包括:

4、通过手机或电脑等收音设备,采集用户录音状态下的声音信号,得到用户录音数据;

5、通过录音笔和录像音频,采集用户日常生活状态下和演讲状态下的声音信号,得到用户日常声音数据和用户演讲声音数据;

6、通过基于speechnotes语音识别软件,采集指定播放视频的音频数据,并转换为文本格式,得到播放声音数据;

7、进行预处理的方式包括数据清洗、数据降噪、滤波和噪声去除;

8、特征提取模块,用于对用户声音数据集进行特征提取,得到用户声音特征;

9、进一步地,进行提取的步骤包括:

10、q1:对用户声音数据集中的声音信号进行归一化处理;

11、将声音信号通过滤波器强调高频部分的能量,滤波器的计算式为:其中yn为输出的声音信号,xn为输入的声音信号,为预加重系数;

12、q2:将输出的声音信号分为多个短时帧;

13、选择一个窗函数,赋予窗一个固定的长度,通过代入计算式:am=bm×cm得到加窗后的声音信号,其中bm为输出的声音信号,cm为窗函数,所述窗函数为矩形窗、汉明窗或汉宁窗的其中一种;

14、q3:基于傅里叶变换,将加窗后的声音信号中的时域信号转换为频域信号,得到变换结果;

15、q4:基于梅尔滤波器组,将变换结果与梅尔滤波器中的滤波器权重相乘,得到滤波结果;

16、q5:对滤波结果进行对数压缩后进行离散余弦变换,输出得到用户声音特征;

17、进一步地,进行归一化处理的方式包括将声音信号缩放至预设幅值区间内,遍历声音信号,获取声音信号中的最大值和最小值,通过代入归一化计算式:得到标准化值,其中r为输入的声音信号,rmax为声音信号中的最大值,rmin为声音信号中的最小值,将标准化值替换输入的声音信号输入至归一化计算式,得到归一化的声音信号;

18、模型训练模块,用于依据用户声音特征,建立声音合成模型;

19、进一步地,建立声音合成模型的方式包括:

20、采集l组历史用户声音特征,作为样本集,基于生成对抗网络建立初始声音合成模型,声音合成模型包括生成器和判别器两部分;

21、预设迭代次数;

22、选择损失函数,将样本集和生成器生成的合成音频输入至判别器中,得到输出结果,分别计算生成器损失函数和判别器损失函数,并最小化生成器损失函数和判别器损失函数,重复此过程,直至达到预设迭代次数,得到声音合成模型;

23、声音合成模块,用于依据声音合成模型,输入播放声音数据,得到语音输出数据;

24、进一步地,得到语音输出数据的方式包括:

25、将播放声音数据输入声音合成模型;

26、识别播放声音数据中的单词、标点符号、缩写、数字和特殊字符;

27、将播放声音数据中的文本分割为独立的单词或词组,将单词或词组中的缩写进行规范化处理;

28、基于声音合成模型,确立每个单词或词组的音色和韵律,韵律包括轻音、重音和语调;

29、输出得到语音输出数据;

30、进一步地,s1:采集用户声音数据集和播放声音数据,并进行预处理,用户声音数据集包括用户录音数据、用户日常声音数据和用户演讲声音数据;

31、s2:对用户声音数据集进行特征提取,得到用户声音特征;

32、s3:依据用户声音特征,建立声音合成模型;

33、s4:依据声音合成模型,输入播放声音数据,得到语音输出数据。

34、本专利技术一种基于ai的智能声音模拟系统的技术效果和优点:

35、本专利技术通过声音采集模块获取用户声音数据集和播放声音数据,可以非常便捷的完成对用户的声音收集,便于后续系统的使用,通过特征提取模块,可以有针对性的提取用户声音特征,便于后续系统能够生成得到用户声音,通过依据用户声音特征所建立的声音合成模型,可以使ai能够输出模拟用户声音特征的声音,通过调节损失函数,可以使用户得到区别于他人所听到的自身的声音,配合声音合成模块,将播放声音数据输出得到以用户声音特征为基准的音频文件,不仅在学习过程中可以提升用户的接受度,减少排斥感,且可以通过替换影视作品中特定人物的声音,增加观影的沉浸感和趣味性,总而言之,本专利技术具有辅助学习能力强、用户适用范围广和娱乐趣味性高的显著优点。

本文档来自技高网...

【技术保护点】

1.一种基于AI的智能声音模拟系统,其特征在于,包括:声音采集模块,用于采集用户声音数据集和播放声音数据,并进行预处理,用户声音数据集包括用户录音数据、用户日常声音数据和用户演讲声音数据;

2.根据权利要求1所述的一种基于AI的智能声音模拟系统,其特征在于,采集用户声音数据集和播放声音数据的方式包括:

3.根据权利要求2所述的一种基于AI的智能声音模拟系统,其特征在于,进行提取的步骤包括:

4.根据权利要求3所述的一种基于AI的智能声音模拟系统,其特征在于,进行归一化处理的方式包括将声音信号缩放至预设幅值区间内,遍历声音信号,获取声音信号中的最大值和最小值,通过代入归一化计算式:得到标准化值,其中R为输入的声音信号,Rmax为声音信号中的最大值,Rmin为声音信号中的最小值,将标准化值替换输入的声音信号输入至归一化计算式,得到归一化的声音信号。

5.根据权利要求4所述的一种基于AI的智能声音模拟系统,其特征在于,建立声音合成模型的方式包括:

6.根据权利要求5所述的一种基于AI的智能声音模拟系统,其特征在于,得到语音输出数据的方式包括:

7.一种基于AI的智能声音模拟方法,根据权利要求1-6所述的一种基于AI的智能声音模拟系统实现,其特征在于,S1:采集用户声音数据集和播放声音数据,并进行预处理,用户声音数据集包括用户录音数据、用户日常声音数据和用户演讲声音数据;

...

【技术特征摘要】

1.一种基于ai的智能声音模拟系统,其特征在于,包括:声音采集模块,用于采集用户声音数据集和播放声音数据,并进行预处理,用户声音数据集包括用户录音数据、用户日常声音数据和用户演讲声音数据;

2.根据权利要求1所述的一种基于ai的智能声音模拟系统,其特征在于,采集用户声音数据集和播放声音数据的方式包括:

3.根据权利要求2所述的一种基于ai的智能声音模拟系统,其特征在于,进行提取的步骤包括:

4.根据权利要求3所述的一种基于ai的智能声音模拟系统,其特征在于,进行归一化处理的方式包括将声音信号缩放至预设幅值区间内,遍历声音信号,获取声音信号中的最大值和最小值,通过代入归一化计算式:得到标...

【专利技术属性】
技术研发人员:李超
申请(专利权)人:李超
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1