一种通过声纹识别优化游戏耳机音效的方法及系统技术方案

技术编号：43273566 阅读：4 留言：0更新日期：2024-11-12 16:00

本发明专利技术公开了一种通过声纹识别优化游戏耳机音效的方法及系统，涉及音频优化技术领域，包括采集用户声纹信号并进行预处理；分析声纹信号特征并提取声纹信号的变化参数；构建声纹预测模型分析声纹信号的变化参数并预测未来声纹信号的变化参数；将预测的声纹信号的变化参数映射到音效调整参数；收集并分析用户反馈数据，调整声纹信号的变化参数权重。本发明专利技术采集用户的声纹信号，利用频域分析提取声纹特征和变化参数，为个性化音效调整提供了关键依据，构建LSTM模型，提高了音效调整的预测性和前瞻性，通过定义音效调整规则，实现了声纹特征与音效参数的精确映射，显著提升了音效个性化水平，收集用户反馈并调整声纹参数权重，形成闭环反馈系统。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频处理，特别是一种通过声纹识别优化游戏耳机音效的方法及系统。

技术介绍

1、声纹识别技术因其独特的个体识别能力和广泛的应用前景，近年来得到了迅猛发展，随着游戏产业的繁荣，游戏耳机音效的个性化需求日益增长，现有的游戏耳机音效优化技术，多依赖于用户手动调整音效参数，或者采用预设的音效模式来满足不同场景下的听觉需求，然而，这些方法无法针对每个用户的个性化听觉特点进行精准优化，导致音效体验存在一定的局限性，现有的声纹识别技术在游戏耳机音效优化方面的不足主要体现在以下几个方面：传统的声纹识别技术未能有效结合游戏音效的复杂多变特点，现有技术未能实现声纹信号与音效调整参数之间的精确映射，使得音效优化效果不尽如人意。

技术实现思路

1、鉴于上述现有的通过声纹识别优化游戏耳机音效的方法及系统中存在的问题，提出了本专利技术；

2、因此，本专利技术所要解决的问题在于传统的声纹识别技术识别准确率不高、声纹信号与音效调整参数映射不精确、缺乏用户需求动态调整以及如何通过声纹识别技术实现游戏耳机音效的个性化优化问题。

3、为解决上述技术问题，本专利技术提供如下技术方案：一种通过声纹识别优化游戏耳机音效的方法及系统，其包括，

4、采集用户声纹信号并进行预处理；

5、分析声纹信号特征并提取声纹信号的变化参数；

6、构建声纹预测模型分析声纹信号的变化参数并预测未来声纹信号的变化参数；

7、将预测的声纹信号的变化参数映射到音效调整参数；

8、收集并分析用户反馈数据，调整声纹信号的变化参数权重；

9、将数据存储至数据库建立索引，进行备份和完整性检测。

10、作为本专利技术所述通过声纹识别优化游戏耳机音效的方法及系统的一种优选方案，其中：所述采集用户声纹信号并进行预处理指通过游戏耳机的麦克风实时采集用户在游戏过程中的声纹信号，对采集到的声纹信号进行预处理，包括去噪、归一化和分帧处理；

11、对分帧处理完成的每帧声纹信号进行短时傅里叶变换进行频域转换，得到每帧的频谱。

12、作为本专利技术所述通过声纹识别优化游戏耳机音效的方法及系统的一种优选方案，其中：所述分析声纹信号特征并提取声纹信号的变化参数指通过梅尔滤波器组对频谱进行滤波，得到梅尔频谱能量谱，对每个梅尔频率能量谱取对数后进行离散余弦变换，得到mfcc系数，将mfcc系数组成为特征向量mfcc，利用特征向量mfcc，计算当前帧与上一帧的欧式距离d，公式为：

13、

14、其中，d为当前帧和上一帧之间的欧式距离，nmfcc为提取的mfcc系数的数量，cc,n表示当前帧第n个mfcc系数，cp,n表示上一帧第n个mfcc系数；

15、定义变化阈值t，将计算得到的欧式距离d与变化阈值t进行比较判断声纹信号变化的类型：

16、若d≥t，则判断为声纹信号发生变化，记录该变化，并提取声纹信号的变化参数，包括情绪、语速、语调；

17、若d<t，则判断为声纹信号未发生变化，不记录变化；

18、分析提取的声纹信号的变化参数并将声纹信号的变化参数分类存储，包括：

19、对频域转换后的每帧声纹信号的频谱，提取频谱中的高频成分，计算高频成分的总能量和历史帧的高频成分总能量，若当前帧的高频成分总能量大于历史帧的高频成分总能量，则判定情绪变化为兴奋和紧张情绪，若当前帧的高频成分总能量小于历史帧的高频成分总能量，则判定情绪变化为放松和平静情绪；

20、使用vad语音活动检测判断每一帧的有效声纹信号，标记每帧声纹信号的状态，包括语音帧和静音帧，对检测到的每个语音帧，记录其时间戳，计算相邻语音帧之间的时间间隔和所有相邻语音帧之间的历史平均间隔时间，若语音帧之间的时间间隔大于所有相邻语音帧之间的历史平均间隔时间，则判定语速变化为语速加快，若语音帧之间的时间间隔小于所有相邻语音帧之间的历史平均间隔时间，则判定语速变化为语速减慢；

21、使用自相关法，确定每帧声纹信号的周期性和频率特征，对每帧声纹信号计算自相关函数的峰值位置并计算基本频率，对提取到的基本频率采用滑动平均滤波器进行平滑处理，计算当前帧与上一帧基本频率的差值f，定义语调变化阈值tp，若f≥tp，则判定语调发生变化，记录基本频率，若f<tp，则判定语调未发生变化，不记录基本频率。

22、作为本专利技术所述通过声纹识别优化游戏耳机音效的方法及系统的一种优选方案，其中：所述构建声纹预测模型分析声纹信号的变化参数并预测未来声纹信号的变化参数指使用lstm神经网络构建声纹预测模型，包括输入层、隐藏层和输出层；

23、输入层为声纹信号的变化参数；

24、隐藏层有多个lstm单元捕捉时间序列特征，捕捉时间序列特征包括用户在不同时间点的情绪、语速和语调变化；

25、输出层为预测的声纹信号的变化参数；

26、通过输入门和遗忘门决定存储在细胞状态中的声纹信号的变化参数，结合输入门和遗忘门的结果更新细胞状态，通过输出门输出预测的声纹信号的变化参数；

27、将声纹信号的变化参数划分为训练集和测试集；

28、输入数据经过lstm层，计算预测值与真实值之间的误差，采用均方误差作为损失函数；

29、通过误差方向传播算法更新模型参数，采用adam优化算法调整学习率和权重；

30、将用户实时声纹数据输入训练完成的lstm模型，得到预测的声纹信号的变化参数。

31、作为本专利技术所述通过声纹识别优化游戏耳机音效的方法及系统的一种优选方案，其中：所述将预测的声纹信号的变化参数映射到音效调整参数指根据预测的声纹变化参数，包括高频成分总能量、语音帧之间的时间间隔和当前帧与上一帧基本频率的差值f，定义对应的音效调整规则调整音效调整参数，音效调整参数包括音量、频率成分和环绕音：

32、若情绪变化为兴奋和紧张情绪时，增加音效的高频成分，提高背景音乐的激烈程度，增强环境音的清晰度，若情绪变化为放松和平静情绪时，降低音效的高频成分，平缓背景音乐，减弱环境音刺激性；

33、若语速变化为语速加快时，提高环绕声的节奏感和动态范围，若语速变化为语速减慢时，降低环绕声的节奏感和动态范围；

34、若语调变化为语调升高时，提高音量和环境音的清晰度，若语调变化为语调降低时，降低音量和环境音的饱满度；

35、设计动态声纹匹配算法，将预测的声纹变化参数映射到音效调整参数，公式为：

36、y＝w·p+b

37、其中，y为音效调整参数，w为权重矩阵，p为预测的声纹变化参数，b为偏置向量。

38、作为本专利技术所述通过声纹识别优化游戏耳机音效的方法及系统的一种优选方案，其中：所述收集并分析用户反馈数据，调整声纹信号的变化参数权重指通过用户界面收集用户对音效的反馈数据，将反馈数据转化为结构化数据，使用统计方法对反馈数据进行分本文档来自技高网...

【技术保护点】

1.一种通过声纹识别优化游戏耳机音效的方法，其特征在于：包括，

2.如权利要求1所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述采集用户声纹信号并进行预处理指通过游戏耳机的麦克风实时采集用户在游戏过程中的声纹信号，对采集到的声纹信号进行预处理，包括去噪、归一化和分帧处理；

3.如权利要求2所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述分析声纹信号特征并提取声纹信号的变化参数指通过梅尔滤波器组对频谱进行滤波，得到梅尔频谱能量谱，对每个梅尔频率能量谱取对数后进行离散余弦变换，得到MFCC系数，将MFCC系数组成为特征向量MFCC，利用特征向量MFCC，计算当前帧与上一帧的欧式距离d，公式为：

4.如权利要求3所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述构建声纹预测模型分析声纹信号的变化参数并预测未来声纹信号的变化参数指使用LSTM神经网络构建声纹预测模型，包括输入层、隐藏层和输出层；

5.如权利要求4所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述将预测的声纹信号的变化参数映射到音效调整参数

6.如权利要求5所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述收集并分析用户反馈数据，调整声纹信号的变化参数权重指通过用户界面收集用户对音效的反馈数据，将反馈数据转化为结构化数据，使用统计方法对反馈数据进行分析，基于反馈数据，使用线性回归确定音效调整参数，调整各个声纹变化参数的权重。

7.如权利要求6所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述将数据存储至数据库建立索引，进行备份和完整性检测指收集并分析用户反馈数据，将收集、分析产生以及用户界面的反馈数据存储至数据库，建立数据索引，根据需要对存储的数据进行检索，对数据库进行备份，定期对存储数据进行完整性检测。

8.一种如权利要求1-7任一所述的通过声纹识别优化游戏耳机音效的方法的声纹识别优化游戏耳机音效系统，其特征在于：包括，

9.一种计算机设备，包括：存储器和处理器；所述存储器存储有计算机程序，其特征在于：所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的通过声纹识别优化游戏耳机音效的方法及系统的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的通过声纹识别优化游戏耳机音效的方法及系统的步骤。

...

【技术特征摘要】

1.一种通过声纹识别优化游戏耳机音效的方法，其特征在于：包括，

3.如权利要求2所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述分析声纹信号特征并提取声纹信号的变化参数指通过梅尔滤波器组对频谱进行滤波，得到梅尔频谱能量谱，对每个梅尔频率能量谱取对数后进行离散余弦变换，得到mfcc系数，将mfcc系数组成为特征向量mfcc，利用特征向量mfcc，计算当前帧与上一帧的欧式距离d，公式为：

4.如权利要求3所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述构建声纹预测模型分析声纹信号的变化参数并预测未来声纹信号的变化参数指使用lstm神经网络构建声纹预测模型，包括输入层、隐藏层和输出层；

5.如权利要求4所述的通过声纹识别优化游戏耳机音效的方法，其特征在于：所述将预测的声纹信号的变化参数映射到音效调整参数指根据预测的声纹变化参数，包括高频成分总能量、语音帧之间的时间间隔和当前帧与上一帧基本频率的差值f，定义对应的音效调整规则调整音效调整参数，音效调整参数包括音量、频...

【专利技术属性】
技术研发人员：刘亨宇，
申请(专利权)人：天键电声股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人