基于AI的智能语音识别方法及系统技术方案

技术编号：41812802 阅读：35 留言：0更新日期：2024-06-24 20:30

本申请公开了一种基于AI的智能语音识别方法及系统，涉及智能语音识别领域，其通过利用深度学习网络模型如卷积神经网络（CNN）和图卷积神经网络（GCN）强大的特征提取能力和对结构化数据的处理能力来对待识别语音信号进行处理和分析，从中提取语音信号的局部细节波形特征和全局上下文语义关联特征，并引入自适应注意力机制来整合上下文信息并显化重要特征分布，从而确保语义识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能语音识别领域，且更为具体地，涉及一种基于ai的智能语音识别方法及系统。

技术介绍

1、随着人工智能技术的飞速发展，智能语音识别技术已成为人机交互领域的重要研究方向。

2、传统的语音识别系统多依赖于手工特征提取和统计模型，这些方法在处理复杂语音信号时往往存在局限性，如对环境噪声的鲁棒性不足、对说话人个体差异的适应性不强等问题。

3、因此，期待一种优化的智能语音识别方法及系统。

技术实现思路

1、为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于ai的智能语音识别方法及系统，其通过利用深度学习网络模型如卷积神经网络（cnn）和图卷积神经网络（gcn）强大的特征提取能力和对结构化数据的处理能力来对待识别语音信号进行处理和分析，从中提取语音信号的局部细节波形特征和全局上下文语义关联特征，并引入自适应注意力机制来整合上下文信息并显化重要特征分布，从而确保语义识别的准确度。

2、根据本申请的一个方面，提供了一种基于ai的智能语音识别方法，其包括：获取待识别语音信号；对所述待识别语音信号进行信号切分以得到语音信号片段的序列；对所述语音信号片段的序列进行全域波形语义特征提取以得到上下文语音信号片段波形语义特征向量的序列；将所述上下文语音信号片段波形语义特征向量的序列通过自适应注意力权重融合网络以得到全域显著化语音信号波形特征向量；以及基于所述全域显著化语音信号波形特征向量来确定语音识别结果。

3、根据本申请的另一个方面，提

4、与现有技术相比，本申请提供的一种基于ai的智能语音识别方法及系统，其通过利用深度学习网络模型如卷积神经网络（cnn）和图卷积神经网络（gcn）强大的特征提取能力和对结构化数据的处理能力来对待识别语音信号进行处理和分析，从中提取语音信号的局部细节波形特征和全局上下文语义关联特征，并引入自适应注意力机制来整合上下文信息并显化重要特征分布，从而确保语义识别的准确度。

本文档来自技高网...

【技术保护点】

1.基于AI的智能语音识别方法，其特征在于，包括：

2.根据权利要求1所述的基于AI的智能语音识别方法，其特征在于，对所述语音信号片段的序列进行全域波形语义特征提取以得到上下文语音信号片段波形语义特征向量的序列，包括：

3.根据权利要求2所述的基于AI的智能语音识别方法，其特征在于，计算所述语音信号片段波形语义特征向量的序列中任意两个语音信号片段波形语义特征向量之间的哈希相似度以得到片段波形一致性拓扑矩阵，包括：

4.根据权利要求3所述的基于AI的智能语音识别方法，其特征在于，计算所述语音信号片段波形语义哈希编码特征向量的序列中每两个所述语音信号片段波形语义哈希编码特征向量之间的余弦相似性以得到哈希相似度的序列，包括：

5.根据权利要求4所述的基于AI的智能语音识别方法，其特征在于，将所述上下文语音信号片段波形语义特征向量的序列通过自适应注意力权重融合网络以得到全域显著化语音信号波形特征向量，包括：

6.根据权利要求5所述的基于AI的智能语音识别方法，其特征在于，计算所述上下文语音信号片段波形语义特征向量的序列中各个上下

7.根据权利要求6所述的基于AI的智能语音识别方法，其特征在于，对所述偏置化上下文语音信号片段波形语义特征向量的序列进行激活以得到非线性变换上下文语音信号片段波形语义特征向量的序列，包括：

8.根据权利要求7所述的基于AI的智能语音识别方法，其特征在于，基于所述全域显著化语音信号波形特征向量来确定语音识别结果，包括：

9.一种基于AI的智能语音识别系统，其特征在于，包括：

10.根据权利要求9所述的基于AI的智能语音识别系统，其特征在于，

...

【技术特征摘要】

1.基于ai的智能语音识别方法，其特征在于，包括：

2.根据权利要求1所述的基于ai的智能语音识别方法，其特征在于，对所述语音信号片段的序列进行全域波形语义特征提取以得到上下文语音信号片段波形语义特征向量的序列，包括：

3.根据权利要求2所述的基于ai的智能语音识别方法，其特征在于，计算所述语音信号片段波形语义特征向量的序列中任意两个语音信号片段波形语义特征向量之间的哈希相似度以得到片段波形一致性拓扑矩阵，包括：

4.根据权利要求3所述的基于ai的智能语音识别方法，其特征在于，计算所述语音信号片段波形语义哈希编码特征向量的序列中每两个所述语音信号片段波形语义哈希编码特征向量之间的余弦相似性以得到哈希相似度的序列，包括：

5.根据权利要求4所述的基于ai的智能语音识别方法，其特征在于，将所述上下文语音信号片段波形语义特征向量的序列通过自...

【专利技术属性】
技术研发人员：史琦，沈林啸，薛佳，
申请(专利权)人：陕西拓方信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人