语音识别的方法、装置、设备及存储介质制造方法及图纸

技术编号：41537487 阅读：22 留言：0更新日期：2024-06-03 23:16

本公开的实施方式提供了一种语音识别的方法、装置、设备及存储介质，涉及人工智能技术领域。该方法包括：获取业务场景下的待识别的语音数据；根据预设的语音识别模型和预设的热词表，确定所述待识别的语音数据对应的文本数据；其中，所述预设的语音识别模型用于将语音模态的数据转换为文本模态的数据，所述预设的热词表中包括多个热词，所述热词表征业务场景中的关键词，所述热词从所述业务场景下预设自定义文本中提取。从不同行业的客服话术等自定义文本提取出对应的热词，得到热词表。根据热词表，对语音数据进行识别，不需要手动从语音数据中筛选热词，避免额外的人力成本，并提高语音识别的精度，为用户带来了更好的体验。

全部详细技术资料下载

【技术实现步骤摘要】

本公开的实施方式涉及人工智能领域，更具体地，本公开的实施方式涉及语音识别的方法、装置、设备及存储介质。

技术介绍

1、本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、在现代智能客服场景中，客服与客户可以通过语音来交流，语音识别技术得到了广泛应用。通过语音识别技术，可以将语音转换为文字。

3、然而，由于行业的多样化，不同行业的话术中可能包含很多特定领域的词汇。目前的语音识别模型往往面临着无法识别特定词汇、无法满足个性化需求等问题，导致语音识别的准确率下降。

技术实现思路

1、本公开提供一种语音识别的方法、装置、设备及存储介质，以提高语音识别的精度。

2、在本公开实施方式的第一方面中，提供了一种语音识别的方法，包括：

3、获取业务场景下的待识别的语音数据；

4、根据预设的语音识别模型和预设的热词表，确定所述待识别的语音数据对应的文本数据；其中，所述预设的语音识别模型用于将语音模态的数据转换为文本模态的数据，所述预设的热词表中包括多个热词，所述热词表征业务场景中的关键词，所述热词从所述业务场景下预设自定义文本中提取。

5、在本公开实施方式的第二方面中，提供了一种语音识别的装置，包括：

6、获取模块，用于获取业务场景下的待识别的语音数据；

7、确定模块，用于根据预设的语音识别模型和预设的热词表，确定所述待识别的语音数据对应的文本数据；其中，所述

8、在本公开实施方式的第三方面中，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如第一方面所述的方法。

9、在本公开实施方式的第四方面中，提供了一种计算设备，包括：

10、至少一个处理器；

11、以及与所述至少一个处理器通信连接的存储器；

12、其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述计算设备执行如第一方面所述的方法。

13、根据本公开实施方式的一种语音识别的方法、装置、设备及存储介质，从不同行业的客服话术等预设自定义文本提取出对应的热词，得到预设的热词表。在获取到待识别的语音数据后，使用预设的语音识别模型，基于预设的热词表，对待识别的语音数据进行语音识别，得到待识别的语音数据所对应的文本数据。实现了不需要在语音识别时，从待识别的语音数据中手动筛选热词。根据业务场景对应的热词表，能够针对性的适应不同的业务场景，避免额外的人力成本，提高语音识别的精度和灵活性，为用户带来了更好的体验。

本文档来自技高网...

【技术保护点】

1.一种语音识别的方法，包括：

2.根据权利要求1所述的方法，根据预设的语音识别模型和预设的热词表，确定所述待识别的语音数据对应的文本数据，包括：

3.根据权利要求2所述的方法，将所述待识别的语音数据输入至预设的声学模型中，基于预设的热词表，得到所述待识别的语音数据对应的文本概率矩阵，包括：

4.根据权利要求2所述的方法，将所述文本概率矩阵输入至预设的语言模型中，基于预设的热词表，确定所述待识别的语音数据对应的文本数据，包括：

5.根据权利要求2所述的方法，还包括：

6.根据权利要求5所述的方法，获取预先采集的在业务场景下的训练数据语料库，包括：

7.根据权利要求6所述的方法，根据所述自定义文本和预设的行业分类模型，确定所述业务场景的行业类别，包括：

8.一种语音识别的装置，包括：

9.一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1至7中任一项所述的方法。

10.一种计算设备，包括：

【技术特征摘要】

1.一种语音识别的方法，包括：

2.根据权利要求1所述的方法，根据预设的语音识别模型和预设的热词表，确定所述待识别的语音数据对应的文本数据，包括：

4.根据权利要求2所述的方法，将所述文本概率矩阵输入至预设的语言模型中，基于预设的热词表，确定所述待识别的语音数据对应的文本数据，包括：

5.根据...

【专利技术属性】
技术研发人员：王培尧，冯旻伟，尹竞成，阮良，
申请(专利权)人：杭州网易智企科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人