一种基于场景化的语音智能识别方法及系统技术方案

技术编号：32504572 阅读：19 留言：0更新日期：2022-03-02 10:14

本发明专利技术公开了一种基于场景化的语音智能识别方法及系统，所述方法包括：获得第一位置场景信息；根据第一数据采集装置对所述第一位置场景的信息的语音对象进行数据采集，获得第一识别对象信息；根据所述第一识别对象信息的语言特征信息，生成第一识别语料库和第一纠错语料库；构建第一先验纠错模型；根据所述语音智能识别系统接收所述第一位置场景的实时语音数据；通过对所述实时语音数据进行声学模型匹配，获得第一匹配声学模型；根据所述第一先验纠错模型和所述第一匹配声学模型进行解码搜索，输出第一语音识别结果。解决了现有技术中存在语音识别无法根据场景化特征进行智能化识别，从而造成识别结果准确性不够稳定的技术问题。术问题。术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于场景化的语音智能识别方法及系统

[0001]本专利技术涉及智能识别相关领域，尤其涉及一种基于场景化的语音智能识别方法及系统。

技术介绍

[0002]语音识别是利用计算机将语音信号自动转换为文本的一种技术，随着人工智能的不断发展，语音识别技术作为其中的重要手段，其应用的领域也逐渐扩大，从而对语音识别的准确度和智能化有了更高的需求。进一步的，由于语音识别在不同场景条件下的应用，其准确率不高，且环境适应性不强，从而造成语音识别的出错率较高。
[0003]由于目前的语音识别对用户的识别分析，忽略了在对应场景条件下的针对化识别调整，如何利用场景化条件对语音识别进行智能化识别是目前的主要研究话题。
[0004]然而，现有技术中存在语音识别无法根据场景化特征进行智能化识别，从而造成识别结果准确性不够稳定的技术问题。

技术实现思路

[0005]针对现有技术中的缺陷，本申请实施例的目的是，通过提供一种基于场景化的语音智能识别方法及系统，解决了现有技术中存在语音识别无法根据场景化特征进行智能化识别，从而造成识别结果准确性不够稳定的技术问题，达到了通过结合识别对象和识别场景，在前端构建数学模型进行智能化的异常识别和修正，从而提高场景化适用性识别结果的准确性的技术效果。
[0006]一方面，本申请实施例提供一种基于场景化的语音智能识别方法，所述方法应用于一种基于场景化的语音智能识别系统，所述系统与第一数据采集装置通信连接，所述方法包括：基于所述语音智能识别系统的识别环境，获得第一位置场景信息；...

【技术保护点】

【技术特征摘要】
1.一种基于场景化的语音智能识别方法，其特征在于，所述方法应用于一种基于场景化的语音智能识别系统，所述系统与第一数据采集装置通信连接，所述方法包括：基于所述语音智能识别系统的识别环境，获得第一位置场景；根据所述第一数据采集装置对所述第一位置场景的语音对象进行数据采集，获得第一识别对象信息；根据所述第一识别对象信息的语言特征信息，生成第一识别语料库和第一纠错语料库；根据所述第一识别语料库和所述第一纠错语料库进行场景模型模拟，构建第一先验纠错模型，其中，所述第一先验纠错模型为先验语义识别的异常纠错模型；根据所述语音智能识别系统接收所述第一位置场景的实时语音数据；通过对所述实时语音数据进行声学模型匹配，获得第一匹配结果，其中，所述第一匹配结果为第一匹配声学模型；根据所述第一先验纠错模型和所述第一匹配声学模型进行解码搜索，输出第一语音识别结果。2.如权利要求1所述的方法，其特征在于，所述根据所述第一识别对象信息的语言特征信息，生成第一识别语料库和第一纠错语料库，所述方法还包括：根据所述第一位置场景的信息，生成第一场景语料库；根据所述第一识别对象信息进行地区差异语音分析，获得第一差异语料库；根据所述第一差异语料库对所述第一场景语料库中的语料进行比对连接，生成第一语音差异纠错库；将所述第一语音差异纠错库添加至所述第一纠错语料库中。3.如权利要求2所述的方法，其特征在于，所述方法还包括：通过对所述第一位置场景的信息进行分析，确定第一场景任务；基于所述第一场景任务的信息，从所述第一场景语料库中获得任务场景语料词库，其中，所述任务场景语料词库为该任务条件下的场景替换词；将所述任务场景语料词库作为第二语音差异纠错库添加至所述第一纠错语料库中。4.如权利要求1所述的方法，其特征在于，所述方法还包括：根据所述第一识别对象信息进行语音特征分析，获得第一语音特征组，其中，所述第一语音特征组包括音色识别特征、词汇量化特征和语音转折特征；根据所述音色识别特征、所述词汇量化特征和所述语音转折特征，确定第一识别维度、第二识别维度和第三识别维度；基于所述第一识别维度、所述第二识别维度和所述第三识别维度对所述实时语音数据进行识别。5.如权利要求4所述的方法，其特征在于，所述通过对所述实时语音数据进行声学模型匹配，获得第一匹配结果，其中，所述第一匹配结果为第一匹配声学模型，所述方法还包括：获得所述第一识别对象在所述第一位置场景的实时语音数据；通过对所述第一识别维度、所述第二识别维度和所述第三识别维度的特征强...

【专利技术属性】
技术研发人员：杜兰，杜轶锋，周国华，廖森平，叶国伟，
申请(专利权)人：科大讯飞华南有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人