一种基于场景化的语音智能识别方法及系统技术方案

技术编号:32504572 阅读:19 留言:0更新日期:2022-03-02 10:14
本发明专利技术公开了一种基于场景化的语音智能识别方法及系统,所述方法包括:获得第一位置场景信息;根据第一数据采集装置对所述第一位置场景的信息的语音对象进行数据采集,获得第一识别对象信息;根据所述第一识别对象信息的语言特征信息,生成第一识别语料库和第一纠错语料库;构建第一先验纠错模型;根据所述语音智能识别系统接收所述第一位置场景的实时语音数据;通过对所述实时语音数据进行声学模型匹配,获得第一匹配声学模型;根据所述第一先验纠错模型和所述第一匹配声学模型进行解码搜索,输出第一语音识别结果。解决了现有技术中存在语音识别无法根据场景化特征进行智能化识别,从而造成识别结果准确性不够稳定的技术问题。术问题。术问题。

【技术实现步骤摘要】
一种基于场景化的语音智能识别方法及系统


[0001]本专利技术涉及智能识别相关领域,尤其涉及一种基于场景化的语音智能识别方法及系统。

技术介绍

[0002]语音识别是利用计算机将语音信号自动转换为文本的一种技术,随着人工智能的不断发展,语音识别技术作为其中的重要手段,其应用的领域也逐渐扩大,从而对语音识别的准确度和智能化有了更高的需求。进一步的,由于语音识别在不同场景条件下的应用,其准确率不高,且环境适应性不强,从而造成语音识别的出错率较高。
[0003]由于目前的语音识别对用户的识别分析,忽略了在对应场景条件下的针对化识别调整,如何利用场景化条件对语音识别进行智能化识别是目前的主要研究话题。
[0004]然而,现有技术中存在语音识别无法根据场景化特征进行智能化识别,从而造成识别结果准确性不够稳定的技术问题。

技术实现思路

[0005]针对现有技术中的缺陷,本申请实施例的目的是,通过提供一种基于场景化的语音智能识别方法及系统,解决了现有技术中存在语音识别无法根据场景化特征进行智能化识别,从而造成识别结果准确性不够稳定的技术问题,达到了通过结合识别对象和识别场景,在前端构建数学模型进行智能化的异常识别和修正,从而提高场景化适用性识别结果的准确性的技术效果。
[0006]一方面,本申请实施例提供一种基于场景化的语音智能识别方法,所述方法应用于一种基于场景化的语音智能识别系统,所述系统与第一数据采集装置通信连接,所述方法包括:基于所述语音智能识别系统的识别环境,获得第一位置场景信息;根据所述第一数据采集装置对所述第一位置场景的信息的语音对象进行数据采集,获得第一识别对象信息;根据所述第一识别对象信息的语言特征信息,生成第一识别语料库和第一纠错语料库;根据所述第一识别语料库和所述第一纠错语料库进行场景模型模拟,构建第一先验纠错模型,其中,所述第一先验纠错模型为先验语义识别的异常纠错模型;根据所述语音智能识别系统接收所述第一位置场景的实时语音数据;通过对所述实时语音数据进行声学模型匹配,获得第一匹配结果,其中,所述第一匹配结果为第一匹配声学模型;根据所述第一先验纠错模型和所述第一匹配声学模型进行解码搜索,输出第一语音识别结果。
[0007]另一方面,本申请还提供了一种基于场景化的语音智能识别系统,所述系统包括:第一获得单元,所述第一获得单元用于基于所述语音智能识别系统的识别环境,获得第一位置场景信息;第二获得单元,所述第二获得单元用于根据第一数据采集装置对所述第一位置场景的信息的语音对象进行数据采集,获得第一识别对象信息;第一生成单元,所述第一生成单元用于根据所述第一识别对象信息的语言特征信息,生成第一识别语料库和第一纠错语料库;第一输入单元,所述第一输入单元用于根据所述第一识别语料库和所述第一
纠错语料库进行场景模型模拟,构建第一先验纠错模型,其中,所述第一先验纠错模型为先验语义识别的异常纠错模型;第一接收单元,所述第一接收单元用于根据所述语音智能识别系统接收所述第一位置场景的实时语音数据;第三获得单元,所述第三获得单元用于通过对所述实时语音数据进行声学模型匹配,获得第一匹配结果,其中,所述第一匹配结果为第一匹配声学模型;第一识别单元,所述第一识别单元用于根据所述第一先验纠错模型和所述第一匹配声学模型进行解码搜索,输出第一语音识别结果。
[0008]第三方面,本申请实施例提供了一种基于场景化的语音智能识别系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。
[0009]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:由于采用了通过对所述语音识别识别系统的识别环境进行分析,确定第一位置场景信息,并根据所述第一数据采集装置对处于所述第一位置场景的语音识别对象进行用户数据采集,从而根据采集获得的第一识别对象信息进行语音特征分析,进而生成第一识别语料库和第一纠错语料库,基于此进行场景模型的模拟,根据模拟的数据,构建用于进行先验语义异常识别的纠错模型,即第一先验纠错模型,进一步的,再通过所述语音智能识别系统接收所述第一位置场景的实时语音数据,从而基于实时语音数据进行声学模型的匹配,输出第一匹配声学模型后,根据所述第一先验纠错模型和所述第一匹配声学模型对所述实时语音数据进行解码搜索,输出第一语音识别结果的方式,达到了通过结合识别对象和识别场景,在前端构建数学模型进行智能化的异常识别和修正,从而提高场景化适用性识别结果的准确性的技术效果。
[0010]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0011]通过阅读参照以下附图对非限制性实施例所做的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本申请实施例一种基于场景化的语音智能识别方法的流程示意图;图2为本申请实施例一种基于场景化的语音智能识别方法的生成第一纠错语料库的流程示意图;图3为本申请实施例一种基于场景化的语音智能识别方法的搭建预处理功能区块的流程示意图;图4为本申请实施例一种基于场景化的语音智能识别系统的结构示意图;图5为本申请实施例示例性电子设备的结构示意图。
具体实施方式
[0012]本申请实施例通过提供一种基于场景化的语音智能识别方法及系统,解决了现有技术中存在语音识别无法根据场景化特征进行智能化识别,从而造成识别结果准确性不够稳定的技术问题,达到了通过结合识别对象和识别场景,在前端构建数学模型进行智能化
的异常识别和修正,从而提高场景化适用性识别结果的准确性的技术效果。
[0013]下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
[0014]申请概述随着语音识别技术的不断发展,使得语音识别产品已经进入市场和服务领域,基于目前语音识别使用的应用场景多样化,为了保证语音识别技术在应用场景下的适应性和识别准确度,提出了一种基于场景化的语音智能识别方法,从而能够通过对场景化进行分析,并结合识别对象进行智能化识别,基于数学模型的方式对异常识别结果进行纠错,从而提高识别结果准确性。
[0015]针对上述技术问题,本申请提供的技术方案总体思路如下:通过提供一种基于场景化的语音智能识别方法,解决了现有技术中存在语音识别无法根据场景化特征进行智能化识别,从而造成识别结果准确性不够稳定的技术问题。进一步的,通过对所述语音识别识别系统的识别环境进行分析,确定第一位置场景信息,并根据所述第一数据采集装置对处于所述第一位置场景的语音识别对象进行用户数据采集,从而根据采集获得的第一识别对象信息进行语音特征分析,进而生成第一识别语料库和第一纠错语料库,基于此进行场景模型的模拟,根据模拟的数据,构建用于进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于场景化的语音智能识别方法,其特征在于,所述方法应用于一种基于场景化的语音智能识别系统,所述系统与第一数据采集装置通信连接,所述方法包括:基于所述语音智能识别系统的识别环境,获得第一位置场景;根据所述第一数据采集装置对所述第一位置场景的语音对象进行数据采集,获得第一识别对象信息;根据所述第一识别对象信息的语言特征信息,生成第一识别语料库和第一纠错语料库;根据所述第一识别语料库和所述第一纠错语料库进行场景模型模拟,构建第一先验纠错模型,其中,所述第一先验纠错模型为先验语义识别的异常纠错模型;根据所述语音智能识别系统接收所述第一位置场景的实时语音数据;通过对所述实时语音数据进行声学模型匹配,获得第一匹配结果,其中,所述第一匹配结果为第一匹配声学模型;根据所述第一先验纠错模型和所述第一匹配声学模型进行解码搜索,输出第一语音识别结果。2.如权利要求1所述的方法,其特征在于,所述根据所述第一识别对象信息的语言特征信息,生成第一识别语料库和第一纠错语料库,所述方法还包括:根据所述第一位置场景的信息,生成第一场景语料库;根据所述第一识别对象信息进行地区差异语音分析,获得第一差异语料库;根据所述第一差异语料库对所述第一场景语料库中的语料进行比对连接,生成第一语音差异纠错库;将所述第一语音差异纠错库添加至所述第一纠错语料库中。3.如权利要求2所述的方法,其特征在于,所述方法还包括:通过对所述第一位置场景的信息进行分析,确定第一场景任务;基于所述第一场景任务的信息,从所述第一场景语料库中获得任务场景语料词库,其中,所述任务场景语料词库为该任务条件下的场景替换词;将所述任务场景语料词库作为第二语音差异纠错库添加至所述第一纠错语料库中。4.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第一识别对象信息进行语音特征分析,获得第一语音特征组,其中,所述第一语音特征组包括音色识别特征、词汇量化特征和语音转折特征;根据所述音色识别特征、所述词汇量化特征和所述语音转折特征,确定第一识别维度、第二识别维度和第三识别维度;基于所述第一识别维度、所述第二识别维度和所述第三识别维度对所述实时语音数据进行识别。5.如权利要求4所述的方法,其特征在于,所述通过对所述实时语音数据进行声学模型匹配,获得第一匹配结果,其中,所述第一匹配结果为第一匹配声学模型,所述方法还包括:获得所述第一识别对象在所述第一位置场景的实时语音数据;通过对所述第一识别维度、所述第二识别维度和所述第三识别维度的特征强...

【专利技术属性】
技术研发人员:杜兰杜轶锋周国华廖森平叶国伟
申请(专利权)人:科大讯飞华南有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1