一种语音识别方法、系统、设备及介质技术方案

技术编号:39262309 阅读:9 留言:0更新日期:2023-10-30 12:15
本发明专利技术公开了一种语音识别方法、系统、设备及介质,所述方法包括以下步骤:配置深度学习算法,搭建口音训练数据集,基于深度学习算法和口音训练数据集训练语音识别模型;响应于语音指令的输入,调用语音识别模型基于语速适配算法识别语音指令,得到识别结果;根据识别结果进行指令功能实现;本发明专利技术能够针对口音数据进行深度训练集的训练,针对语速语音数据进行不同读取速度的适配,提高语音识别的智能性,提升语音识别的适用范围以及精准性,支持多语言和方言的语音识别,提高适用性和普适性。性。性。

【技术实现步骤摘要】
一种语音识别方法、系统、设备及介质


[0001]本专利技术涉及人工智能
,特别是涉及一种语音识别方法、系统、设备及介质。

技术介绍

[0002]目前,随着人工智能技术的快速发展,语音识别技术在日常生活中的应用越来越广泛。
[0003]现有技术中,以及市场中已经有许多智能语音助手,如苹果的Siri、亚马逊的Alexa以及谷歌助手等,它们可以帮助用户完成各种任务,例如播放音乐、查询天气、设置提醒等。
[0004]然而,这些设备的使用需要用户对指令进行准确的语音输入,一旦遇到一些具有口音、或口音较重、或语速较快的用户来说,语音输入的准确性以及语音识别的准确性则会降低,这导致语音识别存在一定的困难。

技术实现思路

[0005]本专利技术的目的在于,针对现有技术中的上述问题,提供一种语音识别方法、系统、设备及介质,进而解决现有技术中人工智能对于口音语音数据以及较快语速的语音数据的识别精确度较低,导致语音识别存在一定的困难的问题。
[0006]为解决上述技术问题,本专利技术的具体技术方案如下:一方面,本专利技术提供一种语音识别方法,包括以下步骤:模型训练步骤:配置深度学习算法,搭建口音训练数据集,基于所述深度学习算法和所述口音训练数据集训练语音识别模型;语音自适应识别步骤:响应于语音指令的输入,调用所述语音识别模型基于语速适配算法识别所述语音指令,得到识别结果;功能响应步骤:根据所述识别结果进行指令功能实现。
[0007]作为一种改进的方案,所述搭建口音训练数据集,包括:配置若干种类的口音语音数据作为若干训练数据;将若干所述训练数据作为所述口音训练数据集。
[0008]作为一种改进的方案,所述调用所述语音识别模型基于语速适配算法识别所述语音指令,得到识别结果,包括:调用训练后的所述语音识别模型对所述语音指令进行识别,得到所述识别结果;对所述语音指令进行识别时,基于所述语速适配算法控制所述语音识别模型的识别速度;所述语速适配算法,包括:识别所述语音指令的语速;控制所述语音识别模型的识别速度与所述语速相匹配。
[0009]作为一种改进的方案,所述根据所述识别结果进行指令功能实现,包括:
将所述识别结果转换为与所述语音指令对应的功能执行控制指令;调用功能执行控制指令触发对应功能模块的功能服务。
[0010]另一方面,本专利技术还提供一种语音识别系统,包括:模型训练模块、语音自适应识别模块和功能响应模块;所述模型训练模块,用于配置深度学习算法,搭建口音训练数据集,基于所述深度学习算法和所述口音训练数据集训练语音识别模型;所述语音自适应识别模块,用于响应于语音指令的输入,调用所述语音识别模型基于语速适配算法识别所述语音指令,得到识别结果;所述功能响应模块,用于根据所述识别结果进行指令功能实现。
[0011]作为一种改进的方案,所述模型训练模块,还用于配置若干种类的口音语音数据作为若干训练数据;所述模型训练模块将若干所述训练数据作为所述口音训练数据集。
[0012]作为一种改进的方案,所述语音自适应识别模块,还用于调用训练后的所述语音识别模型对所述语音指令进行识别,得到所述识别结果;所述语音自适应识别模块对所述语音指令进行识别时,基于所述语速适配算法控制所述语音识别模型的识别速度;所述语速适配算法,包括:识别所述语音指令的语速;控制所述语音识别模型的识别速度与所述语速相匹配。
[0013]作为一种改进的方案,所述功能响应模块,还用于将所述识别结果转换为与所述语音指令对应的功能执行控制指令;所述功能响应模块调用功能执行控制指令触发对应功能模块的功能服务。
[0014]另一方面,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述语音识别方法的步骤。
[0015]另一方面,本专利技术还提供一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;其中:所述存储器,用于存放计算机程序;所述处理器,用于通过运行所述存储器上所存放的程序来执行所述语音识别方法的步骤。
[0016]本专利技术技术方案的有益效果是:本专利技术所述的语音识别方法,可以实现针对口音数据进行深度训练集的训练,针对语速语音数据进行不同读取速度的适配,提高语音识别的智能性,提升语音识别的适用范围以及精准性,支持多语言和方言的语音识别,提高适用性和普适性。
[0017]本专利技术所述的语音识别系统,可以通过模型训练模块、语音自适应识别模块和功能响应模块的相互配合,进而实现针对口音数据进行深度训练集的训练,针对语速语音数据进行不同读取速度的适配,提高语音识别的智能性,提升语音识别的适用范围以及精准性,支持多语言和方言的语音识别,提高适用性和普适性。
[0018]本专利技术所述的计算机可读存储介质,可以实现引导模型训练模块、语音自适应识别模块和功能响应模块进行配合,进而实现本专利技术所述的语音识别方法,且本专利技术所述的计算机可读存储介质还有效提高所述语音识别方法的可操作性。
[0019]本专利技术所述的计算机设备,可以实现存储并执行所述计算机可读存储介质,进而
实现本专利技术所述的语音识别方法。
附图说明
[0020]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术实施例1所述语音识别方法的流程示意图;图2是本专利技术实施例1所述语音识别方法的详细流程示意图;图3是本专利技术实施例2所述语音识别系统的架构示意图;图4是本专利技术实施例4所述计算机设备的结构示意图;附图中的标记说明如下:1501、处理器;1502、通信接口;1503、存储器;1504、通信总线。
具体实施方式
[0022]下面结合附图对本专利技术的较佳实施例进行详细阐述,以使本专利技术的优点和特征能更易于被本领域技术人员理解,从而对本专利技术的保护范围做出更为清楚明确的界定。
[0023]在本专利技术的描述中,需要说明的是,本专利技术所描述的实施例是本专利技术一部分实施例,而不是全部的实施例;基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括以下步骤:模型训练步骤:配置深度学习算法,搭建口音训练数据集,基于所述深度学习算法和所述口音训练数据集训练语音识别模型;语音自适应识别步骤:响应于语音指令的输入,调用所述语音识别模型基于语速适配算法识别所述语音指令,得到识别结果;功能响应步骤:根据所述识别结果进行指令功能实现。2.根据权利要求1所述的一种语音识别方法,其特征在于:所述搭建口音训练数据集,包括:配置若干种类的口音语音数据作为若干训练数据;将若干所述训练数据作为所述口音训练数据集。3.根据权利要求2所述的一种语音识别方法,其特征在于:所述调用所述语音识别模型基于语速适配算法识别所述语音指令,得到识别结果,包括:调用训练后的所述语音识别模型对所述语音指令进行识别,得到所述识别结果;对所述语音指令进行识别时,基于所述语速适配算法控制所述语音识别模型的识别速度;所述语速适配算法,包括:识别所述语音指令的语速;控制所述语音识别模型的识别速度与所述语速相匹配。4.根据权利要求3所述的一种语音识别方法,其特征在于:所述根据所述识别结果进行指令功能实现,包括:将所述识别结果转换为与所述语音指令对应的功能执行控制指令;调用功能执行控制指令触发对应功能模块的功能服务。5.一种语音识别系统,其特征在于,包括:模型训练模块、语音自适应识别模块和功能响应模块;所述模型训练模块,用于配置深度学习算法,搭建口音训练数据集,基于所述深度学习算法和所述口音训练数据集训练语音识别模型;所述语音自适应识别模块,用于响应于语音指令的输入,调用...

【专利技术属性】
技术研发人员:胡焱邢士武常绍盈袭祥亮
申请(专利权)人:浪潮金融信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1