当前位置: 首页 > 专利查询>山东云海国创云计算装备产业创新中心有限公司专利>正文

一种语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：41825528 阅读：2 留言：0更新日期：2024-06-24 20:38

本申请公开了一种语音识别方法，包括：利用FPGA调度器接收嵌入式系统发送的语音识别命令；根据语音识别命令从嵌入式系统中读取语音模型配置信息和待识别语音数据；利用语音识别处理模块中的动态重配置处理器根据语音模型配置信息对各网络层处理器进行资源调度，得到FPGA语音识别加速器模型；利用FPGA语音识别加速器模型对待识别语音数据进行识别，得到识别结果；将识别结果返回给嵌入式系统。应用本申请所提供的语音识别方法，减轻了嵌入式系统的负载，提高了硬件加速灵活性，提高了识别的效率，降低了成本。本申请还公开了一种语音识别装置、设备及存储介质，具有相应技术效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，特别是涉及一种语音识别方法、装置、设备及计算机可读存储介质。

技术介绍

1、目前加速嵌入式神经网络语音识别推理主要有软件和硬件两种方法。

2、软件加速主要有训练集的乱序处理与增强处理、编程语言的切换，cpu(centralprocessing unit，中央处理器)simd(single instruction multiple data，单指令流多数据流)向量加速推理。训练集的乱序处理与增强处理、编程语言的切换是相同的加速方法，本质上是对训练集的优化和处理逻辑上的优化。对于训练集的乱序处理与增强处理，是为了增加数据的数量和多样性进而提高模型的鲁棒性和泛化性。对于编程语言的切换，是为了查看编译和解释型语言对于训练和推理的区别，但是从代码的编写难度、维护成本和训练模型整体的时间来看，不能看出谁更具优势或更迅速。尽管这两种方式都可以在一定程度上加快训练模型时间和推理时间，但是效果都可忽略不计。cpu simd加速推理是一种通过使用一条指令同时处理多个数据项来提高计算效率的技术。它使用特殊的硬件指令同时对多个数据项执行相同的操作，从而减少指令和数据传输的数量，提高计算性能。虽然在性能上有所提升，但是相较于外接硬件加速，嵌入式系统cpu的性能没有任何优势。

3、现有的硬件加速方法主要有专用集成电路(asic)和神经网络计算棒。asic是用于供专门应用的集成电路芯片技术，其相较于软件加速方法，通过更改硬件架构的方式大大提高了训练和推理的效率，但是其灵活性差和开发周期长以及门槛极高。神经网络计算棒

4、综上所述，如何有效地解决现有的语音识别方法，硬件加速灵活性差、成本高等问题，是目前本领域技术人员急需解决的问题。

技术实现思路

1、本申请的目的是提供一种语音识别方法，该方法减轻了嵌入式系统的负载，提高了硬件加速灵活性，提高了识别的效率，降低了成本；本申请的另一目的是提供一种语音识别装置、设备及计算机可读存储介质。

2、为解决上述技术问题，本申请提供如下技术方案：

3、一种语音识别方法，应用于fpga平台，包括：

4、利用fpga调度器接收嵌入式系统发送的语音识别命令；

5、根据所述语音识别命令从所述嵌入式系统中读取语音模型配置信息和待识别语音数据；

6、利用语音识别处理模块中的动态重配置处理器根据所述语音模型配置信息对各网络层处理器进行资源调度，得到fpga语音识别加速器模型；

7、利用所述fpga语音识别加速器模型对所述待识别语音数据进行识别，得到识别结果；

8、将所述识别结果返回给所述嵌入式系统。

9、在本申请的一种具体实施方式中，在得到识别结果之后，还包括：

10、利用所述语音识别处理模块中的强化学习处理器和所述动态重配置处理器对所述fpga语音识别加速器模型进行迭代。

11、在本申请的一种具体实施方式中，利用所述语音识别处理模块中的强化学习处理器和所述动态重配置处理器对所述fpga语音识别加速器模型进行迭代，包括：

12、将所述识别结果和所述待识别语音数据发送至预设经验回放集合；

13、当达到预设模型迭代周期时，利用所述语音识别处理模块获取所述动态重配置处理器的当前配置参数状态组；

14、利用所述强化学习处理器将所述当前配置参数状态组发送至q网络；

15、从所述预设经验回放集合中选取所述当前配置参数状态组对应的识别结果和待识别语音数据发送至所述q网络；

16、利用所述q网络建立包含所述动态重配置处理器的配置参数动作组的q值函数；

17、根据所述q值函数对所述动态重配置处理器进行网络层参数重配置，以对所述fpga语音识别加速器模型进行迭代。

18、在本申请的一种具体实施方式中，利用语音识别处理模块中的动态重配置处理器根据所述语音模型配置信息对各网络层处理器进行资源调度，包括：

19、利用语音识别处理模块中的动态重配置处理器根据所述语音模型配置信息和所述网络层处理器对应的权重值对各网络层处理器进行资源调度。

20、在本申请的一种具体实施方式中，利用所述fpga语音识别加速器模型对所述待识别语音数据进行识别，包括：

21、利用所述fpga语音识别加速器模型中采用一维卷积的卷积层处理器对所述待识别语音数据进行卷积运算得到卷积运算结果；

22、将所述fpga语音识别加速器模型中的激活函数处理器选择与所述语音模型配置信息对应的激活函数；

23、利用激活函数选择完成的激活函数处理器对所述卷积运算结果进行特征图计算，得到卷积层特征图；

24、根据所述语音模型配置信息判断所述fpga语音识别加速器模型中是否存在池化层；

25、若是，则利用所述fpga语音识别加速器模型中的池化层处理器对所述卷积层特征图进行池化操作，得到池化层特征图；

26、利用所述fpga语音识别加速器模型中的全连接层处理器对所述池化层特征图进行全连接计算；

27、若否，则利用所述fpga语音识别加速器模型中的全连接层处理器对所述卷积层特征图进行全连接计算。

28、在本申请的一种具体实施方式中，利用fpga调度器接收嵌入式系统发送的语音识别命令，包括：

29、接收嵌入式系统发送的门铃信息；

30、利用所述fpga调度器从提交队列寄存器中读取所述嵌入式系统预先写入的语音识别命令；

31、相应的，根据所述语音识别命令从所述嵌入式系统中读取语音模型配置信息和待识别语音数据，包括：

32、利用所述fpga平台的cpu在本地内存中将所述语音识别命令转换成命令描述符；

33、利用直接内存访问从所述本地内存中读取所述命令描述符；

34、根据所述命令描述符从所述嵌入式系统中读取所述语音模型配置信息和所述待识别语音数据。

35、在本申请的一种具体实施方式中，在根据所述命令描述符从所述嵌入式系统中读取所述语音模型配置信息和所述待识别语音数据之后，还包括：

36、将所述语音模型配置信息和所述待识别语音数据缓存到先进先出模块中；

37、相应的，利用语音识别处理模块中的动态重配置处理器根据所述语音模型配置信息对各网络层处理器进行资源调度，包括：

38、利用语音识别处理模块从所述先进先出模块中读取所述语音模型配置信息和所述待识别语音数据，并利用所述动态重配置处理器根据所述语音模型配置信息对各网络层处理器进行资源调度。

39、一种语音识别装置，应用于fpga平台，包括：

40、本文档来自技高网...

【技术保护点】

1.一种语音识别方法，其特征在于，应用于FPGA平台，包括：

2.根据权利要求1所述的语音识别方法，其特征在于，在得到识别结果之后，还包括：

3.根据权利要求2所述的语音识别方法，其特征在于，利用所述语音识别处理模块中的强化学习处理器和所述动态重配置处理器对所述FPGA语音识别加速器模型进行迭代，包括：

4.根据权利要求1所述的语音识别方法，其特征在于，利用语音识别处理模块中的动态重配置处理器根据所述语音模型配置信息对各网络层处理器进行资源调度，包括：

5.根据权利要求1至4任一项所述的语音识别方法，其特征在于，利用所述FPGA语音识别加速器模型对所述待识别语音数据进行识别，包括：

6.根据权利要求1所述的语音识别方法，其特征在于，利用FPGA调度器接收嵌入式系统发送的语音识别命令，包括：

7.根据权利要求6所述的语音识别方法，其特征在于，在根据所述命令描述符从所述嵌入式系统中读取所述语音模型配置信息和所述待识别语音数据之后，还包括：

8.一种语音识别装置，其特征在于，应用于FPGA平台，包括：</p>

9.一种语音识别设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音识别方法的步骤。

...

【技术特征摘要】

1.一种语音识别方法，其特征在于，应用于fpga平台，包括：

2.根据权利要求1所述的语音识别方法，其特征在于，在得到识别结果之后，还包括：

3.根据权利要求2所述的语音识别方法，其特征在于，利用所述语音识别处理模块中的强化学习处理器和所述动态重配置处理器对所述fpga语音识别加速器模型进行迭代，包括：

5.根据权利要求1至4任一项所述的语音识别方法，其特征在于，利用所述fpga语音识别加速器模型对所述待识别...

【专利技术属性】
技术研发人员：李彧，李太鑫，李瑞东，郭鹏，王卿，
申请(专利权)人：山东云海国创云计算装备产业创新中心有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人