一种基于多突触连接光脉冲神经网络的语音识别方法技术

技术编号:36336572 阅读:17 留言:0更新日期:2023-01-14 17:48
本发明专利技术涉及一种基于多突触连接光脉冲神经网络的语音识别方法,包括:步骤1:获取元音数据集作为训练样本;步骤2:建立多突触的光脉冲神经网络模型;步骤3:将训练样本输入至光脉冲神经网络模型中,利用权重更新算法对光脉冲神经网络模型进行训练,得到训练完成的光脉冲神经网络模型;步骤4:利用训练完成的光脉冲神经网络模型实现语音识别。本发明专利技术的基于多突触连接光脉冲神经网络的语音识别方法,提高了语音识别的准确率,增强了复杂语音数据的处理能力。力。力。

【技术实现步骤摘要】
一种基于多突触连接光脉冲神经网络的语音识别方法


[0001]本专利技术属于语音识别
,具体涉及一种基于多突触连接光脉冲神经网络的语音识别方法。

技术介绍

[0002]智能语音被誉为人工智能皇冠上的“明珠”,随着深度学习技术的突破,大数据技术以及自然语言理解能力的提升,带动了一波产业热潮,除了在教育、客服、电信等传统行业之外,还开辟出了车载、家居、医疗、智能硬件等语音技术应用新天地。随着人工智能的兴起,基于人工神经网络的语音识别技术已经从理论走向市场应用。语音识别本质上是一种基于语音特征参数的模式识别,通过模型训练学习,可以把输入的语音按一定模式进行分类。
[0003]脉冲神经网络作为类脑计算的核心领域,被誉为“第三代神经网络模型”,它能够有效模拟生物神经元之间信息随时间连续传递的动力系统。它的脉冲信息传递机制恰好可以弥补深度学习在模拟时间特性上的缺陷。
[0004]但是,传统的脉冲神经网络算法为了提高计算效率,采用极为简化的脉冲神经元模型,其只包含一个维度,甚至缺失了产生脉冲的内在机制,不能够有效模拟生物神经网络中脉冲传递以及不应期等特性,降低了网络的复杂度。其次,传统直接训练脉冲神经网络的局部学习算法中,容易遇到参数饱和的问题,权重可能会趋于一个极大或者极小的值,不能稳定收敛。再次,传统脉冲神经网络中包括抑制性和兴奋性神经元及突触,存在负脉冲和负权重信息,然而在光域中,无法有效表达负脉冲信息,因此不能直接应用于光学脉冲神经网络。另外,在实际生物神经网络中,一对神经元之间也可能存在多对连接,而现有的光脉冲神经网络算法中只考虑了单突触连接。上述存在的缺陷均会导致传统脉冲神经网络算法在语音识别过程中识别准确率较低,不能处理复杂的语音数据。

技术实现思路

[0005]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于多突触连接光脉冲神经网络的语音识别方法。采用基于激光器模型的光脉冲神经元,提供了一种适配于光学硬件平台的算法。本专利技术要解决的技术问题通过以下技术方案实现:
[0006]本专利技术提供了一种基于多突触连接光脉冲神经网络的语音识别方法,包括:
[0007]步骤1:获取元音数据集作为训练样本;
[0008]步骤2:建立多突触的光脉冲神经网络模型;
[0009]步骤3:将所述训练样本输入至所述光脉冲神经网络模型中,利用权重更新算法对所述光脉冲神经网络模型进行训练,得到训练完成的光脉冲神经网络模型;
[0010]步骤4:利用训练完成的光脉冲神经网络模型实现语音识别。
[0011]在本专利技术的一个实施例中,所述步骤2包括:
[0012]步骤2.1:根据所述训练样本的特征维度和预设的高斯脉冲个数,确定输入神经元
的个数;
[0013]步骤2.2:根据所述输入神经元个数以及预设的每个输入神经元到输出神经元的突触个数,确定多突触的光脉冲神经网络模型的突触个数;
[0014]步骤2.3:根据所述输入神经元的个数、所述输出神经元的个数和所述突触个数,建立所述多突触的光脉冲神经网络模型。
[0015]在本专利技术的一个实施例中,所述步骤3包括:
[0016]步骤3.1:初始化所述多突触的光脉冲神经网络模型的参数;
[0017]步骤3.2:将所述训练样本按照预设的高斯脉冲个数进行高斯编码;
[0018]步骤3.3:将高斯编码后训练样本输入至所述光脉冲神经网络模型中,得到模型输出结果,所述模型输出结果包括所述输出神经元产生的脉冲个数n
o
,首个脉冲时间t
o
,以及峰值处时刻t
max

[0019]步骤3.4:根据所述训练样本的真实类别和所述模型输出结果对所述多突触的光脉冲神经网络模型的权重进行调整;
[0020]步骤3.5:重复步骤3.3

步骤3.4,直到达到预设的训练次数,得到训练完成的光脉冲神经网络模型。
[0021]在本专利技术的一个实施例中,所述步骤3.4包括:
[0022]判断所述模型输出结果是否满足约束条件,若满足,则执行权重更新算法,对所述多突触的光脉冲神经网络模型的权重进行调整,若不满足,则执行步骤3.5;其中,
[0023]所述约束条件为:
[0024][0025]其中,n
d
表示目标神经元的目标脉冲个数,d
i
表示每个突触的传入时延,t
i
表示训练样本的输入时间,T
w
表示学习时间窗口;
[0026]所述权重更新算法为:
[0027][0028]w(x+1)=w(x)+Δw
oi

[0029]其中,Δw
oi
表示权重调整值,η表示学习率,Δw
STDP
表示根据STDP规则调整权重,Δw
aSTDP
表示根据反STDP规则调整权重,w(x)表示当前的权重值,w(x+1)表示更新后的权重值。
[0030]在本专利技术的一个实施例中,在所述步骤3.4中,若w(x+1)<0,则令w(x+1)=rand,rand表示正随机数。
[0031]与现有技术相比,本专利技术的有益效果在于:
[0032]本专利技术的基于多突触连接光脉冲神经网络的语音识别方法,针对光学脉冲神经网络应用于语音识别领域中的问题,提出通过高斯编码和多突触来扩展特征维度的方案,有效提升光脉冲神经网络的性能,通过对负权值的突触选择随机激活,避免输入信息丢失,并能避免过拟合,提高了语音识别的准确率,增强了复杂语音数据的处理能力。
[0033]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0034]图1是本专利技术实施例提供的一种基于多突触连接光脉冲神经网络的语音识别方法的示意图;
[0035]图2是本专利技术实施例提供的一种多突触的光脉冲神经网络模型的结构示意图;
[0036]图3是本专利技术实施例提供的一种基于多突触连接光脉冲神经网络的训练流程示意图;
[0037]图4是本专利技术实施例提供的仿真实验的结果示意图。
具体实施方式
[0038]为了进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本专利技术提出的一种基于多突触连接光脉冲神经网络的语音识别方法进行详细说明。
[0039]有关本专利技术的前述及其他
技术实现思路
、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本专利技术为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本专利技术的技术方案加以限制。
[0040]实施例一
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多突触连接光脉冲神经网络的语音识别方法,其特征在于,包括:步骤1:获取元音数据集作为训练样本;步骤2:建立多突触的光脉冲神经网络模型;步骤3:将所述训练样本输入至所述光脉冲神经网络模型中,利用权重更新算法对所述光脉冲神经网络模型进行训练,得到训练完成的光脉冲神经网络模型;步骤4:利用训练完成的光脉冲神经网络模型实现语音识别。2.根据权利要求1所述的基于多突触连接光脉冲神经网络的语音识别方法,其特征在于,所述步骤2包括:步骤2.1:根据所述训练样本的特征维度和预设的高斯脉冲个数,确定输入神经元的个数;步骤2.2:根据所述输入神经元个数以及预设的每个输入神经元到输出神经元的突触个数,确定多突触的光脉冲神经网络模型的突触个数;步骤2.3:根据所述输入神经元的个数、所述输出神经元的个数和所述突触个数,建立所述多突触的光脉冲神经网络模型。3.根据权利要求2所述的基于多突触连接光脉冲神经网络的语音识别方法,其特征在于,所述步骤3包括:步骤3.1:初始化所述多突触的光脉冲神经网络模型的参数;步骤3.2:将所述训练样本按照预设的高斯脉冲个数进行高斯编码;步骤3.3:将高斯编码后训练样本输入至所述光脉冲神经网络模型中,得到模型输出结果,所述模型输出结果包括所述输出神经元产生的脉冲个数n
o
,首个脉冲时间t
o
,以及峰值处时刻t
max
;步骤3.4:根据所述训练样本的真...

【专利技术属性】
技术研发人员:项水英韩亚楠张雅慧郭星星郝跃
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1