System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种眼睛疲劳检测算法制造技术_技高网

一种眼睛疲劳检测算法制造技术

技术编号:42508367 阅读:3 留言:0更新日期:2024-08-22 14:24
本发明专利技术涉及疲劳检测技术领域,具体涉及一种眼睛疲劳检测算法,检测算法包括一个GazeNet网络结构,GazeNet网络结构内包括特征提取网络、分类网络与疲劳判定,特征提取网络包括Inception模块、ResBlock模块以及CBAM注意力模块,Inception模块采用并行结构,Inception模块将一个5×5的卷积核分解成两个3×3的卷积核,减少模型参数的数量和计算量,分类网络包括全连接层。本申请通过开发的GazeNet的网络结构,可以减少模型参数的数量和计算量,节省了计算成本,同时保持相同的感受野,能够更好地捕捉图像中的多尺度信息,在提升深度学习网络准确率的同时防止过拟合现象的发生,进而提升模型的性能,疲劳检测算法简单,减少误差,提升检测识别率,带来更好的使用前景。

【技术实现步骤摘要】

本专利技术属于疲劳检测,具体为一种眼睛疲劳检测算法


技术介绍

1、眼睛疲劳是一种常见的眼部不适症状,可能由多种因素引起,以下是一些常见的原因:眼部因素:包括屈光不正和眼部健康问题,这些问题可能导致眼睛调节和集合功能异常,进而引发视疲劳,环境因素:如光线过亮或过暗、长时间近距离用眼,以及阅读或观看的物体过小等,都容易使眼睛感到疲劳;近年来由于疲劳驾驶而导致的交通事故占总交通事故的40%以上,疲劳驾驶检测技术的研究已经变得越来越重要,但是现有的技术中存在对于眼睛疲劳的检测算法复杂,检测存在误差,不够准确,检测识别率较低的问题,对此,我们提出了一种眼睛疲劳检测算法。


技术实现思路

1、针对现有技术的不足,本专利技术提供了一种眼睛疲劳检测算法,以解决以上技术问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种眼睛疲劳检测算法,检测算法包括一个gazenet网络结构,gazenet网络结构内包括特征提取网络、分类网络与疲劳判定,特征提取网络包括inception模块、resblock模块以及cbam注意力模块,inception模块采用并行结构,inception模块将一个5×5的卷积核分解成两个3×3的卷积核,减少模型参数的数量和计算量,分类网络包括全连接层。

3、优先地,resblock模块通过将卷积层的输出和输入直接相加来实现跳跃连接,其中resblock模块在残差块中,输入x通过一系列卷积层与非线性激活函数后,得到输出f(x),将输入x与输出f(x)相加,得到残差块的输出h(x),这个过程用以下公式表示:

4、h(x)=f(x)+x

5、其中x表示为卷积神经网络输入,f(x)为卷积神经网络的输出,h(x)为残差块的输出,允许网络学习输入与输出之间的残差,通过学习得到一组权重,使得趋近于,让网络学习输入与输出之间的映射关系。

6、优先地,cbam注意力模块用以通过注意力机制去提高卷积神经网络的性能,cbam注意力模块分为通道注意力与空间注意力,其中通道注意力用以捕捉不同通道之间的相关性,一个h×w×c的输入的特征为f,公式如下所示:

7、

8、其中f为注意力特征值,avgpool(f)代表最小注意力通道指数,maxpool代表最大注意力通道指数,σ为眼睛肌肉疲劳指数函数,ms(f)代表眼睛疲劳权重系数函数;

9、在通道注意力中,先通过全局平均池化与最大池化操作得到两个1×1×c的通道,将其通过一个两层的神经网络进行映射和激活,第一层神经元个数为c/r,激活函数为relu,第二层神经元个数为c,将得到的两个特征相加后经过sigmoid激活函数得到权重系数mc,与输入特征映射相乘,得到加强了通道特征表示的新特征。

10、优先地,空间注意力用以捕捉特征图上不同位置的相关性,一个h×w×c的输入的特征为f,公式如下所示:

11、

12、其中f为注意力特征值,avgpool(f)代表最小注意力空间指数,maxpool代表最大注意力空间指数,σ为眼睛空间注意力函数,mc(f)代表眼睛空间注意力权重系数;

13、在空间注意力中,首先分别进行平均池化和最大池化得到两个h×w×1,将其拼接在一起并经过一个7×7的卷积层,激活函数为sigmoid,得到权重系数ms,将这个权重通过元素乘法的方式,与输入特征映射相乘,得到加强了空间特征表示的输出。

14、优先地,全连接层用以将卷积操作后的局部特征通过权值矩阵整合在一起来执行,判断中要得到眼睛是向前、向左或向右的判定结果,设特征提取网络的输出为2×2×4,全连接层有3个神经元,先将特征提取网络的输出展平成一维列向量x=[x1,x2,…,x15,x16]t,对于全连接层中的每个神经元z=[z1,z2,z3]t,都会与x中的每个元素进行线性操作,在前向传播过程中,全连接层看作一个线性加权求和的过程,每个前一层节点都会乘以一个权重系数w并加上一个偏置b,从而得到全连接层上对应的输出z,全连接层的计算过程可以使用如下公式进行表达:

15、

16、其中z表示为全连接层上对应的输出值,w表示为权重系数,x为一维向量,b为偏置项。

17、优先地,其中对全连接层的计算输出值处理方法采用softmax函数,softmax函数用以对输出结果进行归一化处理,对概率的形式展示多分类的结果,将全连接层上的神经元z=[z1,z2,z3]t经softmax函数归一化后变为y=[y1,y2,y3]t,约束条件为y1+y2+y3=1,yi与zj之间的转化关系为:

18、

19、其中yi为归一化后的眼睛疲劳指数,zj为各个分类结果权重疲劳指数;

20、softmax函数将一个向量映射成一个概率分布,即每个元素都是一个非负数,所有元素之和为1,因此,对于一个具有n个类别的多分类问题,softmax函数将n维向量转换为一个概率分布,其中每个元素表示该类别的预测概率,在训练过程中,采用交叉熵函数去衡量两个概率分布之间的差异。

21、优先地,交叉熵函数公式为:

22、

23、其中y为真实标签,为softmax模型对其的预测输出值,该公式看作是真实标签和预测标签之间的kl散度,当模型的输出概率分布与真实的概率分布完全一致时,交叉熵函数取得最小值0;当它们之间的差异增大时,交叉熵函数的值也会增大。

24、优先地,疲劳判定通过计算眼睛频率与损伤比判断眼睛疲劳状态判断出疲劳情况。

25、优先地,疲劳判定步骤通过在眼睛图像中定位眼睛的轮廓,然后计算左右眼各自的ear值,得到左右眼平均ear值,当眼睛睁开时,ear保持一个恒定值;而当眼睛无损伤时,ear值趋于0,计算出的ear值小于设定的阈值,则判定为眼睛损伤,根据ear值与阈值的差来评价眼睛的损伤程度,ear计算公式为:

26、

27、其中earleft代表眼睛肌肉的疲劳系数,p1代表自然状态的肌肉疲劳指数,p2代表疲劳状态的肌肉疲劳指数,p3代表闭眼状态的肌肉疲劳指数,p4代表睁眼状态的肌肉疲劳指数,p5代表当前采集到的肌肉疲劳指数。

28、优先地,inception模块用以将多个不同尺寸的卷积核和池化层组合起来,进行特征提取,其中3×3的卷积核公式为:

29、y=f(w3*x)

30、其中y为输出的特征图,f为激活函数,w3为3*3的卷积核权重,x为上一层的输出特征图。

31、与现有技术相比,本专利技术的有益效果如下:

32、本申请通过开发的gazenet的网络结构,可以减少模型参数的数量和计算量,节省了计算成本,同时保持相同的感受野,能够更好地捕捉图像中的多尺度信息,在提升深度学习网络准确率的同时防止过拟合现象的发生,进而提升模型的性能,疲劳检测算法简单,减少误差,提升检测识别率,带来更好的使用前景。

本文档来自技高网...

【技术保护点】

1.一种眼睛疲劳检测算法,其特征在于:检测算法包括一个GazeNet网络结构,GazeNet网络结构内包括特征提取网络、分类网络与疲劳判定,特征提取网络包括Inception模块、ResBlock模块以及CBAM注意力模块,Inception模块采用并行结构,Inception模块将一个5×5的卷积核分解成两个3×3的卷积核,减少模型参数的数量和计算量,分类网络包括全连接层。

2.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:ResBlock模块通过将卷积层的输出和输入直接相加来实现跳跃连接,其中ResBlock模块在残差块中,输入x通过一系列卷积层与非线性激活函数后,得到输出F(x),将输入x与输出F(x)相加,得到残差块的输出H(x),这个过程用以下公式表示:

3.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:CBAM注意力模块用以通过注意力机制去提高卷积神经网络的性能,CBAM注意力模块分为通道注意力与空间注意力,其中通道注意力用以捕捉不同通道之间的相关性,一个H×W×C的输入的特征为F,公式如下所示:

4.根据权利要求3所述的眼睛疲劳检测算法,其特征在于:空间注意力用以捕捉特征图上不同位置的相关性,一个H×W×C的输入的特征为F,公式如下所示:

5.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:全连接层用以将卷积操作后的局部特征通过权值矩阵整合在一起来执行,判断中要得到眼睛是向前、向左或向右的判定结果,设特征提取网络的输出为2×2×4,全连接层有3个神经元,先将特征提取网络的输出展平成一维列向量x=[x1,x2,…,x15,x16]T,对于全连接层中的每个神经元Z=[Z1,Z2,Z3]T,都会与x中的每个元素进行线性操作,在前向传播过程中,全连接层看作一个线性加权求和的过程,每个前一层节点都会乘以一个权重系数w并加上一个偏置b,从而得到全连接层上对应的输出z,全连接层的计算过程可以使用如下公式进行表达:

6.根据权利要求5所述的眼睛疲劳检测算法,其特征在于:其中对全连接层的计算输出值处理方法采用Softmax函数,Softmax函数用以对输出结果进行归一化处理,对概率的形式展示多分类的结果,将全连接层上的神经元Z=[Z1,Z2,Z3]T经Softmax函数归一化后变为y=[y1,y2,y3]T,约束条件为y1+y2+y3=1,yi与Zj之间的转化关系为:

7.根据权利要求6所述的眼睛疲劳检测算法,其特征在于,交叉熵函数公式为:

8.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:疲劳判定通过计算眼睛频率与损伤比判断眼睛疲劳状态判断出疲劳情况。

9.根据权利要求8所述的眼睛疲劳检测算法,其特征在于:疲劳判定步骤通过在眼睛图像中定位眼睛的轮廓,然后计算左右眼各自的EAR值,得到左右眼平均EAR值,当眼睛睁开时,EAR保持一个恒定值;而当眼睛无损伤时,EAR值趋于0,计算出的EAR值小于设定的阈值,则判定为眼睛损伤,根据EAR值与阈值的差来评价眼睛的损伤程度,EAR计算公式为:

10.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:Inception模块用以将多个不同尺寸的卷积核和池化层组合起来,进行特征提取,其中3×3的卷积核公式为:

...

【技术特征摘要】

1.一种眼睛疲劳检测算法,其特征在于:检测算法包括一个gazenet网络结构,gazenet网络结构内包括特征提取网络、分类网络与疲劳判定,特征提取网络包括inception模块、resblock模块以及cbam注意力模块,inception模块采用并行结构,inception模块将一个5×5的卷积核分解成两个3×3的卷积核,减少模型参数的数量和计算量,分类网络包括全连接层。

2.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:resblock模块通过将卷积层的输出和输入直接相加来实现跳跃连接,其中resblock模块在残差块中,输入x通过一系列卷积层与非线性激活函数后,得到输出f(x),将输入x与输出f(x)相加,得到残差块的输出h(x),这个过程用以下公式表示:

3.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:cbam注意力模块用以通过注意力机制去提高卷积神经网络的性能,cbam注意力模块分为通道注意力与空间注意力,其中通道注意力用以捕捉不同通道之间的相关性,一个h×w×c的输入的特征为f,公式如下所示:

4.根据权利要求3所述的眼睛疲劳检测算法,其特征在于:空间注意力用以捕捉特征图上不同位置的相关性,一个h×w×c的输入的特征为f,公式如下所示:

5.根据权利要求1所述的眼睛疲劳检测算法,其特征在于:全连接层用以将卷积操作后的局部特征通过权值矩阵整合在一起来执行,判断中要得到眼睛是向前、向左或向右的判定结果,设特征提取网络的输出为2×2×4,全连接层有3个神经元,先将特征提取网络的输出展平成一维列向量x=[x1,x2,…,...

【专利技术属性】
技术研发人员:张峰峰郭振武林繁昌李阳
申请(专利权)人:中国计量大学现代科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1