System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法技术_技高网

一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法技术

技术编号:43091876 阅读:5 留言:0更新日期:2024-10-26 09:39
一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法,通过数据预处理、在ResNet18网络前添加尺度处理网络,尺度处理网络中引入SE注意力机制,从而构建了人脸面部表情识别网络,经过训练、验证操作后,显著提高了识别准确率。在FER2013和CK+两个公开数据集上的实验结果显示,本发明专利技术的网络识别率分别高达73.697%和100%,表现出优异的准确率和鲁棒性。此外,与原始ResNet18相比,本发明专利技术的方法在参数数量上仅增加了很少,实现了在控制模型复杂度的同时提高精度,在情感计算、用户体验、人机交互等多个领域具有广泛的应用前景。

【技术实现步骤摘要】

本专利技术属于图像处理,具体涉及到一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法


技术介绍

1、人类的面部表情是情绪和内心状态的重要表达方式。因此,人脸面部表情识别技术在情感计算、用户体验、人机交互等领域具有广泛的应用前景。随着计算机视觉和机器学习技术的快速发展,人脸面部表情识别取得了显著的进展。同时人脸面部表情识别技术的发展对社会和科技领域具有重要意义。它为提升人机交互的智能化水平、改善情感智能识别能力、加强智能监控与安全防护提供了技术支持,对推动人工智能技术在多个领域的应用和发展具有重要促进作用。

2、目前主流的人脸面部表情识别方法发展迅速,在公开数据集上的识别精度越来越高,同时付出的代价就是网络结构复杂度越来越高,而同一个模型在单个数据集上的准确率有一定提高,但很少有模型在多个公开数据集上的准确率得到提高。

3、所以在人脸表情识别中,当前需要解决一个技术问题是提出一种兼顾精度和复杂度的人脸面部表情识别方法。


技术实现思路

1、本专利技术所要解决的技术问题在于克服现有技术的缺点,提供一种识别精准、计算效率高的嵌入注意力机制的尺度处理残差网络人脸表情识别方法。

2、解决上述技术问题所采用的技术方案是:一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法,包括以下步骤:

3、步骤1.数据预处理

4、获取人脸图像数据库并进行增强预处理,处理后分为训练集、验证集、测试集;

5、步骤2.构建人脸面部表情识别网

6、所述人脸面部表情识别网络为resnet18网络前添加尺度处理网络,所述尺度处理网络由卷积层、修正线性单元、池化层、se注意力模块依次相连构成,所述卷积层用于提取图像中的空间特征和结构信息,所述修正线性单元,用于对空间特征和结构信息引入非线性变换;所述池化层,用于进行空间降采样;所述se注意力模块,用于对池化层输出的特征图进行通道特征加强,且不改变特征图的大小;

7、步骤3.训练人脸面部表情识别网络

8、使用训练集对人脸面部表情识别网络进行训练,通过交叉损失函数不断地迭代优化,直到迭代次数达到迭代次数上限,即完成人脸面部表情识别网络的训练和参数的优化;

9、步骤4.验证人脸面部表情识别网络

10、将验证集输入到人脸面部表情识别网络评估网络性能,根据性能评估的结果调整网络的超参数,直到性能达到最佳,得到评估后的人脸面部表情识别网络;

11、步骤5.测试人脸面部表情识别网络

12、将测试集输入到人脸面部表情识别网络,人脸面部表情识别网络对输入的人脸图像进行识别分类,输出该人脸图像的表情类别。

13、作为一种优选的技术方案,所述se注意力模块包括平均池化层、第一全连接层、第二全连接层、sigmoid函数单元;

14、所述平均池化层,用于将输入的特征图u按照下式进行池化操作,将每个通道的特征图压缩成一个点,即将每个通道的维度由h×w×c变为1×1×c;

15、

16、式中,zc是特征图压缩后的向量,h是特征图的高度,w是特征图的宽度,uc()是卷积后的第c个特征图;

17、所述第一全连接层是降维层,用于将平均池化层输出的向量维度c降低到c/r;

18、所述第二全连接层是升维层,用于将第一全连接层输出的向量中维度<c的向量恢复到c维度向量并输出;

19、所述sigmoid函数单元,用于对第二全连接层输出的向量进行归一化处理,使得每个元素的值域在0到1之间,并作为权重因子与原始特征图进行逐通道相乘,对每个通道的特征响应进行加权,增强重要的特征并抑制不重要的特征。

20、作为一种优选的技术方案,所述步骤1中获取人脸图像数据库并进行增强预处理的方法为:将人脸图像数据库中每张图像的像素裁剪为固定大小a×a,并进行水平翻转,从而将人脸图像数据库充为原来的两倍。

21、作为一种优选的技术方案,所述图像像素大小a×a为44×44。

22、本专利技术的有益效果如下:

23、本专利技术构建的人脸面部表情识别网络中通过嵌入se注意力机制增强了判别性特征的表示,有助于模型更准确地识别人脸表情,与现有技术resnet18相比,本专利技术在参数数量上仅增加了很少,但识别效果有显著提升,实现了在控制模型复杂度的同时提高精度。

24、本专利技术的尺度处理网络通过最大池化层和平均池化层进行空间降采样,大幅缩减计算量,提高计算效率。

25、本专利技术在fer2013和ck+两个公开数据集上的识别率分别高达73.697%和100%,与当前主流方法相比表现出了优异的准确率。

26、本专利技术的人脸面部表情识别网络具有稳定性好、泛化能力强、精度高、计算效率高的优点,有助于推动人工智能技术在情感计算、用户体验、人机交互等多个领域的应用和发展。

本文档来自技高网...

【技术保护点】

1.一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述嵌入注意力机制的尺度处理残差网络人脸表情识别方法,其特征在于,所述SE注意力模块包括平均池化层、第一全连接层、第二全连接层、Sigmoid函数单元;

3.根据权利要求1所述嵌入注意力机制的尺度处理残差网络人脸表情识别方法,其特征在于,所述步骤1中获取人脸图像数据库并进行增强预处理的方法为:将人脸图像数据库中每张图像的像素裁剪为固定大小A×A,并进行水平翻转,从而将人脸图像数据库充为原来的两倍。

4.根据权利要求3所述嵌入注意力机制的尺度处理残差网络人脸表情识别方法,其特征在于,所述图像像素大小A×A为44×44。

【技术特征摘要】

1.一种嵌入注意力机制的尺度处理残差网络人脸表情识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述嵌入注意力机制的尺度处理残差网络人脸表情识别方法,其特征在于,所述se注意力模块包括平均池化层、第一全连接层、第二全连接层、sigmoid函数单元;

3.根据权利要求1所述嵌入注意力机制的尺度处理残差...

【专利技术属性】
技术研发人员:马苗杨云启郭龙江李雨桐
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1