【技术实现步骤摘要】
一种基于CNN
‑
Transformer的面部表情识别方法及装置
[0001]本专利技术涉及一种基于CNN
‑
Transformer的面部表情识别方法及装置,属于数字图像信号处理
技术介绍
[0002]在日常交流中,我们可以以文字和非文字形式来表达情感,其中面部表情可以承载的信息尤其重要。另外面部表情识别可以应用于疲劳驾驶检测、情感合成、广告精准投放、医疗健康和人机交互等领域,具有广泛的应用前景。
[0003]面部表情识别可以分为传统方法和深度学习方法两种。传统方法主要是通过提取诸如局部二值模式(LBP)、Gabor特征、方向梯度直方图(HOG)、词袋特征(BOW)和尺度不变特征变换(SIFT)等手工浅层特征作为向量表示,然后通过支持向量机(SVM)、随机森林(RF)和k
‑
近邻算法(k
‑
NN)等对表示进行分类,来获得情感分类结果的方法。由于浅层特征需要精巧的设计,而且不能深层次的表达面部情感,因此最近通过使用深度学习方式来对原始图片进行深度特征提取的方式得到广泛研究。使用卷积神经网络(CNN)可以通过感受野的变化来对图像进行提取局部特征,捕捉微小的局部变化,具有强大的局部建模能力。使用Transformer的全局建模能力,可以对图片的整体进行一个宏观的把握,这样可以忽略局部的噪声,提高系统的鲁棒性。
[0004]面部表情识别中面临的挑战之一就是局部遮挡,其中包括戴眼镜、帽子和口罩,手放在面部等操作导致的局部信息缺失。 ...
【技术保护点】
【技术特征摘要】
1.一种基于CNN
‑
Transformer的面部表情识别方法,其特征在于,包括:对输入图片进行预处理,获得矫正后的人脸图片;计算人脸图像的LBP特征,并作为输入送入预先构建的CNN网络获得面部的局部特征;将人脸图像均匀划分之后送入Transformer获得面部的全局特征;对全局特征和局部特征进行信息融合,获得融合特征;通过融合特征来进行情感识别。2.根据权利要求1所述的基于CNN
‑
Transformer的面部表情识别方法,其特征在于:所述对输入图片进行预处理,获得矫正后的人脸图片,包括:通过Dlib工具箱提供的基于方向梯度直方图的人脸检测器进行图片中人脸的检测,去除非人脸部分,获得人脸图片;通过Imutils包中基于仿射变换的人脸校正器对人脸图片进行人脸校正,使两眼在同一水平线上,获得矫正后的人脸图片。3.根据权利要求1所述的基于CNN
‑
Transformer的面部表情识别方法,其特征在于:所述计算人脸图像的LBP特征,并作为输入送入预先构建的CNN网络获得面部的局部特征,包括:对矫正后的人脸图像计算以1为半径,圆形区域内含有8个采样点的圆形LBP算子,获得局部手工特征图;把所述局部手工特征图输入到典型的Resnet18中,进一步获得图像的局部特征。4.根据权利要求1所述的基于CNN
‑
Transformer的面部表情识别方法,其特征在于:所述将人脸图像均匀划分之后送入Transformer获得面部的全局特征,包括:将人脸图像进行均匀划分为N块,每一块转化为一维向量,可以获得输入矩阵M∈R
N
×
D
,其中D为一维向量的长度;把输入矩阵M输入到经典的Swin Transformer中,获得人脸图像的忽略细节的全局特征。5.根据权利要求1所述的基于CNN
‑
Transformer的面部表情识别方法,其特征在于:所述对全局特征和局部特征进行信息融合,获得融合特征,包括:利用公...
【专利技术属性】
技术研发人员:徐林森,梁兴灿,刘志鹏,张文祥,刘进福,张燕,
申请(专利权)人:河海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。