System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像处理领域,具体涉及一种基于扩散式生成网络的微笑图像识别方法、装置及可读介质。
技术介绍
1、目前,照相机能捕捉到的照片往往很难体现笑容最大时的瞬间照片。想要捕捉到最大的笑容,往往需要专门到摄影棚中完成摄制,而且需要被摄影人和摄影师的高度配合。
2、视频的摄制,可以追踪较长时间人的面部表情,增大了获取到自然状态下的笑容的可能。它非常方便,如果能从视频中生成笑容最大的那一帧图像,摄制者基本上摆脱了对专业摄影师的依赖。然而,由于当下摄影机的帧率高,想要手工挑选笑容帧十分困难。
3、目前用于评价面部表情的方法有pca、主成分分析、深度学习等。pca是较早采用的技术,其采用pca主成分分析提取图片特征,诸如眼角等结构位置特征,通过svm训练计算得到不同位置的权重以及图片表情为快乐微笑的概率,同时脑电波辅助判断为快乐的概率。通过降维手段,将高维空间的问题转化为低维空间处理,相对降低了运算成本,但对于复杂拟合存在一定问题。主成分分析主要通过提取嘴部向量以及面部向量,通过多元函数计算笑容程度,进而获取图片的微笑分数。随着深度学习的发展,目前较有代表性的有使用残差网络resnet等深度学习方法对笑容进行评价,达到了一定的准确度。目前对于微笑图像判定方法存在以下几个问题:
4、1.主成分分析的准确度可能不佳。主成分分析需要通过降维提取图片关键信息,在这一过程中,会损失图片包含的信息,导致识别精度下降。
5、2.svm的拟合非线性度较低,如果出现图像的大幅度扭转等,会导致识别失败。
...【技术保护点】
1.一种基于扩散式生成网络的微笑图像识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S1中对所述视频帧向量内的每个视频帧图像裁剪出人脸图像,得到人脸图像向量,具体包括:
3.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S2具体包括:
4.根据权利要求3所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S21具体包括:
5.根据权利要求4所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S22具体包括:
6.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述UNet噪声拟合与去除模块包括UNet网络和输出列表,所述UNet网络包括依次连接的输入层、收缩路径、连接层、扩大路径和输出层,所述输入层用于接收所述条件向量、步数或添加噪声后的情绪标签向量,所述收缩路径包括依次三个串联的收缩层,所述扩大路径包括依次四个串联的扩大层,所述输出列表用于对UNet网络计算过程中生成的特
7.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S3中所述UNet噪声拟合与去除模块的训练过程具体包括:
8.根据权利要求7所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S3中将所述条件向量输入所述经训练的UNet噪声拟合与去除模块,预测得到情绪标签向量,具体包括:
9.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤S3中将所述情绪标签向量输入类别生成模块,提取到所述正面人脸图像向量对应的微笑分数向量,具体包括:
10.一种基于扩散式生成网络的微笑图像识别装置,其特征在于,包括:
11.一种电子设备,包括:
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法。
...【技术特征摘要】
1.一种基于扩散式生成网络的微笑图像识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤s1中对所述视频帧向量内的每个视频帧图像裁剪出人脸图像,得到人脸图像向量,具体包括:
3.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤s2具体包括:
4.根据权利要求3所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤s21具体包括:
5.根据权利要求4所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述步骤s22具体包括:
6.根据权利要求1所述的基于扩散式生成网络的微笑图像识别方法,其特征在于,所述unet噪声拟合与去除模块包括unet网络和输出列表,所述unet网络包括依次连接的输入层、收缩路径、连接层、扩大路径和输出层,所述输入层用于接收所述条件向量、步数或添加噪声后的情绪标签向量,所述收缩路径包括依次三个串联的收缩...
【专利技术属性】
技术研发人员:陈可,谢贤聚,白玉兴,
申请(专利权)人:首都医科大学附属北京口腔医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。