面部图像采集方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：29134286 阅读：67 留言：0更新日期：2021-07-02 22:29

本发明专利技术公开了面部图像采集方法、装置、计算机设备及存储介质，包括：获取待处理的视频；对待处理视频的语音进行端点检测；从待处理视频中，根据端点检测结果，提取有声段语音对应的图像；对提取的图像进行面部表情检测，将图像和面部表情检测结果进行存储。依据情感表达时语音与面部表情之前的相关性，通过情感语音的端点检测算法，判断情感语音的活跃阶段，通过时间轴的映射，只采集具有活跃的情感语音同时间段的面部表情图像，以达到增强面部表情数据集的情感可去分性、减少冗余性的目的。情感语音端点检测算法采用的是一种新型的基于样本重建残差条件熵差值的端点检测算法。

全部详细技术资料下载

【技术实现步骤摘要】
面部图像采集方法、装置、计算机设备及存储介质
本申请涉及面部图像采集
，特别是涉及面部图像采集方法、装置、计算机设备及存储介质。
技术介绍
本部分的陈述仅仅是提到了与本申请相关的
技术介绍
，并不必然构成现有技术。情感识别是情感计算领域内的研究热点，面部表情图像在情感识别研究中重要的数据源。在情感的表达方式中，情感语音与面部表情两种不同的模态信号之间很强的联系。虽然有时我们可以在沉默中捕捉情绪化的面部表情，或是在平静的面部表情下发出情绪化的声音，但在大多数情况下，人类的面部表情会随着说话者的情感语音而发生明显的变化。目前用于情感识别领域中的面部表情图像现有的采集方式是把情感视频样本中所有的图像都保存下来，这种无区分的面部表情图像采集方式忽视不同模态情感表达方式之间的联系，造成所采集的表情图像的情感可识别性低，导致后续情感识别研究中所训练与学习的模型性能不佳。另外，与频率相比，面部表情的变化相对较慢。研究表明，通常当情感没有发生改变时，一个面部表情会持续0.5～4秒的时间。尽管在某些情况下存在微表情快速变化的情况，但慢变的宏表情更为普遍。情感视频样本往往包含了一个完整的表情，因而样本的开头和结束均包含了无表情的阶段，在面部表情的慢变特性下，现有的无区分的面部表情采集方式会使具有情感的样本集合中包含大量的无表情的图像，造成数据集的冗余。
技术实现思路
为了解决现有技术的不足，本申请提供了面部表情图像采集面部图像采集方法、装置、计算机设备及存储介质；第一方面，本...

【技术保护点】
1.面部表情图像采集方法，其特征是，包括：/n获取待处理的视频；/n对待处理视频的语音进行端点检测；/n从待处理视频中，根据端点检测结果，提取有声段语音对应的图像；/n对提取的图像进行面部表情检测，将图像和面部表情检测结果进行存储。/n

【技术特征摘要】
1.面部表情图像采集方法，其特征是，包括：
获取待处理的视频；
对待处理视频的语音进行端点检测；
从待处理视频中，根据端点检测结果，提取有声段语音对应的图像；
对提取的图像进行面部表情检测，将图像和面部表情检测结果进行存储。

2.如权利要求1所述的面部表情图像采集方法，其特征是，对待处理视频的语音进行端点检测；具体步骤包括：
对待处理视频的语音进行稀疏转换处理；
对稀疏转换处理后的语音信号，随机生成高斯随机矩阵；将高斯随机矩阵作为语音信号的观测矩阵；
基于观测矩阵，采用正交匹配追踪算法OMP进行样本重建，得到端点检测结果。

3.如权利要求2所述的面部表情图像采集方法，其特征是，基于观测矩阵，采用正交匹配追踪算法OMP进行样本重建，得到端点检测结果；具体包括：
(1)：根据观测矩阵，得到每一帧的语音观测值；
(2)：首次运行时，残差设定为语音观测值，计算残差与传感矩阵的相关系数；
非首次运行时，计算上一次迭代估计值与语音观测值的残差，和残差与传感矩阵的相关系数；
(3)：在传感矩阵中，寻找相关系数最大原子，利用相关系数最大原子更新信号重建的支撑集；
(4)：基于支撑集，使用最小二乘法对观测值进行逼近，得到的信号的估计值；
(5)：更新残差，计算残差条件熵；
(6)：判断是否达到稀疏度条件，如果是，就返回(2)；如果否，就计算第一次迭代与最后一次迭代的残差条件熵差值；
(7)：判断第一次迭代与最后一次迭代的残差条件熵差值是否高于设定阈值，如果高于设定阈值，则认为当前帧语音为有声段；如果低于设定阈值，则认为当前帧语音为无声段，获得当前帧语音的端点检测结果；
(8)：基于各帧端点检测结果，获得待处理视频的语音的有声音片段。

4.如权利要求3所述的面部表情图像采集方法，其特征是，非首次运行时，计算上一次迭代估计值与语音观测值的残差，和残差与传感矩阵的相关系数；具体包括：
第t次迭代所获得的重建残差rt的计算公式为：

其中，At是OMP算法第t次迭代过程中由传感矩阵的原子构成的支撑集，为第t次迭代过程中最小二乘法计算的估计值，y是观测值。

5.如权利要求3所述的面部表情图像采集方法，其特征是，更新残差，计算残...

【专利技术属性】
技术研发人员：姜晓庆，陈贞翔，杨倩，郑永强，
申请(专利权)人：济南大学，山东思正信息科技有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人