本发明专利技术公开了一种图像识别方法、装置、计算机设备及存储介质,属于人脸识别领域。本发明专利技术通过对获取的待检测图像进行人脸检测,得到人脸图像及人脸图像的定位数据,根据定位数据对人脸图像进行校正以获取用于图像识别的待预测图像,减低了计算量,采用人眼视线预测神经网络模型对待预测图像进行识别,从而确定人眼视线方向,识别速度快,耗时短,采用的人眼视线预测神经网络模型占用内存空间低,运算速度快。
Image recognition method, device, computer equipment and storage medium
【技术实现步骤摘要】
图像识别方法、装置、计算机设备及存储介质
本专利技术涉及人脸识别领域,尤其涉及一种图像识别方法、装置、计算机设备及存储介质。
技术介绍
情感分析伴随着网络社会媒体(如评论、论坛、博客和微博)的兴起而快速发展,通过对人的情感分析可以分析出其表达的观点、情感、评价、态度、情绪及倾向等。由于人在发生心理变化时,会引起一些生理参数(如:皮肤电、心跳、血压、呼吸脑电波、声音及视线等)的变化,因此,可通过检测这些变化来评估被分析者的情感变化。考虑到情感分析通常在非接触、便于采集及处理的场景下进行,因此随着人脸识别技术的不断发展采用图像识别技术对被评估者的情绪变化进行分析的技术越来越被大众所青睐。现有的图像识别系统主要分为两类,一类是利用红外摄像头采集图像进行图像识别,例如:外星人电脑(alienware)的眼动追踪系统(TobiEyeTracking);另一类是利用单目摄像头采集图像进行图像识别。关于采用红外摄像头采集图像进行图像识别的类技术其存在的缺陷主要有:设备配备成本昂贵,同时需要对每个使用人进行事先定标,这样没法用在银行网点等对非特定用户进行眼神分析的场景。对于利用单目摄像头采集图像进行图像识别方法为:检测人脸,估计人体头部转动角度,对人脸进行68个关键点识别从而得到眼睛部位图片,进行眼神方向识别。但是上述方法存在的缺陷是:图像识别模型构建过程复杂,在使用模型时,计算资源及耗时过高。对一张图片的眼神识别需要利用4个模型,模型所占存储空间大,手机端部署难度大;采用人脸关键点识别模型进行的很多计算都是与眼神判断无关的,且现有的方法计算过程耗时长,无法做到实时分析。综上所述,现有的图像识别方法成本高、效率低、占用存储空间大,应用场景受限。
技术实现思路
针对现有图像识别方法效率低、占用存储空间大的问题,现提供一种旨在可提高识别效率,占用存储空间小的图像识别方法、装置、计算机设备及存储介质。本专利技术提供了一种图像识别方法,包括:获取待检测图像;对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据;基于所述定位数据对所述人脸图像进行校正,获取待预测图像;采用人眼视线预测神经网络模型对所述待预测图像进行识别,确定人眼视线方向。优选的,所述对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据包括:采用多任务卷积神经网络对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据。优选的,所述定位数据包括:两个眼部椭圆形中心点坐标、鼻头坐标和嘴角两端的坐标。优选的,所述基于所述定位数据对所述人脸图像进行校正,获取待预测图像包括:将所述定位数据与所述标准坐标数据进行比对,根据比对结果对所述人脸图像进行相似变换,生成待预测图像。优选的,所述人眼视线预测神经网络模型包括:可分离卷积模块、注意力机制模块和分类模块;所述采用人眼视线预测神经网络模型对所述待预测图像进行识别,确定人眼视线方向包括:通过所述可分离卷积模块对所述待预测图像进行第一面部特征提取;通过所述注意力机制模块对所述第一面部特征的权重进行调整,获取增强眼部特征权重的特征权重;将所述第一面部特征和所述特征权重结合生成第二面部特征,通过所述分类模块对所述第二面部特征进行处理,获取人眼视线方向。优选的,所述可分离卷积模块与正向残差模块结合对待预测图像进行所述第一面部特征提取;采用所述正向残差模块将所述可分离卷积模块获得的特征和初始特征在相同位置进行相加,以获取所述第一面部特征提取。优选的,所述可分离卷积模块与反向残差模块结合对待预测图像进行所述第一面部特征提取;将所述反向残差模块与所述可分离卷积模块结合,在每两个逐点卷积通道之间加入1×1的跨通道卷积进行通道间信息融合,以获取第一面部特征提取。本专利技术还提供了一种图像识别装置,包括:接收单元,用于获取待检测图像;检测单元,用于对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据;校正单元,用于基于所述定位数据对所述人脸图像进行校正,获取待预测图像;识别单元,用于采用人眼视线预测神经网络模型对所述待预测图像进行识别,确定人眼视线方向。本专利技术还提供了一种计算机设备,所述计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。本专利技术提供的图像识别方法、装置、计算机设备及存储介质,通过对获取的待检测图像进行人脸检测,得到人脸图像及人脸图像的定位数据,根据定位数据对人脸图像进行校正以获取用于图像识别的待预测图像,减低了计算量,采用人眼视线预测神经网络模型对待预测图像进行识别,从而确定人眼视线方向,识别速度快,耗时短,采用的人眼视线预测神经网络模型占用内存空间低,运算速度快。附图说明图1为本专利技术所述的图像识别方法的一种是实施例的流程图;图2为本专利技术采用人眼视线预测神经网络模型对所述待预测图像进行识别的一种是实施例的流程图;图3为本专利技术所述的图像识别装置的一种实施例的模块图;图4为本专利技术计算机设备的一个实施例的硬件架构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。本专利技术提供的图像识别方法、装置、计算机设备及存储介质可应用于银行、保险等业务领域。本专利技术通过对获取的待检测图像进行人脸检测,得到人脸图像及人脸图像的定位数据,根据定位数据对人脸图像进行校正以获取用于图像识别的待预测图像,减低了计算量,采用人眼视线预测神经网络模型对待预测图像进行识别,从而确定人眼视线方向,识别速度快,耗时短,采用的人眼视线预测神经网络模型占用内存空间低,运算速度快。实施例一请参阅图1,本实施例的一种图像识别方法,包括下述步骤:S1.获取待检测图像;在本实施例中,多于采集图像的设备没有严格的要求,可采用单目摄像头采集待检测图像,对采集设备的要求低,可有效的降低设备成本。S2.对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据;其中,所述定位数据可包括:两个眼部椭圆形中心点坐标、鼻头坐标和嘴角两端的坐标。在本实施例中的定位数据包括5个关键点坐标,分别为两个眼部椭圆形中心点坐标、鼻头坐标和嘴角两端的坐标,相比于现有技术需通过获取68个关键点进行视线预测而言,大大降低了计算量,提本文档来自技高网...
【技术保护点】
1.一种图像识别方法,其特征在于,包括:/n获取待检测图像;/n对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据;/n基于所述定位数据对所述人脸图像进行校正,获取待预测图像;/n采用人眼视线预测神经网络模型对所述待预测图像进行识别,确定人眼视线方向。/n
【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:
获取待检测图像;
对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据;
基于所述定位数据对所述人脸图像进行校正,获取待预测图像;
采用人眼视线预测神经网络模型对所述待预测图像进行识别,确定人眼视线方向。
2.根据权利要求1所述的图像识别方法,其特征在于,所述对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据包括:
采用多任务卷积神经网络对所述待检测图像进行人脸检测,获取人脸图像及所述人脸图像的定位数据。
3.根据权利要求1或2所述的图像识别方法,其特征在于,所述定位数据包括:两个眼部椭圆形中心点坐标、鼻头坐标和嘴角两端的坐标。
4.根据权利要求1所述的图像识别方法,其特征在于,所述基于所述定位数据对所述人脸图像进行校正,获取待预测图像包括:
将所述定位数据与所述标准坐标数据进行比对,根据比对结果对所述人脸图像进行相似变换,生成待预测图像。
5.根据权利要求1所述的图像识别方法,其特征在于,所述人眼视线预测神经网络模型包括:可分离卷积模块、注意力机制模块和分类模块;
所述采用人眼视线预测神经网络模型对所述待预测图像进行识别,确定人眼视线方向包括:
通过所述可分离卷积模块对所述待预测图像进行第一面部特征提取;
通过所述注意力机制模块对所述第一面部特征的权重进行调整,获取增强眼部特征权重的特征权重;
将所述第一面部特征和所述...
【专利技术属性】
技术研发人员:胡艺飞,徐国强,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。