本发明专利技术的目的是提供一种基于深度学习的车窗定位方法,根据车辆图像对车窗四个角点的坐标进行标定,获得坐标标签;首先将车辆图像和车窗四个角点的坐标输入到深度卷积神经网络中进行训练学习,获得车窗角点粗定位深度学习模型;其次,根据标注的车窗角点,获得角点所在的区域图像块;根据角点的区域图像块以及相应角点的坐标,分别训练四个角点的精定位深度学习模型,最后,根据角点的粗定位深度学习模型以及精定位深度学习模型,实现对四个角点坐标的精确定位,本发明专利技术通过采用上述技术,解决现有技术对车窗定位精度难以满足需求的问题,同时准确度高,适用性强。
【技术实现步骤摘要】
一种基于深度学习的车窗定位方法
本专利技术属于视频图像识别
,尤其涉及一种基于深度学习的车窗定位方法。
技术介绍
随着智能交通领域的蓬勃发展,车辆特征物的检测以及驾驶员的行为分析也越来越受到重视。同时,实时快速检测分析出车辆的特征物信息(包括遮阳板是否放下,纸巾盒,挂件,标识符等信息),以及驾驶员行为信息(包括驾驶员是否系安全带,打电话,人脸相貌等信息)对交通安全监管和刑事案件侦查也具有至关重要的作用。但若要准确判断车辆特征物的具体属性以及驾驶员的行为信息等,需要精确定位到车辆的车窗,从而通过车窗对车辆特征物以及驾驶员的行为等车窗内部信息进行识别。在现有车窗定位方法中,一种是基于传统的图像处理方式,比如《基于色差均值的快速车窗定位算法[J].计算机应用与软件,2004,21(1):78-79》、《基于Hough变换的车窗提取算法[J].中国测试,2007,33(3):50-52》。但采用传统的图像处理方式易受环境和天气的影响,在强弱光、雾霾等情况下效果定位效果较差。另外一种是基于机器学习的方式,比如,《一种基于车窗角点检测的车窗定位方法-CN201711133210》、《一种多方向车辆的车窗定位方法-CN201711043813》,根据机器学习训练车窗角点的分类器,实现车窗定位;但机器学习方式无法对车窗四个角点坐标的实现精确定位,并且对于复杂环境适用性不强,仍需要传统图像处理的方式进行辅助运算。与本专利技术比较接近的是《一种建立车窗定位模型和车窗定位方法及装置-CN201710039443》,该方式通过在车辆全图上标注车窗的四个角点坐标,并通过机器学习训练模型,根据模型输出车窗四个角点的坐标。但该方式仅通过一步的机器学习训练,定位结果往往不精确,输出的角点坐标会偏离实际的角点位置。
技术实现思路
(一)解决的技术问题本专利技术的目的在于提供一种基于深度学习的车窗定位方法,以解决上述
技术介绍
中提出的实际问题。(二)技术方案为实现上述目的,本专利技术提供如下技术方案:一种基于深度学习的车窗定位方法,包括以下步骤:步骤1:基于深度学习训练车窗角点粗定位深度学习模型;步骤2:基于深度学习训练车窗四个角点的精定位深度学习模型;步骤3:基于深度学习对车辆车窗四个角点进行定位。进一步的,所述步骤1包含以下步骤:1.1:在多个车辆图像样本上对车窗的四个角点进行标注,获得每个图像样本对应的车窗四个角点的坐标;1.2:将所述的多个车辆图像样本与对应的车窗四个角点的坐标作为训练数据,输入到深度卷积神经网络模型中进行训练学习,获得车窗角点粗定位深度学习模型。进一步的,所述的步骤2包含以下步骤:2.1:根据步骤1.1标注的所有车辆图像样本车窗的四个角点,对于每一个角点坐标,分别向上、下、左、右四个方向扩展一定的长度,获得一个矩形框,根据该矩形框在车辆原图上截取包含该角点的局部区域图像块,获得车窗四个角点的局部区域图像块,以及该角点在该图像块中对应的坐标;2.2:分别将所述所有样本中的每个角点的局部区域图像块与该角点在该图像块中对应的坐标输入到深度卷积神经网络模型中,进行训练学习,获得四个角点的精定位深度学习模型。进一步的,所述的步骤3包含以下步骤:3.1:将一幅测试车辆图像输入到步骤1.2训练得到的车窗角点粗定位深度学习模型中,输出为四个角点的测试坐标;3.2:对于所述输出的四个角点测试坐标,对于每一个角点,根据坐标分别向上、下、左、右四个方向扩展一定的长度,获得一个矩形框,根据该矩形框在车辆原图上截取包含该角点的局部区域测试图像块,获得四个角点的图像测试区域块;3.3:将所述的四个角点的图像测试区域块分别输入到步骤2.2中相对应的角点精定位深度学习模型中,得到四个角点在图像测试区域块中的精定位坐标,并通过转换得到车窗四个角点在该幅车辆图像中的精定位坐标。(三)有益效果本专利技术的目的是提供一种基于深度学习的车窗定位方法,包括:根据车辆图像对车窗四个角点的坐标进行标定,获得坐标标签;首先将车辆图像和车窗四个角点的坐标输入到深度卷积神经网络中进行训练学习,获得车窗角点粗定位深度学习模型;其次,根据标注的车窗角点,获得角点所在的区域图像块;根据角点的区域图像块以及相应角点的坐标,分别训练四个角点的精定位深度学习模型,最后,根据角点的粗定位深度学习模型以及精定位深度学习模型,实现对四个角点坐标的精确定位,本专利技术通过采用上述技术,解决现有技术对车窗定位精度难以满足需求的问题,同时准确度高,适用性强。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为车窗定位总体流程;图2为车窗角点粗定位深度学习模型训练流程;图3为车窗角点精定位深度学习模型训练流程;图4为车窗角点的区域图像块示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。请参阅图1-4,本专利技术提供一种技术方案:一种基于深度学习的车窗定位方法,包括以下步骤:步骤1:基于深度学习训练车窗角点粗定位模型,包括以下步骤:步骤1.1:在多个车辆图像样本上对车窗的四个角点(左上P1,右上P2,右下P3,左下P4)进行标注,获得每个图像样本对应的车窗四个角点在图像中的坐标P1(x,y),P2(x,y),P3(x,y),P4(x,y)。步骤1.2:将所述的多个车辆图像样本与对应的车窗四个角点的坐标作为训练数据,输入到深度卷积神经网络模型中进行训练学习,获得车窗角点粗定位的深度学习模型CNNModel0。其中,车窗角点粗定位的深度学习模型CNNModel0输入为一副车辆的图像,输出为车窗的四个角点的坐标。步骤2:基于深度学习训练车窗四个角点的精定位模型,包括以下步骤:步骤2.1:根据步骤1.1标注的所有车辆图像样本车窗的四个角点,对于每一个角点坐标,分别向上、下、左、右四个方向延伸扩展长度Δt,获得一个矩形框。对于车窗的左上角点P1来说,通过该角点坐标得到的矩形框的坐标为,上边界:y–Δt,下边界:y+Δt,左边界:x–Δt,右边界:x+Δt。同样,对于角点P2,P3,P4亦是如此。扩展长度Δt=ratio*(图像宽度W或高度H)+random。其中,ratio代表比例因子,比如可选择0.16、0.18等等大小,random为随机参数值,这样使得矩形框的大小并不是固定的。步骤2.2:根据获得四个角点的矩形框在车辆原图上截取包含本文档来自技高网...
【技术保护点】
1.一种基于深度学习的车窗定位方法,其特征在于,包括以下步骤:/n步骤1:基于深度学习训练车窗角点粗定位深度学习模型;/n步骤2:基于深度学习训练车窗四个角点的精定位深度学习模型;/n步骤3:基于深度学习对车辆车窗四个角点进行定位。/n
【技术特征摘要】
1.一种基于深度学习的车窗定位方法,其特征在于,包括以下步骤:
步骤1:基于深度学习训练车窗角点粗定位深度学习模型;
步骤2:基于深度学习训练车窗四个角点的精定位深度学习模型;
步骤3:基于深度学习对车辆车窗四个角点进行定位。
2.根据权利要求1所述的一种基于深度学习的车窗定位方法,其特征在于,所述步骤1包含以下步骤:
1.1:在多个车辆图像样本上对车窗的四个角点进行标注,获得每个图像样本对应的车窗四个角点的坐标;
1.2:将所述的多个车辆图像样本与对应的车窗四个角点的坐标作为训练数据,输入到深度卷积神经网络模型中进行训练学习,获得所述车窗角点粗定位深度学习模型。
3.根据权利要求2所述的一种基于深度学习的车窗定位方法,其特征在于,所述的步骤2包含以下步骤:
2.1:根据所述步骤1.1标注的车窗四个角点,对于每一个角点坐标,分别向上、下、左、右四个方向扩展一定的长度,...
【专利技术属性】
技术研发人员:刘大伟,车少帅,胡笳,梁栋,强学良,王宁,
申请(专利权)人:江苏鸿信系统集成有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。