当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于深度学习的卡车环境下目标物测距方法技术

技术编号:20652790 阅读:29 留言:0更新日期:2019-03-23 05:44
本发明专利技术涉及一种基于深度学习的卡车环境下目标物测距方法,包括如下步骤:S1、获取目标物图像数据;S2、对获取到的目标物图像数据进行预处理;S3、将经过预处理的目标物图像数据输入SSD模型中,经过所述SSD模型的处理获得目标物在图像中的像素位置坐标;S4、根据已识别目标物在图像中的像素位置坐标,通过图像测距的方法对目标物距离图像采集装置的距离进行计算,获得目标物距离图像采集装置的距离;其中,所述SSD模型为经过压缩改进后的模型,所述目标物图像数据为在俯视条件下获取的目标物图像数据。本发明专利技术提供的测距方法对矿区卡车需要识别的目标物具有识别速度快、识别效率高,使用单目测距方法测距速度快等优点。

【技术实现步骤摘要】
一种基于深度学习的卡车环境下目标物测距方法
本专利技术属于计算机视觉与卡车防碰撞
,尤其涉及一种基于深度学习的卡车环境下目标物测距方法。
技术介绍
随着科技的进步与发展,大量的人力劳动都逐渐由计算机来完成。机器视觉可以比人类更好更快的完成各种任务,这一方面是由于人类的本性,长时间工作容易产生疲劳,无法保证很高的检测正确率。另一方面,由于人眼的生理极限,很难在速度、精度等方面得到提高。因此,现代工业与生产迫切需要一种新的机器技术出现,来替代人类视觉。与此同时,随着计算机技术、机电控制技术、智能检测技术与数字图像处理技术不断发展和完善,人们开始将人类视觉的智能化抽象能力与处理器的高速度、高精度、高可靠性相结合,逐渐形成了一门新的学科一一机器视觉。目前,机器视觉被应用于视觉检测、物体识别、自动质量检验、工艺控制、参数测量和自动组装等等许多领域。机器视觉涉及了图像处理、机器学习、模式识别等多个学科。机器视觉通过使用摄像头等图像采集设备,将采集到的图像输入特定的算法进行计算,让机器模拟人眼和大脑对物体进行识别,也可以通过机器视觉来测量物体的某些参数。在露天矿生产系统中,一定数量的卡车在若干电铲、卸载点以及连接它们的双向道路构成的网络中运行,实现电铲和卸载点之间的矿石、岩石的运输。这是一个动态的循环系统。露天矿发展趋向设备大型化,而大型采集装置与大型卡车运输的间断工艺更为普遍,运输卡车由于高、宽、大的特点,造成其盲区大,其制动距离长,因此卡车发生事故的概率较大。卡车事故给人们造成了生命财产的重大损失以及精神上的严重伤害。为克服卡车的大体积和高驾驶位所带来的视觉盲区,使用机器视觉实时构建出卡车前后的视野环境。但是这种方法不能提醒司机行人、辅助车辆等其他目标的存在。因此,为减少卡车事故发生,保障安全,对大型运矿卡车附近的目标检测和距离测量变得至关重要。上述缺陷是本领域技术人员期望克服的。
技术实现思路
(一)要解决的技术问题为了解决现有技术的上述问题,本专利技术提供一种基于深度学习的卡车环境下目标物测距方法,能够计算目标物距离卡车的距离,来实现卡车的防碰撞等功能。(二)技术方案为了达到上述目的,本专利技术采用的主要技术方案包括以下步骤:一种基于深度学习的卡车环境下目标物测距方法,包括如下步骤:S1、获取目标物图像数据;S2、对获取到的目标物图像数据进行预处理;S3、将经过预处理的目标物图像数据输入SSD模型中,经过所述SSD模型的处理获得目标物在图像中的像素位置坐标;S4、根据已识别目标物在图像中的像素位置坐标,通过图像测距的方法对目标物距离图像采集装置的距离进行计算,获得目标物距离图像采集装置的距离;其中,所述SSD模型为经过压缩改进后的模型,所述目标物图像数据为在俯视条件下获取的目标物图像数据。优选地,所述SSD模型包括十一个Block:其中,第一个Block为两个3×3的卷积层和一个步长为2的2×2的最大池化层;第二个Block为两个3×3的卷积层和一个步长为2的2×2的最大池化层;第三个Block为三个3×3的卷积层和一个步长为2的2×2的最大池化层;第四个Block为三个3×3的卷积层和一个步长为2的2×2的最大池化层;第五个Block为三个3×3的卷积层和一个步长为1的3×3的最大池化层;第六个Block为一个3×3的卷积层;第七个Block为一个1×1卷积层;第八个Block至第十一个Block均为一个1×1的卷积层和一个3×3的卷积层,Block之间通过所述卷积层和所述池化层进行信息传递。优选地,所述SSD模型压缩的方法为将每一卷积层的输出数设置为初始SSD模型每一卷积层输出数的四分之一。优选地,所述步骤S3之前,还包括采用俯视条件下获取的目标物图像对压缩改进后的SSD模型进行训练。优选地,对压缩改进后的SSD模型进行训练包括如下步骤:A1、将预处理后的目标物图像输入所述压缩后的SSD模型得到第一特征图;A2、通过所述第一特征图计算所述第一特征图的第一默认框;所述第一默认框的尺度计算公式为:其中,m为特征图数目;smin为最底层特征图第一默认框的尺度;smax为最顶层特征图第一默认框的尺度,所述smin设置为0.2,smax设置为0.9;最后根据和计算每个所述第一默认框的宽度和高度,其中,a为所述第一默认框比例值;A3、根据判定条件判定是否对预先给定的参考框编码;所述判定条件为:比较第一阈值的值和jaccard相似度的大小,所述jaccard相似度由所述第一默认框编码和所述参考框计算而来,jaccard相似度就是两个集合A、B的重叠程度,也就是计算A与B交并集之比,其中A为第一默认框,B为参考框;若所述jaccard相似度大于所述第一阈值,则对所述参考框编码,编码后的所述参考框包括:位置偏移(g=(cx,cy,w,h))、目标分数(p∈[0,1])和标签(x∈{0,1}),编码偏移的计算公式为:其中,(cx,cy)表示编码后参考框的中心,而(w,h)代表参考框的宽和高,下标索引g和d分别表示参考框和第一默认框;A4、对所述第一特征图进行第一无激活函数的卷积运算,得到第一默认框的四个位置偏移量,所述第一默认框的四个位置偏移量用于目标物的定位预测;对所述第一特征图进行第二无激活函数的卷积运算,得到三个类别置信度,所述类别置信度用于目标物的类别预测;采用softmax函数对所述所有类别置信度进行处理,得到所述目标物的预测类别的概率。优选地,所述压缩后SSD模型的损失函数为:其中,α、β为权值,N为匹配的anchorbox个数,如果N=0,则该项公式为0;位置偏移损失函数定义为:其中,1为图像中目标标注的位置,g编码后目标box的偏移;目标得分损失函数为多类别softmax损失:其中,目标先验损失函数通过二元交叉熵计算:优选地,所述步骤S3还包括如下子步骤:S301、验证时将所述预处理后的目标物图像数据输入所述SSD模型中,在所述SSD模型中得到第二特征图;S302、计算所述第二特征图的第二默认框;S303、对编码后的参考框解码;将所述第二默认框和所述参考框融合,得到第三默认框;所述融合的计算公式为:xc=loc[0]×wref×sacling[0]+xrefyc=loc[1]×href×sacling[1]+yrefw=wref×e(loc[2]×saoling[2])h=href×e(loc[3]×sacling[3])其中,xc、yc为所述第三默认框的中心点坐标,w、h为所述第三默认框的宽和高,loc为卷积得到的所述第二默认框的四个位置偏移量,xref、yref、wref、href为根据比例值计算得到的所述预处理后的图像信息的预测框的四个位置偏移量,scaling为默认参数;S304、对所述第三默认框进行筛选,将筛选出的所述第三默认框的位置偏移量坐标标注在所述预处理后的目标物图像上,然后将标注有坐标信息的的目标物图像输出;S305、根据训练好的压缩后的SSD模型得到的识别后的目标物的坐标信息,计算获得目标物距离图像采集装置最近一点的像素位置。优选地,所述图像预处理至少包括图像归一化处理。优选地,所述步骤S4还包括:根据单目测距的方法和目标物距离图像采集装置最近一点的像素位置对目标物与采集装置之间进行本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的卡车环境下目标物测距方法,其特征在于,包括如下步骤:S1、获取目标物图像数据;S2、对获取到的目标物图像数据进行预处理;S3、将经过预处理的目标物图像数据输入SSD模型中,经过所述SSD模型的处理获得目标物在图像中的像素位置坐标;S4、根据已识别目标物在图像中的像素位置坐标,通过图像测距的方法对目标物距离图像采集装置的距离进行计算,获得目标物距离图像采集装置的距离;其中,所述SSD模型为经过压缩改进后的模型,所述目标物图像数据为在俯视条件下获取的目标物图像数据。

【技术特征摘要】
1.一种基于深度学习的卡车环境下目标物测距方法,其特征在于,包括如下步骤:S1、获取目标物图像数据;S2、对获取到的目标物图像数据进行预处理;S3、将经过预处理的目标物图像数据输入SSD模型中,经过所述SSD模型的处理获得目标物在图像中的像素位置坐标;S4、根据已识别目标物在图像中的像素位置坐标,通过图像测距的方法对目标物距离图像采集装置的距离进行计算,获得目标物距离图像采集装置的距离;其中,所述SSD模型为经过压缩改进后的模型,所述目标物图像数据为在俯视条件下获取的目标物图像数据。2.根据权利要求1所述的方法,其特征在于,所述SSD模型包括十一个Block:其中,第一个Block为两个3×3的卷积层和一个步长为2的2×2的最大池化层;第二个Block为两个3×3的卷积层和一个步长为2的2×2的最大池化层;第三个Block为三个3×3的卷积层和一个步长为2的2×2的最大池化层;第四个Block为三个3×3的卷积层和一个步长为2的2×2的最大池化层;第五个Block为三个3×3的卷积层和一个步长为1的3×3的最大池化层;第六个Block为一个3×3的卷积层;第七个Block为一个1×1卷积层;第八个Block至第十一个Block均为一个1×1的卷积层和一个3×3的卷积层,Block之间通过所述卷积层和所述池化层进行信息传递。3.根据权利要求2所述的方法,其特征在于,所述SSD模型压缩的方法为将每一卷积层的输出数设置为初始SSD模型每一卷积层输出数的四分之一。4.根据权利要求1所述的方法,其特征在于,所述步骤S3之前,还包括采用俯视条件下获取的目标物图像对压缩改进后的SSD模型进行训练。5.根据权利要求4所述的方法,其特征在于,对压缩改进后的SSD模型进行训练包括如下步骤:A1、将预处理后的目标物图像输入所述压缩后的SSD模型得到第一特征图;A2、通过所述第一特征图计算所述第一特征图的第一默认框;所述第一默认框的尺度计算公式为:其中,m为特征图数目;smin为最底层特征图第一默认框的尺度;smax为最顶层特征图第一默认框的尺度,所述sman设置为0.2,smax设置为0.9;最后根据和计算每个所述第一默认框的宽度和高度,其中,a为所述第一默认框比例值;A3、根据判定条件判定是否对预先给定的参考框编码;所述判定条件为:比较第一阈值的值和jaccard相似度的大小,所述jaccard相似度由所述第一默认框编码和所述参考框计算而来,jaccard相似度就是两个集合A、B的重叠程度,也就是计算A与B交并集之比,其中A为第一默认框,B为参考框;若所述jaccard相似度大于所述第一阈值,则对所述参考框编码,编码后的所述参考框包括:位置偏移(g=(cx,cy,w,h))、目标分数(p∈[0,1])和标签(x∈{0,1}),编码偏移的计算公式为:其中,(cx,cy)表示编码后参考框的中心,而(w,h)代表参考框的宽和高,下标索引g和d分别表示参考框和第一默认框;A4、对所述第一特征图进行第一无激活函数的卷积运算,得到第一默认框的四个位置偏移量,所述...

【专利技术属性】
技术研发人员:肖冬单丰王宝华刘燨文李雪娆孙效玉
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1