基于pix2pix的多图像定位方法技术

技术编号:31506171 阅读:15 留言:0更新日期:2021-12-22 23:37
本发明专利技术揭示了一种基于pix2pix的多图像定位方法,具体包括:S1、利用多台相机收集训练图像,对多副图像进行水平方向上的拼接,构建得到训练数据集;S2、对训练数据集进行分类学习,得到基于位置的卷积神经网络分类模型;S3、利用pix2pix训练每台相机的图像生成模型;S4、利用相机收集目标图像,若目标图像未出现缺失情况、则拼接得到完整图像,若目标图像出现缺失情况、则利用图像生成模型生成完整图像;S5、将完整图像作为卷积神经网络分类模型的输入,进行目标位置的估计。本发明专利技术将室内定位问题转化为机器学习的分类问题,有效地克服了多径干扰、设备部署困难、实现成本高等一系列问题,保证了室内定位效果。证了室内定位效果。证了室内定位效果。

【技术实现步骤摘要】
基于pix2pix的多图像定位方法


[0001]本专利技术涉及一种室内目标定位方法,具体涉及一种基于pix2pix的多图像定位方法,属于定位导航


技术介绍

[0002]近年来,随着各类基于室内位置的服务需求稳步上升,促使室内定位技术不断发展、更迭。现阶段较为主流的室内定位技术包括:红外线室内定位技术、超声波定位技术,蓝牙定位技术,射频识别定位技术、超宽带定位技术等。这些常见的室内定位技术,大多基于无线网络,在方案实现的过程中通常需要在场景中部署用于信号发送和接收的特定设备、投入大量的人力物力,这样一来无疑会大幅增加室内定位的成本。
[0003]与上述方案不同,基于图像和机器学习的室内定位技术能够将定位问题转化为机器学习问题,既能够通过机器学习的方法充分利用图像中的信息,又能够解决现有室内定位技术中所存在的多径干扰、设备部署困难、实现成本高等一系列问题,因此具有重要的研究意义。
[0004]目前业内研究者也陆续提出了多种基于图像的室内定位技术方案,如公开号为CN112164111A的中国专利公开了一种基于图像相似度和BPNN回归学习的室内定位算法,该算法包括离线训练阶段和在线定位阶段;在离线阶段,需要对图像进行预处理操作,计算采样点图像与参考图像的余弦相似度、结构相似度和直方图相似度。这一方案虽然操作较为简便,但是如果图像分辨率很高则会在训练数据集的构建阶段浪费大量的时间。又如公开号为CN110443849A的中国专利公开了一种基于深度图像的双流卷积神经网络回归学习的目标定位方法,采用双目相机进行图像采集,然后需要运用图像预处理技术将采集的图像转换为三通道图像。这一方案中图像转化的过程异常复杂,而且由于单相机视角的局限性,可定位的区域较小。
[0005]综上所述,如果能够在以上现有技术的基础上,提出一种利用图像和卷积神经网络进行分类学习、进而实现目标定位的方法,那么必将对未来的室内目标定位技术的发展具有重要的参考价值。

技术实现思路

[0006]鉴于现有技术存在上述缺陷,本专利技术的目的是提出一种基于pix2pix的多图像定位方法,包含离线训练阶段和在线定位阶段,具体如下。
[0007]所述离线训练阶段包括如下步骤,
[0008]S1、利用多台相机收集训练图像,对训练图像进行图像预处理,随后对处理后的多副图像进行水平方向上的拼接,构建得到训练数据集,
[0009]S2、利用卷积神经网络对所述训练数据集进行分类学习,得到基于位置的卷积神经网络分类模型,
[0010]S3、针对每台相机、构造该台相机的图像生成训练数据库,利用pix2pix训练每台
相机的图像生成模型;
[0011]所述在线定位阶段包括如下步骤,
[0012]S4、利用相机收集目标图像,对目标图像进行图像预处理,若目标图像未出现缺失情况、则对所获得的多幅目标图像进行水平方向上的拼接得到完整图像,若目标图像出现缺失情况、则利用所述图像生成模型生成完整图像,
[0013]S5、将完整图像作为所述卷积神经网络分类模型的输入,进行目标位置的估计,输出目标位置的估计值。
[0014]优选地,所述S1包括如下步骤:
[0015]S11、对待定位区域进行划分、在待定位区域内确定多个参考点,对目标所在的每一格参考点上,利用多个相机采集训练图像;
[0016]S12、对所述训练图像进行图像预处理;
[0017]S13、在同一个参考点上,对经过预处理后的多幅训练图像进行水平方向上的拼接,构建得到训练数据集。
[0018]优选地,在S13中构建训练数据集时,对参考点的位置进行分类,并将类别用作分类训练的标签。
[0019]优选地,所述图像预处理过程为利用双线性插值算法对图像进行大小归一化处理。
[0020]优选地,所述S3包括如下步骤:
[0021]S31、针对某台相机、使用像素为255的黑色图像替代该台相机所采集的图像,然后进行水平方向上多副图像的拼接、得到生成模型输入图像,将所述生成模型输入图像作为输入、将S13中拼接所得的图像作为输出,得到pix2pix训练数据;
[0022]S32、搭建pix2pix网络,利用S31中的pix2pix训练数据对所述pix2pix网络进行训练,得到该台相机所对应的图像生成模型;
[0023]S33、重复S31~S32,直至获得所有相机的图像生成模型。
[0024]本专利技术的优点主要体现在以下几个方面:
[0025]本专利技术所提出的一种基于pix2pix的多图像定位方法,将室内定位问题转化为机器学习的分类问题,有效地克服了现有室内定位技术中所存在的多径干扰、设备部署困难、实现成本高等一系列问题,保证了室内定位效果。
[0026]同时,本专利技术利用相机采集图像实现定位,无需额外部署复杂的信号采集设备,且不存在设备间的信号干扰问题,数据获取过程方便快捷。而且在本专利技术的方案中使用了多台相机进行图像采集,相比单一相机采集而言,其视野范围及可定位区域更大。
[0027]本专利技术的方案中考虑到了使用多相机进行数据采集时可能会出现的因相机故障或数据传输错误导致部分图像缺失问题,提出利用利用pix2pix网络对缺失的图像进行补全,进一步保证了本方法的稳健性和鲁棒性。
[0028]此外,本专利技术还为室内目标定位的相关研究和应用提供了可以一种全新的思路,为领域内的其他相关问题提供了参考,可以以此为依据进行拓展延伸和深入研究,具有十分广阔的应用前景。
[0029]以下便结合实施例附图,对本专利技术的具体实施方式作进一步的详述,以使本专利技术技术方案更易于理解、掌握。
附图说明
[0030]图1为本专利技术方法的处理流程示意图;
[0031]图2为本专利技术中利用双线性插值算法对图像进行大小归一化的处理流程示意图;
[0032]图3为本专利技术中所使用的卷积神经网络的架构示意图;
[0033]图4为本专利技术中所使用的pix2pix的原理示意图;
[0034]图5为本专利技术中实验采集点的设置示意图;
[0035]图6为本专利技术的性能分析图。
具体实施方式
[0036]如图1所示,本专利技术揭示了一种基于pix2pix的多图像定位方法,包含离线训练阶段和在线定位阶段,具体方案如下。
[0037]所述离线训练阶段包括如下步骤:
[0038]S1、利用多台相机收集训练图像,对训练图像进行图像预处理,随后对处理后的多副图像进行水平方向上的拼接,构建得到训练数据集。
[0039]S2、利用卷积神经网络对所述训练数据集进行分类学习,得到基于位置的卷积神经网络分类模型。
[0040]S3、针对每台相机、构造该台相机的图像生成训练数据库,利用pix2pix训练每台相机的图像生成模型。
[0041]进一步而言,所述S1包括如下步骤:
[0042]S11、对待定位区域进行划分、在待定位区域内确定多个参考点,对目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于pix2pix的多图像定位方法,包含离线训练阶段和在线定位阶段,其特征在于:所述离线训练阶段包括如下步骤,S1、利用多台相机收集训练图像,对训练图像进行图像预处理,随后对处理后的多副图像进行水平方向上的拼接,构建得到训练数据集,S2、利用卷积神经网络对所述训练数据集进行分类学习,得到基于位置的卷积神经网络分类模型,S3、针对每台相机、构造该台相机的图像生成训练数据库,利用pix2pix训练每台相机的图像生成模型;所述在线定位阶段包括如下步骤,S4、利用相机收集目标图像,对目标图像进行图像预处理,若目标图像未出现缺失情况、则对所获得的多幅目标图像进行水平方向上的拼接得到完整图像,若目标图像出现缺失情况、则利用所述图像生成模型生成完整图像,S5、将完整图像作为所述卷积神经网络分类模型的输入,进行目标位置的估计,输出目标位置的估计值。2.根据权利要求1所述的基于pix2pix的多图像定位方法,其特征在于,所述S1包括如下步骤:S11、对待定位区域进行划分、在待定位区域内确定多个参考点,对目标所在的每一格参考点上,利用多个相机采集训练图像...

【专利技术属性】
技术研发人员:颜俊朱洪柳曹艳华
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1