基于多目标跟踪的行人轨迹预测方法及系统技术方案

技术编号：36784798 阅读：33 留言：0更新日期：2023-03-08 22:25

本发明专利技术公开了基于多目标跟踪的行人轨迹预测方法及系统，获取待跟踪视频，对视频第一帧的多个目标行人进行标注；将待跟踪视频，输入到训练后的多目标跟踪模型中，多目标跟踪模型输出多个目标行人在每一帧图像中的目标检测框，以及多个目标行人轨迹的跟踪结果；多目标跟踪模型的检测器对待跟踪视频的非首帧进行目标检测，得到可见光模态特征和红外光模态特征；对可见光模态特征和红外光模态特征进行加权融合，得到加权融合后的特征；对加权融合后的特征进行定位，得到目标人体的坐标框；跟踪器根据目标人体的坐标框的中心点位置，对目标行人进行位置预测；将预测的位置与目标人体的当前位置进行关联，得到目标人体的预测轨迹。迹。迹。

全部详细技术资料下载

【技术实现步骤摘要】
基于多目标跟踪的行人轨迹预测方法及系统

[0001]本专利技术涉及计算机视觉
，特别是涉及基于多目标跟踪的行人轨迹预测方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
，并不必然构成现有技术。
[0003]随着居民生活水平的不断提高，大型公共场所的休闲娱乐型客流量逐渐增大，行人出行密度也日益增加，随之便会发生一系列拥挤事故，导致整个客流系统瘫痪，从而影响到居民生活水平和身心健康。对行人出行的运动轨迹进行预测，及时采取安全有效的预防管理措施，是目前预防此类事故发生的重要措施。为了对环境中的行人交通进行有效管理，发现事故发生的潜在风险区域，保障行人交通安全是当前交通管理工作者研究的重点。
[0004]智能视频源自计算机视觉技术，是在图像及图像描述之间建立关系，从而使计算机能够通过数字图像处理和分析来理解视频画面中的内容，达到自动分析和抽取视频源中关键信息的目的，也就是智能视频分析技术(IVS)。作为强化视频监控系统应用的一门主要技术，智能视频分析技术近几年一直得到业界的广泛关注，其通过对视频内容的分析，将客户所关注的目标从监控背景中分离出来，按照目标的移动方向、速度、时间等参数和某些行为特征进行关联，从而达到主动监控防御的目的。
[0005]近年来，随着大数据、云计算、人工智能等领域日新月异的发展及交互融合，智慧电商、智慧交通、智慧城市等概念越发受到关注。随着人们对更智能、更便捷、更高质量生活的向往，同时伴随着重大的学术价值和广阔的商业前景，众多高校、科研

【技术保护点】

【技术特征摘要】
1.基于多目标跟踪的行人轨迹预测方法，其特征是，包括：获取待跟踪视频，对视频第一帧的多个目标行人进行标注；所述待跟踪视频通过数字摄像机和红外线传感器获取的；将待跟踪视频，输入到训练后的多目标跟踪模型中，多目标跟踪模型输出多个目标行人在每一帧图像中的目标检测框，以及多个目标行人轨迹的跟踪结果；所述训练后的多目标跟踪模型，包括相互连接的检测器和跟踪器；其中，检测器对待跟踪视频的非首帧进行目标检测，得到可见光模态特征和红外光模态特征；对可见光模态特征和红外光模态特征进行加权融合，得到加权融合后的特征；对加权融合后的特征进行定位，得到目标人体的坐标框；跟踪器根据目标人体的坐标框的中心点位置，对目标行人进行位置预测；将预测的位置与目标人体的当前位置进行关联，得到目标人体的预测轨迹；对目标人体的预测轨迹进行修正，得到修正后的轨迹。2.如权利要求1所述的基于多目标跟踪的行人轨迹预测方法，其特征是，所述检测器，包括：用于特征提取的CAPsNet网络、用于特征融合的concat函数层和注意力模块；所述跟踪器，包括：依次连接的卡尔曼滤波算法模型、匈牙利算法模型和轨迹修正模型。3.如权利要求1所述的基于多目标跟踪的行人轨迹预测方法，其特征是，所述检测器对待跟踪视频的非首帧进行目标检测，得到可见光模态特征和红外光模态特征，具体包括：采用CAPsNet网络，对待跟踪视频的非首帧进行目标检测，得到可见光模态特征和红外光模态特征；所述对可见光模态特征和红外光模态特征进行加权融合，得到加权融合后的特征，具体包括：其中，Γ
i
表示加权融合后的特征值；f
cat
表示concat融合函数；A
i
表示可见光模态特征；B
i
表示红外光模态特征；W
v
表示经过Sigmoid激活函数处理过后的可见光模态特征；W
i
表示经过Sigmoid激活函数处理过后的红外光模态特征；W表示经过Sigmoid激活函数处理过后的可见光模态特征与红外光模态特征之和；表示可见光模态特征权重；表示红外光模态特征权重，f
nin
表示对可见光模态特征与红外光模态特征通过NIN网络层维度压缩。4.如权利要求1所述的基于多目标跟踪的行人轨迹预测方法，其特征是，所述得到加权融合后的特征之后，所述对加权融合后的特征进行定位之前，还包括：通过注意力模块CBAM的通道注意力机制模块和空间注意力机制模块对融合的特征进行优化，具体优化过程包括：利用通道注意力机制模块对融合后的特征进行处理；利用空间注意力机制模块对通道注意力机制模块输出值进行处理；其中，所述利用通道注意力机制模块对融合后的特征进行处理，具体包括：首先，将加权融合后的特征输入通道注意力机制模块；然后对整个特征进行最大池化和平均池化，用来挤压特征，获得通道之间的全局信息；再通过多层感知器获取每个通道的权重；最后进行加权运算输出通道注意力信息；
其中，所述利用空间注意力机制模块对通道注意力机制模块输出值进行处理，具体包括：对整个识别的图像信息特征依次进行最大池化和平均池化，然后将池化后的两张特征图在通道维度堆叠，并保留特征的关键信息，便可得到行人轨迹最重要的信息点，然后，使用卷积核融合通道信息，最后，将卷积后的结果经过Sigmoid激活函数对特征图的空间权重归一化，再将输入特征图和权重相乘。5.如权利要求1所述的基于多目标跟踪的行人轨迹预测方法，其特征是，所述检测器，其损失函数Loss，包括：目标框位置损失函数L
box
、目标置信度损失函数L
obj
和类别损失函数L
cls
的求和结果；其中，目标框位置损失函数L
box
表示预测框的定位误差，用于表示中心坐标误差的权重；目标框位置损失函数L
box
，具体为：其中，目标置信度损失函数L
obj
表示交并比误差，其作为衡量指标来描述实际框与预测框之间的重合度，保证目标检测网络的查准率和查全率；目标置信度损失函数L
obj
，具体为：其中，类别损失函数L
...

【专利技术属性】
技术研发人员：成卫，伍权，肖海承，蒋银凤，李博，王帅，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人