结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质技术方案

技术编号：31845794 阅读：65 留言：0更新日期：2022-01-12 13:26

本发明专利技术涉及行人轨迹预测技术，具体为结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质，其方法包括：获取行人轨迹预测的公开数据集，划分训练集和测试集；对视频数据和行人轨迹数据进行预处理，获得静态场景图像；对静态场景图像语义分割得到语义分割图像；构建行人轨迹时空图，构建每一帧的空间图，将所有时间序列的空间图组成时空图；对静态场景图像和时空图使用不同卷积网络进行特征提取，得到场景特征张量和行人特征张量，融合得到组合特征张量后输入行人轨迹预测模型，预测行人未来的轨迹。本发明专利技术能够把场景上下文中包含的语义信息、行人间关系共同建模，并保留行人与场景之间的空间关系，提高了行人轨迹预测精度。预测精度。预测精度。

全部详细技术资料下载

【技术实现步骤摘要】
结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质

[0001]本专利技术涉及行人轨迹预测技术，特别涉及结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质。

技术介绍

[0002]为了更好地利用智能科技改变人们的生活，依托于人工智能技术发展起来的智能交通、自动驾驶和智能机器人技术成为了时下的重要攻克点。在这些应用领域中，都需要能够准确地判断现实情形下各种运动物体的运动状态，并能预测出运动物体未来可能的情形，以便更好的选择更加有利的行动。行人轨迹预测是对现实场景进行预测的一个典型问题，它的解决方案能够在稍作调整后应用到如车辆等其他物体的轨迹预测中。
[0003]现有的行人轨迹预测方法主要分为基于手工建模的传统方法和基于数据驱动的机器学习方法。
[0004]手工方法通过抽象出对行人轨迹影响较大的几种因素，并通过建模来模拟它们对行人行走轨迹的作用，通过对目标行人各指标进行计算得到未来目标行人轨迹的预测结果。其中最经典的传统方法是Helbing提出的社会力模型，他将行人运动的驱使因素分为表示行人自身意愿的“自驱力”和代表自身与外界交互的“社会力”。通过牛顿第二定律和对行人自驱力、行人与行人之间的排斥力、行人与障碍物之间的排斥力的计算，更新行人的速度和坐标以估测行人运动轨迹。
[0005]和传统方法相比，基于数据驱动的行人轨迹预测方法具有更强的鲁棒性和泛化能力，通过各式神经网络学习数据中已知的行人运动轨迹来预测未来的行人轨迹坐标。其中的经典方法有Social
‑
...

【技术保护点】

【技术特征摘要】
1.结合场景上下文和行人社会关系的行人轨迹预测方法，其特征在于，包括以下步骤：S1、获取关于行人轨迹预测的公开数据集，其中包括在不同场景下长度不等的视频数据和视频中对应的行人坐标轨迹数据表；S2、划分训练集和测试集；S3、数据预处理，对于视频数据，获取每段不同视频中抹去运动行人后对应的静态场景图像；对于行人轨迹数据，根据时间帧进行采样，得到统一帧间隔和帧数的轨迹，并对不同数据集中行人坐标尺度进行归一化；S4、对提取出的静态场景图像进行分辨率统一调整后输入预训练好语义分割网络中，并对得到的图像进行统一调整，得到语义分割图像；S5、构建行人轨迹时空图，使用每一帧中行人的坐标点和该坐标点对应的语义标签作为顶点信息构建该帧对应的空间图，并将行人轨迹中所有时间序列的空间图组成时空图，用来表示轨迹中行人与行人之间的社会关系；S6、分别对静态场景图像和时空图使用不同的卷积神经网络进行特征提取，得到场景特征张量和行人特征张量，再使用特征融合方法得到最后的组合特征张量；S7、预测行人轨迹，先对预测网络进行训练，得到训练好的行人轨迹预测模型并保存；再把组合特征张量输入行人轨迹预测模型，预测行人未来的轨迹。2.根据权利要求1所述的行人轨迹预测方法，其特征在于，步骤S3在数据预处理过程中，对视频数据进行静态场景提取时，先使用KNN算法对视频进行动态对象和静态场景划分，得到静态场景图像，对得到的静态场景图像进行图像过滤处理，并通过不断调整过滤算法中的过滤阈值以保证运动物体在划分后的静态场景图象中留存的噪声和阴影影响最小；再对得到的静态场景图像进行图像处理，消除行人所在区域存留的阴影和椒盐噪声，得到剔除了所有动态行人之后该视频对应的静态场景图象。3.根据权利要求1所述的行人轨迹预测方法，其特征在于，步骤S3在数据预处理过程中，对记载了每个时间帧上所有行人坐标点的行人轨迹数据表，以每m帧作为间隔等距采样，再根据行人在n个采样点上构成的轨迹线性程度提取出非线性的行人轨迹坐标，以此作为行人轨迹预测的坐标数据集。4.根据权利要求3所述的行人轨迹预测方法，其特征在于，步骤S3中行人轨迹坐标的计算公式如下：其中{X，Y}指行人的世界坐标轨迹序列，T1和T
pre
分别指轨迹开始和结束的时间；分别指第i个行人在t时间的x坐标和y坐标，t指行人所在的时间帧，i指该行人的编号，N指轨迹中所有行人的总数，T
1～pre
指轨迹中的时间帧。5.根据权利要求1所述的行人轨迹预测方法，其特征在于，步骤S5包括以下步骤：S51、设t时刻的时间帧一共有N个行人，以行人的坐标位置和语义分割图像中行人所在坐标位置对应的语义标签构成空间图的顶点集：V
t
＝{V
ti
|i＝1，2......N}顶点集中每个顶点包含一个行人坐标位置及其所在位置对应的语义标签
S52、以i、j顶点是否有连接关系作为空间图的边集构建t时刻对应的二维空间图G
t
；若i、j顶点对应的行人之间的最短距离d(v
i
，v
j
)小于等于确定阈值D，则认为i、j顶点之间具有连接关系，否则S53、对时间0
→
T所有时刻的行人信息都构造相应的二维空间图G
0～T
，则得到时空图G。6.根据权利要求5所述的行人轨迹预测方法，其特征在于，步骤S52中为了衡量两个顶点i、j之间的相关性，对每条边计算权重值：其中指边对应的权重值，指顶点和顶点的连接边。7.根据权利要求1所述的行人轨迹预测方法，其特征在于，步骤S6包括：S61、特征提取，对于时空图，使用图卷积神经网络作为特...

【专利技术属性】
技术研发人员：纪庆革，郭珊珊，郭佳俊，印鉴，
申请(专利权)人：中山大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人