当前位置: 首页 > 专利查询>中山大学专利>正文

结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质技术方案

技术编号:31845794 阅读:65 留言:0更新日期:2022-01-12 13:26
本发明专利技术涉及行人轨迹预测技术,具体为结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质,其方法包括:获取行人轨迹预测的公开数据集,划分训练集和测试集;对视频数据和行人轨迹数据进行预处理,获得静态场景图像;对静态场景图像语义分割得到语义分割图像;构建行人轨迹时空图,构建每一帧的空间图,将所有时间序列的空间图组成时空图;对静态场景图像和时空图使用不同卷积网络进行特征提取,得到场景特征张量和行人特征张量,融合得到组合特征张量后输入行人轨迹预测模型,预测行人未来的轨迹。本发明专利技术能够把场景上下文中包含的语义信息、行人间关系共同建模,并保留行人与场景之间的空间关系,提高了行人轨迹预测精度。预测精度。预测精度。

【技术实现步骤摘要】
结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质


[0001]本专利技术涉及行人轨迹预测技术,特别涉及结合场景上下文和行人社会关系的行人轨迹预测方法、系统及存储介质。

技术介绍

[0002]为了更好地利用智能科技改变人们的生活,依托于人工智能技术发展起来的智能交通、自动驾驶和智能机器人技术成为了时下的重要攻克点。在这些应用领域中,都需要能够准确地判断现实情形下各种运动物体的运动状态,并能预测出运动物体未来可能的情形,以便更好的选择更加有利的行动。行人轨迹预测是对现实场景进行预测的一个典型问题,它的解决方案能够在稍作调整后应用到如车辆等其他物体的轨迹预测中。
[0003]现有的行人轨迹预测方法主要分为基于手工建模的传统方法和基于数据驱动的机器学习方法。
[0004]手工方法通过抽象出对行人轨迹影响较大的几种因素,并通过建模来模拟它们对行人行走轨迹的作用,通过对目标行人各指标进行计算得到未来目标行人轨迹的预测结果。其中最经典的传统方法是Helbing提出的社会力模型,他将行人运动的驱使因素分为表示行人自身意愿的“自驱力”和代表自身与外界交互的“社会力”。通过牛顿第二定律和对行人自驱力、行人与行人之间的排斥力、行人与障碍物之间的排斥力的计算,更新行人的速度和坐标以估测行人运动轨迹。
[0005]和传统方法相比,基于数据驱动的行人轨迹预测方法具有更强的鲁棒性和泛化能力,通过各式神经网络学习数据中已知的行人运动轨迹来预测未来的行人轨迹坐标。其中的经典方法有Social

LSTM、STGCNN等。数据驱动方法大都关注于如何建模场景上下文约束对行人运动的影响或多个行人之间的社会互动的影响,但是同时考虑建模场景约束和社会关系约束的方法并不多。现有的一些结合方法中也仅仅采用一些如SR或者在网络最后一层进行简单连接的方式,不能在建模行人社会关系的同时保持场景与行人之间的空间关系。
[0006]同时,广泛应用的使用LSTM网络进行行人轨迹预测方法是通过上一时间的行人坐标作为输入的一部分,逐步预测下一时间的行人坐标,这会造成位移偏差的积累而降低准确度。大部分建模行人社会关系的网络也仅仅能建模目标行人与周围行人之间的关系,而忽略了远处行人的影响,并不能较好的建模全局上的行人社会关系。
[0007]总的来说,现有技术中关于行人轨迹预测的方法多专注于建模行人与行人之间的社会关系,一些考虑静态场景对行人轨迹影响的研究仅仅是使用简单的卷积

池化操作直接提取视频中某帧图片的特征向量,再和学习到的行人特征向量做简单的连接用以后续的预测网络。这些方法不能够保留行人当前位置和静态场景之间的空间对应关系,也不能完全把场景与行人位置关系和行人与行人之间社会关系共同提取并适配于后续的预测工作。

技术实现思路

[0008]本专利技术的目的在于克服现有技术的缺点与不足,提供能够同时考虑到静态场景信息和行人之间社会关系,并且结合了时序网络和图卷积网络的行人轨迹预测方法、系统及存储介质,适用于复杂场景下行人未来轨迹的预测。
[0009]本专利技术的轨迹预测方法通过下述技术方案实现:结合场景上下文和行人社会关系的行人轨迹预测方法,包括以下步骤:
[0010]S1、获取关于行人轨迹预测的公开数据集,其中包括在不同场景下长度不等的视频数据和视频中对应的行人坐标轨迹数据表;
[0011]S2、划分训练集和测试集;
[0012]S3、数据预处理,对于视频数据,获取每段不同视频中抹去运动行人后对应的静态场景图像;对于行人轨迹数据,根据时间帧进行采样,得到统一帧间隔和帧数的轨迹,并对不同数据集中行人坐标尺度进行归一化;
[0013]S4、对提取出的静态场景图像进行分辨率统一调整后输入预训练好语义分割网络中,并对得到的图像进行统一调整,得到语义分割图像;
[0014]S5、构建行人轨迹时空图,使用每一帧中行人的坐标点和该坐标点对应的语义标签作为顶点信息构建该帧对应的空间图,并将行人轨迹中所有时间序列的空间图组成时空图,用来表示轨迹中行人与行人之间的社会关系;
[0015]S6、分别对静态场景图像和时空图使用不同的卷积神经网络进行特征提取,得到场景特征张量和行人特征张量,再使用特征融合方法得到最后的组合特征张量;
[0016]S7、预测行人轨迹,先对预测网络进行训练,得到训练好的行人轨迹预测模型并保存;再把组合特征张量输入行人轨迹预测模型,预测行人未来的轨迹。
[0017]本专利技术结合场景上下文和行人社会关系的行人轨迹预测系统,包括:
[0018]数据获取模块,用于获取关于行人轨迹预测的公开数据集,其中包括在不同场景下长度不等的视频数据和视频中对应的行人坐标轨迹数据表;
[0019]数据集划分模块,用于划分训练集和测试集;
[0020]数据预处理模块,对于视频数据,获取每段不同视频中抹去运动行人后对应的静态场景图像;对于行人轨迹数据,根据时间帧进行采样,得到统一帧间隔和帧数的轨迹,并对不同数据集中行人坐标尺度进行归一化;
[0021]语义分割模块,用于对提取出的静态场景图像进行分辨率统一调整后输入预训练好语义分割网络中,并对得到的图像进行统一调整,得到语义分割图像;
[0022]时空图构建模块,用于构建行人轨迹时空图,使用每一帧中行人的坐标点和该坐标点对应的语义标签作为顶点信息构建该帧对应的空间图,并将行人轨迹中所有时间序列的空间图组成时空图,用来表示轨迹中行人与行人之间的社会关系;
[0023]特征提取与特征融合模块,用于分别对静态场景图像和时空图使用不同的卷积神经网络进行特征提取,得到场景特征张量和行人特征张量,再使用特征融合方法得到最后的组合特征张量;
[0024]行人轨迹预测模块,先对预测网络进行训练,得到训练好的行人轨迹预测模型并保存;再把组合特征张量输入行人轨迹预测模型,预测行人未来的轨迹。
[0025]本专利技术的存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由计
算机处理器执行时,用于实现本专利技术行人轨迹预测方法的各步骤。
[0026]本专利技术相对于现有技术具有如下的优点及效果:
[0027]1.本专利技术提出的结合场景上下文和行人社会关系的行人轨迹预测方法,能够把场景上下文中包含的语义信息、行人与行人之间关系共同建模,并保留行人与场景之间的空间关系,取得了提高行人轨迹预测精度的效果。
[0028]2.在本专利技术中,利用行人位置对应的语义标签和行人坐标共同构建时空图的顶点,并在考虑时空图连接关系时同时考虑行人之间物理距离和语义标签差距,这使得本专利技术能够联合建模场景中所有行人社会关系和行人与场景之间语义关系,对行人轨迹的预测精度高。
[0029]3.在提取场景上下文信息时,本专利技术没有直接使用视频数据中截取的图像帧作为场景图象信息,而是使用算法提取出消除了视频中所有运动物体而得到的静态场景背景图像;同时,在本专利技术中使用场景图像的语义分割图帮助构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.结合场景上下文和行人社会关系的行人轨迹预测方法,其特征在于,包括以下步骤:S1、获取关于行人轨迹预测的公开数据集,其中包括在不同场景下长度不等的视频数据和视频中对应的行人坐标轨迹数据表;S2、划分训练集和测试集;S3、数据预处理,对于视频数据,获取每段不同视频中抹去运动行人后对应的静态场景图像;对于行人轨迹数据,根据时间帧进行采样,得到统一帧间隔和帧数的轨迹,并对不同数据集中行人坐标尺度进行归一化;S4、对提取出的静态场景图像进行分辨率统一调整后输入预训练好语义分割网络中,并对得到的图像进行统一调整,得到语义分割图像;S5、构建行人轨迹时空图,使用每一帧中行人的坐标点和该坐标点对应的语义标签作为顶点信息构建该帧对应的空间图,并将行人轨迹中所有时间序列的空间图组成时空图,用来表示轨迹中行人与行人之间的社会关系;S6、分别对静态场景图像和时空图使用不同的卷积神经网络进行特征提取,得到场景特征张量和行人特征张量,再使用特征融合方法得到最后的组合特征张量;S7、预测行人轨迹,先对预测网络进行训练,得到训练好的行人轨迹预测模型并保存;再把组合特征张量输入行人轨迹预测模型,预测行人未来的轨迹。2.根据权利要求1所述的行人轨迹预测方法,其特征在于,步骤S3在数据预处理过程中,对视频数据进行静态场景提取时,先使用KNN算法对视频进行动态对象和静态场景划分,得到静态场景图像,对得到的静态场景图像进行图像过滤处理,并通过不断调整过滤算法中的过滤阈值以保证运动物体在划分后的静态场景图象中留存的噪声和阴影影响最小;再对得到的静态场景图像进行图像处理,消除行人所在区域存留的阴影和椒盐噪声,得到剔除了所有动态行人之后该视频对应的静态场景图象。3.根据权利要求1所述的行人轨迹预测方法,其特征在于,步骤S3在数据预处理过程中,对记载了每个时间帧上所有行人坐标点的行人轨迹数据表,以每m帧作为间隔等距采样,再根据行人在n个采样点上构成的轨迹线性程度提取出非线性的行人轨迹坐标,以此作为行人轨迹预测的坐标数据集。4.根据权利要求3所述的行人轨迹预测方法,其特征在于,步骤S3中行人轨迹坐标的计算公式如下:其中{X,Y}指行人的世界坐标轨迹序列,T1和T
pre
分别指轨迹开始和结束的时间;分别指第i个行人在t时间的x坐标和y坐标,t指行人所在的时间帧,i指该行人的编号,N指轨迹中所有行人的总数,T
1~pre
指轨迹中的时间帧。5.根据权利要求1所述的行人轨迹预测方法,其特征在于,步骤S5包括以下步骤:S51、设t时刻的时间帧一共有N个行人,以行人的坐标位置和语义分割图像中行人所在坐标位置对应的语义标签构成空间图的顶点集:V
t
={V
ti
|i=1,2......N}顶点集中每个顶点包含一个行人坐标位置及其所在位置对应的语义标签
S52、以i、j顶点是否有连接关系作为空间图的边集构建t时刻对应的二维空间图G
t
;若i、j顶点对应的行人之间的最短距离d(v
i
,v
j
)小于等于确定阈值D,则认为i、j顶点之间具有连接关系,否则S53、对时间0

T所有时刻的行人信息都构造相应的二维空间图G
0~T
,则得到时空图G。6.根据权利要求5所述的行人轨迹预测方法,其特征在于,步骤S52中为了衡量两个顶点i、j之间的相关性,对每条边计算权重值:其中指边对应的权重值,指顶点和顶点的连接边。7.根据权利要求1所述的行人轨迹预测方法,其特征在于,步骤S6包括:S61、特征提取,对于时空图,使用图卷积神经网络作为特...

【专利技术属性】
技术研发人员:纪庆革郭珊珊郭佳俊印鉴
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1