基于时空注意力与对比表示学习的行人轨迹预测方法技术

技术编号：38704979 阅读：22 留言：0更新日期：2023-09-08 14:45

本发明专利技术涉及行人轨迹预测技术领域，具体公开了基于时空注意力与对比表示学习的行人轨迹预测方法，所述方法包括：步骤一、输入行人轨迹信息，获取行人轨迹数据并整理，得到数据集；建立训练集和测试集；所述数据集是采用行人轨迹预测的基准数据集ETH和UCY数据集；步骤二、采用图注意力机制进行时间特征提取和交互特征提取；步骤三、通过自动标注的方法自动生成正负样本；步骤四、基于所述步骤三生成的正负样本，进行对比表示学习；步骤五、将融合后的行人轨迹特征信息通过Info

全部详细技术资料下载

【技术实现步骤摘要】
基于时空注意力与对比表示学习的行人轨迹预测方法

[0001]本专利技术涉及行人轨迹预测
，具体涉及基于时空注意力与对比表示学习的行人轨迹预测方法。

技术介绍

[0002]由于行人轨迹的无序性和复杂性特征，其难点主要表现在：(1)人与人之间的交互是复杂的且难以捕捉的；特别是行人在移动过程中需要预测场景中其他行人的轨迹的能力，从而动态的调整自己的路线，而这种能力是难以通过建模实现的。(2)行人轨迹预测是一个多模态问题；基于行人过多的轨迹，应当产生多条可能的未来轨迹，因此在进行轨迹输出时，需要在考虑合理性的同时也需要考虑多样性。(3)轨迹输出的自洽性；对于轨迹预测而言，如果输出的轨迹会产生碰撞，那么不但无法逻辑自洽，而且在应用层面可能带来巨大的风险，这通常是不能接受的。
[0003]目前，国内外已经有多名学者对轨迹预测的行人交互问题，进行了深入研究。基于RNN的方法通过其潜在状态来捕获行人的运动，并通过合并行人的潜在状态来模拟人与人之间的交互作用。Social LSTM是循环神经网络在行人轨迹预测领域的典型应用，它通过池化层建模行人之间的相互作用。近年来，Transformer网络在自然语言处理领域(NLP)方面取得了突破性的进展，与RNN相比，Transformer架构的主要好处是使用自我注意显著改善了时间建模，可以更好的捕捉行人之间潜在的互动；然而，无论是利用RNN模型或是自注意力机制进行人与人交互建模，往往都会忽略空间结构信息；而通过图神经网络的特殊形式，让行人交互的空间结构的信息得到了直观且有效的利用...

【技术保护点】

【技术特征摘要】
1.基于时空注意力与对比表示学习的行人轨迹预测方法，其特征在于，所述方法包括：步骤一、输入行人轨迹信息，获取行人轨迹数据并整理，得到数据集；建立训练集和测试集；所述数据集是采用行人轨迹预测的基准数据集ETH和UCY数据集；步骤二、采用图注意力机制进行时间特征提取和交互特征提取；步骤三、通过自动标注的方法自动生成正负样本；步骤四、基于所述步骤三生成的正负样本，进行对比表示学习；步骤五、将融合后的行人轨迹特征信息通过Info
‑
GAN解码器输出预测轨迹。2.根据权利要求1所述的基于时空注意力与对比表示学习的行人轨迹预测方法，其特征在于，所述预测轨迹的问题表示为根据过去一段时间内的轨迹来推断出未来一段时间的可能轨迹：假设场景中有N个行人，且行人过去轨迹定义为行人未来预测轨迹定义为行人未来真实轨迹定义为则问题可以描述为已知行人i以及场景中其他行人j的历史时间段1到T
obs
的轨迹目标为预测他在未来时间段T
obs
+1到T
pre
时间段内的轨迹即表示为：即表示为：即表示为：即表示为：3.根据权利要求2所述的基于时空注意力与对比表示学习的行人轨迹预测方法，其特征在于，所述步骤二中，具体为：时间特征提取：获取时间T
obs
内场景中N个人的轨迹数据，将这N个人的轨迹数据分别提取出来，形成N个时间图；对行人i的轨迹点做出图注意力机制；空间特征提取：获取每个时间点t场景中的N个人，并根据N个人之间的空间信息就形成T
obs
个空间图；根据所述T
obs
个空间图对行人i和行人j在t时刻的的轨迹点做出图注意力机制。4.根据权利要求1所述的基于时空注意力与对比...

【专利技术属性】
技术研发人员：张德平，朱鹏飞，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人