System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及时空数据挖掘领域,尤其涉及一种基于多维度历史行为轨迹数据的用户位置预测方法。
技术介绍
1、互联网技术的发展与普及应用,应运而生的是对其背后蕴藏的大量潜在信息的大数据的挖掘研究。而这也包括所积累的大量用户行为轨迹数据,为挖掘用户的行为模式提供便利。对用户位置信息进行准确预测是众多热门基于位置的应用程序所必要的基础。准确识别用户所希望了解的餐厅、景点或任何位置标记的内容可以极大地提升用户使用体验。基于此需求,用户位置预测问题引起了研究人员的高度重视,诸如兴趣点推荐,旅行计划等问题,成为一个亟待解决的研究课题。
2、传统方法,通过对位置序列基于用户周期性相似性假设进行建模,而忽视了对于用户更为全面行为轨迹的学习,也没有充分利用位置属性。最近随着图神经网络的发展,用户位置预测的研究工作主要着重将地理影响与用户历史位置数据相结合。例如disenpoi通过使用建模显式的地理区域图与用户序列结合从而利用顺序影响力和地理影响力对于位置预测的准确率,并取得较为不错的效果。
技术实现思路
1、本专利技术提出了一种基于多维度历史行为轨迹数据的用户位置预测方法,通过对位置坐标、网络行为、社交关系多维度信息进行嵌入,设计了一种自监督对比学习训练模型进行训练,提取用户行为特征,从而实现用户位置预测。
2、基于上述目的,本专利技术提供了一种基于多维度行为轨迹的用户位置预测方法,其特征在于,包括:
3、获取历史行为轨迹数据并进行数据接入、数据清洗和数据压缩得到预
4、基于所述预处理数据集进行数据增强,得到训练数据集;所述数据增强以扩充可训练内容;所述训练数据集包括用户数据集和数据训练数据集;
5、所述行为序列特征嵌入向量和空间结构特征嵌入向量输入至自监督对比学习训练模型,得到用户位置预测地点;其中所述自监督对比训练模型通过以下步骤建立:
6、对所述行为序列特征嵌入向量和空间结构特征嵌入向量叠加位置编码,结合所述社交关系嵌入向量,得到用户表示向量和训练表示向量;
7、所述用户表示向量通过输出层得到用户位置预测地点。
8、优选的,所述历史行为轨迹数据包括:位置信息序列、网络行为信息序列、社交关系信息序列;所述位置信息序列包括位置坐标和时间戳;所述网络行为信息序列包括访问手机软件或网站及其具体内容;所述社交关系信息序列包括用户关系和互动记录。
9、优选的,所述数据接入的方法包括:对历史行为轨迹数据筛选过滤,整合为数据集形式。
10、优选的,所述数据清洗的方法包括:处理定位错误的现象和过滤无意义的心跳连接信号。
11、优选的,所述数据压缩的方法包括:对数据集进行采样压缩,处理可能发生的数据冲突现象,得到预处理数据集。
12、优选的,所述数据增强的方法包括:基于预处理数据集创建新序列用户轨迹,即表示为t={p1,p2,…,p|t|},其中pi为第i个轨迹点,其结构为{lngi,lati,behaviori,timei};对用户轨迹进行轨迹剪切和或轨迹遮蔽和或停留点位置偏移和或停留点简化和或行为变换和或行为遮盖,并将数据整合为训练数据集。
13、优选的,所述基于训练数据集中的每个轨迹点建立行为序列特征嵌入向量和空间结构特征嵌入向量,基于社交关系信息序列建立社交关系嵌入向量的方法包括:
14、行为序列特征嵌入:基于训练数据集中每个轨迹点的来自位置信息的经度和纬度、网络行为、当前轨迹点与前一个轨迹点的距离和时间戳建立五元组作为每个轨迹点的行为序列特征;将所有行为序列特征整合为一行为序列特征嵌入向量;
15、空间结构特征嵌入:基于训练集中每个轨迹点的经度和纬度得出已知地点的编号作为节点;基于节点建立空间结构图,并通过嵌入算法得到空间结构特征嵌入向量;
16、社交关系嵌入:基于训练数据集中的用户编号和用户关系得到有向图,并通过嵌入算法得到社交关系嵌入向量。
17、优选的,所述得到用户表示向量和训练表示向量的方法包括:
18、行为序列特征嵌入向量和空间结构特征嵌入向量叠加位置编码后得到两个新的向量;两个新的向量作为输入分别通过一个多头自注意力模块得到两个中间向量;中间向量与社交关系嵌入向量进行融合后通过自注意力层产生得到中间向量的表示向量,进而得到用户表示向量和数据训练表示向量。
19、本专利技术的有益效果如下:
20、1.通过自监督的对比学习方法,能够有效地从海量的无标注轨迹数据中提取出人类行为的深层特征,并使相似用户在表示空间尽可能接近,从而为后续的地点预测任务提供了一个坚实的基础。
21、2.针对轨迹数据特点设计了一种数据增强方法,包括轨迹剪切、轨迹遮蔽、停留点简化、停留点位置偏移、行为变换和行为遮盖。这些方法能够适应不同的数据缺失和偏差情况,如路途中设备启用的适应性、轨迹缺失的适应性、定位偏差的适应性以及部分上网日志缺失的适应性,从而提高了模型的泛化能力和鲁棒性。
22、3.充分利用了位置信息、网络行为和社交关系多种维度特征,模型对多维度的特征整合能够更全面地捕捉用户的行为模式,从而提高了预测的准确性和可靠性。
23、4.本专利技术挖掘了大量用户历史行为轨迹数据的价值,不仅适用于地点预测任务,还可以扩展到用户对齐、异常行为检测等多个领域,为众多热门基于位置的应用程序提供了一种可靠的方法。
本文档来自技高网...【技术保护点】
1.一种基于多维度历史行为轨迹数据的用户位置预测方法,包括:
2.根据权利要求1所述的方法,其特征在于,所述历史行为轨迹数据包括:
3.根据权利要求1所述的方法,其特征在于,所述数据接入的方法包括:
4.根据权利要求1所述的方法,其特征在于,所述数据清洗的方法包括:
5.根据权利要求3所述的方法,其特征在于,所述数据压缩的方法包括:
6.根据权利要求1所述的方法,其特征在于,所述数据增强的方法包括:
7.根据权利要求1所述的方法,其特征在于,所述基于训练数据集中的每个轨迹点建立行为序列特征嵌入向量和空间结构特征嵌入向量,基于社交关系信息序列建立社交关系嵌入向量的方法包括:
8.根据权利要求1所述的方法,其特征在于,所述得到用户表示向量和训练表示向量的方法包括:
9.一种电子装置,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~8中任一项所述方法的指令。
10.一种存储介质,存储计算机程序,所述计算机
...【技术特征摘要】
1.一种基于多维度历史行为轨迹数据的用户位置预测方法,包括:
2.根据权利要求1所述的方法,其特征在于,所述历史行为轨迹数据包括:
3.根据权利要求1所述的方法,其特征在于,所述数据接入的方法包括:
4.根据权利要求1所述的方法,其特征在于,所述数据清洗的方法包括:
5.根据权利要求3所述的方法,其特征在于,所述数据压缩的方法包括:
6.根据权利要求1所述的方法,其特征在于,所述数据增强的方法包括:
7.根据权利要求1所述的方法,其特征在于,所述基于...
【专利技术属性】
技术研发人员:万辛,刘发强,陈苏,王立强,黄远,贺文晨,石瑾,鲍泽民,宁珊,孙晓晨,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。