System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及互联网,尤其涉及一种数据处理方法和装置、电子设备及存储介质。
技术介绍
1、随着技术的发展和人们生活水平的提高,人们在日常生活或工作中能够获得丰富的产品或服务。目前,在给用户推荐产品或服务时,推荐不够精准和高效,因此亟待解决这一技术问题。
技术实现思路
1、鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法和装置、电子设备及存储介质。所述技术方案如下:
2、第一方面,提供了一种数据处理方法,包括:
3、获取用户的访问签到数据,根据所述访问签到数据构建用户访问签到的轨迹序列集合,并根据所述轨迹序列集合确定用户的历史轨迹序列和当前轨迹序列;
4、基于所述历史轨迹序列和所述当前轨迹序列,融合天气、时间和空间的因素,对用户长期访问偏好进行建模,得到用户长期访问偏好表示;
5、基于所述当前轨迹序列对用户实时访问偏好进行建模,得到用户实时访问偏好表示;
6、结合所述用户长期访问偏好表示和所述用户实时访问偏好表示,对兴趣数据候选集进行概率预测,并根据预测结果进行兴趣数据的推荐。
7、在一种可能的实现方式中,所述轨迹序列集合中各个轨迹序列是由多个访问签到点按照用户访问时间顺序组成的,其中各个访问签到点从所述访问签到数据中提取。
8、在一种可能的实现方式中,根据所述访问签到数据构建用户访问签到的轨迹序列集合,并根据所述轨迹序列集合确定用户的历史轨迹序列和当前轨迹序列,
9、根据所述访问签到数据提取各个访问签到点,并以预设划分周期,依序确定各个轨迹序列的多个访问签到点;
10、利用确定的各个轨迹序列的多个访问签到点,构建用户访问签到的轨迹序列集合;
11、基于所述预设划分周期和所述轨迹序列集合中各个轨迹序列的顺序,确定用户的历史轨迹序列和当前轨迹序列。
12、在一种可能的实现方式中,基于所述历史轨迹序列和所述当前轨迹序列,融合天气、时间和空间的因素,对用户长期访问偏好进行建模,得到用户长期访问偏好表示,包括:
13、根据天气、时间和空间三个维度分别计算所述历史轨迹序列与所述当前轨迹序列的相似性权值,进而根据所述相似性权值进行天气、时间和空间的因素聚合表示,得到用户长期访问偏好表示。
14、在一种可能的实现方式中,根据天气、时间和空间三个维度分别计算所述历史轨迹序列与所述当前轨迹序列的相似性权值,进而根据所述相似性权值进行天气、时间和空间的因素聚合表示,得到用户长期访问偏好表示,包括:
15、对所述历史轨迹序列与所述当前轨迹序列中的各个访问签到点进行编码表示,得到编码后的历史轨迹序列和编码后的当前轨迹序列;
16、计算编码后的历史轨迹序列和编码后的当前轨迹序列的天气和时间相似度聚合;
17、计算编码后的历史轨迹序列和编码后的当前轨迹序列的空间距离相似度聚合;
18、结合编码后的历史轨迹序列和编码后的当前轨迹序列的天气和时间相似度聚合,以及编码后的历史轨迹序列和编码后的当前轨迹序列的空间距离相似度聚合,得到用户长期访问偏好表示。
19、在一种可能的实现方式中,所述计算编码后的历史轨迹序列和编码后的当前轨迹序列的天气和时间相似度聚合,包括:
20、针对编码后的历史轨迹序列中的各个访问签到点,计算与编码后的当前轨迹序列中的当前时刻对应天气和时间情况的相似度,并得到编码后的历史轨迹序列中的各个访问签到点的相似度权值,然后聚合得到编码后的历史轨迹序列的向量表示;
21、针对编码后的当前轨迹序列,采用直接平均方式代替天气和时间相似度方式,编码后的当前轨迹序列中的各个访问签到点的相似度权值相同,然后聚合得到编码后的当前轨迹序列的向量表示。
22、在一种可能的实现方式中,所述计算编码后的历史轨迹序列和编码后的当前轨迹序列的空间距离相似度聚合,包括:
23、对编码后的历史轨迹序列中的各个访问签到点的经纬度求平均,得到编码后的历史轨迹序列的中心坐标;
24、通过编码后的当前轨迹序列中的当前时刻的上一时刻的经纬度位置和编码后的历史轨迹序列的中心坐标的距离进行加权聚合,得到编码后的历史轨迹序列和编码后的当前轨迹序列的空间距离相似度聚合。
25、在一种可能的实现方式中,基于所述当前轨迹序列对用户实时访问偏好进行建模,得到用户实时访问偏好表示,包括:
26、对于编码后的当前轨迹序列,对编码后的当前轨迹序列采用长短期记忆网络模型处理来学习短期时序关系,以编码后的当前轨迹序列中的当前时刻的上一时刻的访问签到点为实时访问偏好向量,得到用户实时访问偏好表示。
27、在一种可能的实现方式中,结合所述用户长期访问偏好表示和所述用户实时访问偏好表示,对兴趣数据候选集进行概率预测,并根据预测结果进行兴趣数据的推荐,包括:
28、结合所述用户长期访问偏好表示和所述用户实时访问偏好表示,计算兴趣数据候选集的分布概率,选取概率满足预设条件的兴趣数据进行推荐。
29、第二方面,提供了一种数据处理装置,其特征在于,包括:
30、确定单元,用于获取用户的访问签到数据,根据所述访问签到数据构建用户访问签到的轨迹序列集合,并根据所述轨迹序列集合确定用户的历史轨迹序列和当前轨迹序列;
31、长期访问偏好建模单元,用于基于所述历史轨迹序列和所述当前轨迹序列,融合天气、时间和空间的因素,对用户长期访问偏好进行建模,得到用户长期访问偏好表示;
32、实时访问偏好建模单元,用于基于所述当前轨迹序列对用户实时访问偏好进行建模,得到用户实时访问偏好表示;
33、推荐单元,用于结合所述用户长期访问偏好表示和所述用户实时访问偏好表示,对兴趣数据候选集进行概率预测,并根据预测结果进行兴趣数据的推荐。
34、在一种可能的实现方式中,所述轨迹序列集合中各个轨迹序列是由多个访问签到点按照用户访问时间顺序组成的,其中各个访问签到点从所述访问签到数据中提取。
35、在一种可能的实现方式中,所述确定单元还用于:
36、根据所述访问签到数据提取各个访问签到点,并以预设划分周期,依序确定各个轨迹序列的多个访问签到点;
37、利用确定的各个轨迹序列的多个访问签到点,构建用户访问签到的轨迹序列集合;
38、基于所述预设划分周期和所述轨迹序列集合中各个轨迹序列的顺序,确定用户的历史轨迹序列和当前轨迹序列。
39、在一种可能的实现方式中,所述长期访问偏好建模单元还用于:
40、根据天气、时间和空间三个维度分别计算所述历史轨迹序列与所述当前轨迹序列的相似性权值,进而根据所述相似性权值进行天气、时间和空间的因素聚合表示,得到用户长期访问偏好表示。
41、在一种可能的实现方式中,所述长期访问偏好建模单元还用于:<本文档来自技高网...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述轨迹序列集合中各个轨迹序列是由多个访问签到点按照用户访问时间顺序组成的,其中各个访问签到点从所述访问签到数据中提取。
3.根据权利要求2所述的方法,其特征在于,根据所述访问签到数据构建用户访问签到的轨迹序列集合,并根据所述轨迹序列集合确定用户的历史轨迹序列和当前轨迹序列,包括:
4.根据权利要求1至3中任一项所述的方法,其特征在于,基于所述历史轨迹序列和所述当前轨迹序列,融合天气、时间和空间的因素,对用户长期访问偏好进行建模,得到用户长期访问偏好表示,包括:
5.根据权利要求4所述的方法,其特征在于,根据天气、时间和空间三个维度分别计算所述历史轨迹序列与所述当前轨迹序列的相似性权值,进而根据所述相似性权值进行天气、时间和空间的因素聚合表示,得到用户长期访问偏好表示,包括:
6.根据权利要求5所述的方法,其特征在于,所述计算编码后的历史轨迹序列和编码后的当前轨迹序列的天气和时间相似度聚合,包括:
7.根据权利要求5所述的方法
8.一种数据处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器中存储有计算机程序,所述处理器被配置为运行所述计算机程序以执行权利要求1至7中任一项所述的数据处理方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被配置为运行时执行权利要求1至7中任一项所述的数据处理方法。
...【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述轨迹序列集合中各个轨迹序列是由多个访问签到点按照用户访问时间顺序组成的,其中各个访问签到点从所述访问签到数据中提取。
3.根据权利要求2所述的方法,其特征在于,根据所述访问签到数据构建用户访问签到的轨迹序列集合,并根据所述轨迹序列集合确定用户的历史轨迹序列和当前轨迹序列,包括:
4.根据权利要求1至3中任一项所述的方法,其特征在于,基于所述历史轨迹序列和所述当前轨迹序列,融合天气、时间和空间的因素,对用户长期访问偏好进行建模,得到用户长期访问偏好表示,包括:
5.根据权利要求4所述的方法,其特征在于,根据天气、时间和空间三个维度分别计算所述历史轨迹序列与所述当前轨迹序列的相似性权值,进而根据所述相似...
【专利技术属性】
技术研发人员:陶文武,李心语,丁小虎,董方,钱夫利,
申请(专利权)人:拉扎斯网络科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。