一种基于社交网络的用户数据预测方法技术

技术编号：25638541 阅读：22 留言：0更新日期：2020-09-15 21:30

一种基于社交网络的用户数据预测方法，包括以下步骤：S1获取用户的行为数据以及其相对应的朋友的行为数据；S2基于用户去过的地点数据构建用户行为影响网络；S3针对用户行为影响网络运行随机游走算法对用户数据进行采样；S4初始化序列预测模型；S5将采样得到的用户数据与用户自身的数据当成训练数据输入到序列预测模型中进行训练；S6将新采集到的用户数据输入到训练好的模型中，输出即为用户接下来要去的地点。本发明专利技术提出了一种新的结合社交网络的数据扩充方法，能大幅的提升现有行为预测模型的预测精度，且修改的是用户数据集，因此无需对行为预测模型进行改动。本发明专利技术具有广阔的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于社交网络的用户数据预测方法
本专利技术涉及计算机
及行为预测领域，特别是涉及一种基于社交网络和用户行为数据的行为预测方法。
技术介绍
现代社会离不开社交网络，一些在线社交网络使人们的沟通变得更加便捷，同时也使得大量的用户信息编码在这些社交连接中。除了社交网络中包含的用户信息，用户自身也产生了一些历史数据，由于打卡软件的盛行，获取用户的数据也变得相对容易。这些数据包含了用户真实的移动轨迹。预测人们未来会去的地点是一个经典难题，它对于智慧城市，智能交通有着重大的意义。社交网络以及用户自身打卡信息变得越来越容易收集，这对于解决人类行为预测提供了大量的数据，现有的一些行为预测算法能够在这些数据上获取很高的预测精度。然而现有的预测模型还存在以下缺陷：1.在用户的信息特别少，或者用户先后的两次行为之间隔的时间很久，那么容易导致模型无法有效的学习到用户特征。2.部分用户比较关注自身的隐私，因此很少在公开场合发表评论。3.一些方法尝试融合其它的用户信息，比如用户发表的评论，图片之类的，来提升模型的预测精度，然而由于没有统一的规范，很难应用到其它数据集上。以上诸多的问题使得预测人类移动行为变得困难，我们提出了这样一种方法，在原始采集的用户行为数据上，将用户的社交网络信息编码了进去，混合成一个新的数据集，新生成的数据集可以直接应用到现有模型上。在一些数据集上的实验结果显示，该方法能大幅的提升模型的预测精度。同时，该方法无需重复计算，针对一个数据集生成一次即可。
技术实现思路
为了弥补用户数据稀疏...

【技术保护点】
1.一种基于社交网络的用户行为预测方法，其特征在于，所述方法包括以下步骤：/nS1：获取用户的行为数据以及其相对应的朋友行为数据构建成初始数据集，行为数据包括但不限于用户历史上访问过的地点及其对应的时间数据；/nS2：基于用户去过的地点数据构建用户行为影响网络；/nS3：针对用户行为影响网络运行随机游走算法对用户行为数据进行采样；/nS4：初始化序列预测模型；/nS5：将采样得到的用户行为数据与用户原始行为数据融合成最终数据集输入到序列预测模型中进行训练；/nS6：将新采集到的用户行为数据输入到训练好的模型中，输出即为用户接下来可能要去的地点。/n

【技术特征摘要】
1.一种基于社交网络的用户行为预测方法，其特征在于，所述方法包括以下步骤：
S1：获取用户的行为数据以及其相对应的朋友行为数据构建成初始数据集，行为数据包括但不限于用户历史上访问过的地点及其对应的时间数据；
S2：基于用户去过的地点数据构建用户行为影响网络；
S3：针对用户行为影响网络运行随机游走算法对用户行为数据进行采样；
S4：初始化序列预测模型；
S5：将采样得到的用户行为数据与用户原始行为数据融合成最终数据集输入到序列预测模型中进行训练；
S6：将新采集到的用户行为数据输入到训练好的模型中，输出即为用户接下来可能要去的地点。

2.根据权利要求1所述的一种基于社交网络的用户行为预测方法，其特征在于：所述步骤S1包括以下步骤：
S1.1：采集ego用户的移动行为记录；
S1.2：采集alter用户列表及其移动行为记录；
S1.3：对ego数据和alter数据进行筛选，获取ego用户最早行为的时间ta和最晚行为的时间tb，去除alter数据在[ta,tb]之外的数据。

3.根据权利要求1或2所述的一种基于社交网络的用户行为预测方法，其特征在于：所述步骤S2包括以下步骤：
S2.1：对于初始数据集中的所有地点数据进行自适应的DBSCAN聚类；
S2.2：按以下规则构建用户行为影响网络：
2.2.1.用户和其所有的朋友构建成一个网络，网络中的节点是用户去过的地点。对于用户来说，连边构建规则是用户前一次去过的地点节点指向用户后一次去过的地点节点。对于用户的朋友来说，也是根据朋友前一次去过的地点节点指向朋友后一次去过的地点节点；对于用户地点节点和朋友地点节点之间的连边，按以下规则建立：记朋友去过的一个地点节点为A，访问A节点的时刻为Ta，用户去过的一个地点节点为B，访问B节点的时刻为Tb，若Tb-Ta<t，其中t是一个可调参数，那么地点A节点和地点B节点之间建立连边；
2.2.2.网络中连边的权重按以下规则建立，用户行为数据上的连边以及朋友行为数据上的连边，权重都...

【专利技术属性】
技术研发人员：傅晨波，夏镒楠，高诚裕，何浩男，邱君瀚，李一帆，岳昕晨，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人