一种基于集成学习的社交网络用户行为预测方法技术

技术编号:27286478 阅读:56 留言:0更新日期:2021-02-06 11:54
本发明专利技术公开了一种基于集成学习的社交网络用户行为预测方法,属于互联网技术领域,包括以下步骤:S1:获取多个数据组;S2:预处理;S3:得到多个一类用户行为预测模型;S4:相似度最高的一类用户行为预测模型为二类用户行为预测模型;S5:获取多个测试数据组;S6:预处理;S7:多个预测结果的准确率高于95%的二类用户行为预测模型得到三类用户行为预测模型;S8:根据三类用户行为预测模型对用户行为进行预测;本发明专利技术三类用户行为预测模型对用户行为预测的准确率高于95%,能够保证用户行为预测的准确率。准确率。准确率。

【技术实现步骤摘要】
一种基于集成学习的社交网络用户行为预测方法


[0001]本专利技术属于互联网
,具体涉及一种基于集成学习的社交网络用户行为预测方法。

技术介绍

[0002]随着Internet的迅速普及,社交网络开始在大众生活中扮演重要的角色,人们通过社交网络进行学习正在成为一种重要的学习方式,而社交网络载体上所表露出来的信息主要由用户行为产生,因此,预测社交网络用户的行为,可有效地了解用户的信息,对推广互联网产品、精准投放广告、推送个性化的内容、提供产品后期服务等方面具有重大意义。
[0003]现有技术存在以下问题:现有基于社交学习的集成化用户行为预测方法在用户行为预测模型的建立上稍显简单,导致后续用户行为预测模型在对用户行为进行预测时准确率较低。

技术实现思路

[0004]为解决上述
技术介绍
中提出的问题。本专利技术提供了一种基于集成学习的社交网络用户行为预测方法,具有能够保证用户行为预测准确率的特点。
[0005]为实现上述目的,一种基于集成学习的社交网络用户行为预测方法,包括以下步骤:
[0006]S1:通过网络爬虫技术获取用户在不同时间段内操作行为的数据,并分成多个数据组;
[0007]S2:对获取的多个数据组进行预处理;
[0008]S3:根据多组预处理后的数据分别得到多个一类用户行为预测模型;
[0009]S4:对比多个一类用户行为预测模型间的相似度,相似度最高的为二类用户行为预测模型;
[0010]S5:通过网络爬虫技术随机获取不同用户在不同时间段内与社交网络学习相关的数据,并分成多个测试数据组;
[0011]S6:对获取的多个测试数据组进行预处理;
[0012]S7:将多个预处理后的测试数据组分别导入二类用户行为预测模型中,观察二类用户行为预测模型的预测结果,多个预测结果的准确率高于95%,得到三类用户行为预测模型;
[0013]S8:根据三类用户行为预测模型对用户行为进行预测。
[0014]本专利技术中进一步的,所述步骤S2以及步骤S6中,预处理的具体操作为:剔除有错误或有问题的数据。
[0015]本专利技术中进一步的,所述步骤S7中,二类用户行为预测模型得到三类用户行为预测模型的具体操作为:若多个预测结果的准确率高于95%,则直接得到三类用户行为预测模型,若多个预测结果的准确率低于95%,重复步骤S1~S6,直至多个预测结果的准确率高
于95%得到三类用户行为预测模型为止。
[0016]与现有技术相比,本专利技术的有益效果是:
[0017]1、本专利技术通过三类用户行为预测模型对用户行为进行预测,三类用户行为预测模型是经过多个数据组得到一类用户行为预测模型、对比多个一类用户行为预测模型确定相似度最高的得到二类用户行为预测模型以及多个测试数据组测试二类用户行为预测模型,预测准确率要求高于95%才最终得到的,能够保证用户行为预测的准确率。
[0018]2、本专利技术在得到一类用户行为预测模型前,会对多个数据组进行预处理,剔除数据组中有错误或有问题的数据,同时多个测试数据组导入二类用户行为预测模型前,会对多个测试数据组进行预处理,剔除测试数据组中有错误或有问题的数据,能够减少无关数据对用户行为预测模型建立产生的影响,加快用户行为预测模型的建立速率。
附图说明
[0019]图1为本专利技术的流程图;
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]请参阅图1,本专利技术提供以下技术方案:一种基于集成学习的社交网络用户行为预测方法,包括以下步骤:
[0022]S1:通过网络爬虫技术获取用户在不同时间段内操作行为的数据,并分成多个数据组;
[0023]S2:对获取的多个数据组进行预处理;
[0024]S3:根据多组预处理后的数据分别得到多个一类用户行为预测模型;
[0025]S4:对比多个一类用户行为预测模型间的相似度,相似度最高的为二类用户行为预测模型;
[0026]S5:通过网络爬虫技术随机获取不同用户在不同时间段内与社交网络学习相关的数据,并分成多个测试数据组;
[0027]S6:对获取的多个测试数据组进行预处理;
[0028]S7:将多个预处理后的测试数据组分别导入二类用户行为预测模型中,观察二类用户行为预测模型的预测结果,多个预测结果的准确率高于95%,得到三类用户行为预测模型;
[0029]S8:根据三类用户行为预测模型对用户行为进行预测。
[0030]具体的,步骤S2以及步骤S6中,预处理的具体操作为:剔除有错误或有问题的数据,
[0031]通过采用上述技术方案,能够减少无关数据对用户行为预测模型建立产生的影响,加快用户行为预测模型的建立速率。
[0032]具体的,步骤S7中,二类用户行为预测模型得到三类用户行为预测模型的具体操
作为:若多个预测结果的准确率高于95%,则直接得到三类用户行为预测模型,若多个预测结果的准确率低于95%,重复步骤S1~S6,直至多个预测结果的准确率高于95%得到三类用户行为预测模型为止,
[0033]通过采用上述技术方案,提高三类用户行为预测模型对用户行为预测的准确率。
[0034]本专利技术的工作原理及使用流程:
[0035]S1:通过网络爬虫技术获取用户在不同时间段内操作行为的数据,并分成多个数据组;
[0036]S2:对获取的多个数据组进行预处理;
[0037]S3:根据多组预处理后的数据分别得到多个一类用户行为预测模型;
[0038]S4:对比多个一类用户行为预测模型间的相似度,相似度最高的为二类用户行为预测模型;
[0039]S5:通过网络爬虫技术随机获取不同用户在不同时间段内与社交网络学习相关的数据,并分成多个测试数据组;
[0040]S6:对获取的多个测试数据组进行预处理;
[0041]S7:将多个预处理后的测试数据组分别导入二类用户行为预测模型中,观察二类用户行为预测模型的预测结果,多个预测结果的准确率高于95%,得到三类用户行为预测模型;
[0042]S8:根据三类用户行为预测模型对用户行为进行预测。
[0043]尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由所附权利要求及其等同物限定。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的社交网络用户行为预测方法,其特征在于,包括以下步骤:S1:通过网络爬虫技术获取用户在不同时间段内操作行为的数据,并分成多个数据组;S2:对获取的多个数据组进行预处理;S3:根据多组预处理后的数据分别得到多个一类用户行为预测模型;S4:对比多个一类用户行为预测模型间的相似度,相似度最高的为二类用户行为预测模型;S5:通过网络爬虫技术随机获取不同用户在不同时间段内与社交网络学习相关的数据,并分成多个测试数据组;S6:对获取的多个测试数据组进行预处理;S7:将多个预处理后的测试数据组分别导入二类用户行为预测模型中,观察二类用户行为预测模型的预测结果,多个预测结果的准确率...

【专利技术属性】
技术研发人员:韩宇
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1