System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据,特别是涉及一种用户交互行为的预测方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、随着内容生成和信息传播速度的优势,社交媒体已成为越来越多人每天使用的信息分享和在线互动工具。用户是社交网络的核心,用户的行为是理解社交网络运行机制的起点,因此,用户数据的分析可以揭示用户在线行为背后的用户偏好和行为模式,并为社交媒体的个性化推荐提供更丰富的支持。
2、然而,目前的用户数据分析方法包括页面排名、随机游走、迭代缩减决策树算法,上述方法存在计算速度慢、资源消耗多和无法有效处理复杂标签间关系的问题。因此,目前存在对社交媒体用户交互行为进行数据分析的过程中,效率较低的问题。
技术实现思路
1、基于此,有必要针对上述社交媒体用户交互行为进行数据分析的过程中,效率较低的技术问题,提供一种用户交互行为的预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种用户交互行为的预测方法,包括:
3、获取用户的历史交互行为数据;
4、对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息;所述类别分布信息包括每个数据点在至少一个类别下的隶属度,所述类别表示所述模糊聚类处理过程中不同的群组;
5、根据所述类别分布信息生成所述用户的兴趣文件,并基于所述兴趣文件得到所述用户的用户画像;
6、将所述用户画像输入训练好的用户行为预测模
7、在其中一个实施例中,所述对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息,包括:初始化包括所述每个数据点的模糊隶属度矩阵;所述模糊隶属度矩阵的每个元素表示所述数据点对各个类别的隶属度;针对每个数据点,获取所述数据点到预先设定的多个聚类中心的距离,根据所述距离更新所述模糊隶属度矩阵;在所述隶属度矩阵的变化低于预先设定的阈值或达到最大迭代次数时,得到所述每个数据点对应的类别分布信息。
8、在其中一个实施例中,在所述对所述历史交互行为数据进行模糊聚类处理,得到所述每个数据点对应的类别分布信息之后,包括:针对每个数据点,比较所述数据点对各个所述类别的隶属度与预设的目标类别的隶属度阈值,当任一个类别对应的隶属度大于所述预设隶属度阈值时,将所述任一个类别作为所述用户的行为对应的目标类别;根据所述目标类别生成所述用户的兴趣文件。
9、在其中一个实施例中,所述训练好的用户行为预测模型通过以下方式训练得到:获取样本用户的用户画像;对所述用户画像进行特征提取,得到所述样本用户的交互行为特征;以所述交互行为特征为输入变量,对初始用户行为预测模型进行训练,得到所述训练好的用户行为预测模型。
10、在其中一个实施例中,所述基于所述兴趣文件得到所述用户的用户画像,包括:获取所述兴趣文件中的短期兴趣和长期兴趣;根据不同时间区间内所述用户在不同所述类别的行为强度,分别将所述短期兴趣和长期兴趣表示为短期行为向量和长期行为向量;基于所述短期行为向量和所述长期行为向量,得到所述用户的用户画像。
11、在其中一个实施例中,所述对所述历史交互行为数据进行模糊聚类处理,包括:对所述历史交互行为数据进行去重、去噪以及格式化处理,得到清洗后的数据;将所述清洗后的数据转化为统一的小写形式、去除停用词并且提取关键词。
12、在其中一个实施例中,在所述将所述用户画像输入训练好的用户行为预测模型,得到所述用户的交互行为预测结果之后,包括:将所述交互行为预测结果展示在社交媒体平台,并基于所述交互行为预测结果生成所述用户的推荐列表。
13、第二方面,本申请还提供了一种用户交互行为的预测装置,包括:
14、数据获取模块,用于获取用户的历史交互行为数据;
15、数据处理模块,用于对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息;所述类别分布信息包括每个数据点的至少一个类别的隶属度,所述类别表示所述模糊聚类处理过程中不同的群组;
16、用户画像生成模块,用于根据所述类别分布信息生成所述用户的兴趣文件,并基于所述兴趣文件得到所述用户的用户画像;
17、预测结果获取模块,用于将所述用户画像输入训练好的用户行为预测模型,得到所述用户的交互行为预测结果。
18、第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
19、获取用户的历史交互行为数据;
20、对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息;所述类别分布信息包括每个数据点在至少一个类别下的隶属度,所述类别表示所述模糊聚类处理过程中不同的群组;
21、根据所述类别分布信息生成所述用户的兴趣文件,并基于所述兴趣文件得到所述用户的用户画像;
22、将所述用户画像输入训练好的用户行为预测模型,得到所述用户的交互行为预测结果。
23、第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
24、获取用户的历史交互行为数据;
25、对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息;所述类别分布信息包括每个数据点在至少一个类别下的隶属度,所述类别表示所述模糊聚类处理过程中不同的群组;
26、根据所述类别分布信息生成所述用户的兴趣文件,并基于所述兴趣文件得到所述用户的用户画像;
27、将所述用户画像输入训练好的用户行为预测模型,得到所述用户的交互行为预测结果。
28、第五方面,本申请还提供了一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
29、获取用户的历史交互行为数据;
30、对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息;所述类别分布信息包括每个数据点在至少一个类别下的隶属度,所述类别表示所述模糊聚类处理过程中不同的群组;
31、根据所述类别分布信息生成所述用户的兴趣文件,并基于所述兴趣文件得到所述用户的用户画像;
32、将所述用户画像输入训练好的用户行为预测模型,得到所述用户的交互行为预测结果。
33、上述用户交互行为的预测方法、装置、计算机设备、存储介质和计算机程序产品,在用户交互行为的预测的过程中,具有以下有益效果:首先获取用户的历史交互行为数据,能够真实的反映用户的行为及偏好,为后续预测过程提供了数据支持;然后对历史交互行为数据本文档来自技高网...
【技术保护点】
1.一种用户交互行为的预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息,包括:
3.根据权利要求2所述的方法,其特征在于,在所述对所述历史交互行为数据进行模糊聚类处理,得到所述每个数据点对应的类别分布信息之后,包括:
4.根据权利要求1所述的方法,其特征在于,所述训练好的用户行为预测模型通过以下方式训练得到:
5.根据权利要求1所述的方法,其特征在于,所述基于所述兴趣文件得到所述用户的用户画像,包括:
6.根据权利要求1所述的方法,其特征在于,所述对所述历史交互行为数据进行模糊聚类处理,包括:
7.根据权利要求1所述的方法,其特征在于,在所述将所述用户画像输入训练好的用户行为预测模型,得到所述用户的交互行为预测结果之后,包括:
8.一种用户交互行为的预测装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种用户交互行为的预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述历史交互行为数据进行模糊聚类处理,得到所述历史交互行为数据中的每个数据点对应的类别分布信息,包括:
3.根据权利要求2所述的方法,其特征在于,在所述对所述历史交互行为数据进行模糊聚类处理,得到所述每个数据点对应的类别分布信息之后,包括:
4.根据权利要求1所述的方法,其特征在于,所述训练好的用户行为预测模型通过以下方式训练得到:
5.根据权利要求1所述的方法,其特征在于,所述基于所述兴趣文件得到所述用户的用户画像,包括:
6.根据权利要求...
【专利技术属性】
技术研发人员:徐梓桐,陈维汉,肖建毅,刘诚,蔡海滨,
申请(专利权)人:南方电网数字企业科技广东有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。