基于行为数据的用户画像的生成方法和生成系统技术方案

技术编号：43552277 阅读：34 留言：0更新日期：2024-12-03 12:35

本发明专利技术公开了一种基于行为数据的用户画像的生成方法和生成系统，包括获取所述用户的第一行为数据、所述用户身份数据，并实时更新所述第一行为数据，记录所述第一行为数据的时间戳。判断是否产生第二用户行为数据，并更新所述用户行为数据序列。将更新后的用户行为数据序列输入到长短期记忆网络‑贝叶斯模块，得到用户的兴趣标签将所述兴趣标签转换为转换器模型的输入格式，特征提取所述用户兴趣标签序列，得到所述用户兴趣标签的全局特征向量。根据用户兴趣标签的全局特征向量和所述用户身份数据，生成所述用户画像。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网，尤其涉及一种基于行为数据的用户画像的生成方法和系统。

技术介绍

1、在当前的融媒体平台中，用户对内容的点击、浏览、转发和评论等行为数据蕴含着用户的兴趣和偏好。特别是以用户群体为对象，建立针对融媒体平台的群体性用户画像，能够帮助平台更好地理解和细分用户群体，从而提供更为精准和个性化的内容推荐与服务。这对于增强用户粘性、提升用户体验和满意度具有重要意义。通过用户画像，融媒体平台可以洞察用户需求和行为模式，优化内容创作和传播策略，实现精准营销，提高运营效率。同时，这也有助于平台挖掘新的商业价值，推动媒体融合向纵深发展。

2、然而，现有的技术在群体性用户画像往往忽略了用户行为数据的时序特性，未能有效整合用户行为序列，从而影响了用户画像的准确性和群体性分析的深度。这种忽略可能带来以下不利影响：画像准确性降低，未能整合用户行为序列会导致无法捕捉用户行为的发展趋势和模式变化，从而影响用户画像的准确性和时效性：缺乏时序分析的画像无法为用户提供根据其行为演变定制的个性化服务，可能导致用户体验下降，不能实时或近实时地响应用户行为变化，可能导致平台对用户需求的响应滞后。

3、目前领域内的前沿方向包括利用深度学习技术处理时序数据，以及通过大规模并行计算提取用户兴趣标签的全局特征和相互关系，但存在的主要挑战包括：如何动态更新用户行为序列以及如何准确高效地输出用户群体典型代表性行为兴趣标签的问题始终没能解决。具体来看，用户行为数据量巨大，且需要实时更新，这对数据存储和处理系统的性能提出了极高要求。动态更新行为序

技术实现思路

1、针对上述缺陷，本专利技术解决的技术问题在于，提供一种基于行为数据的用户画像的生成方法，通过时域滚动方式持续更新用户行为序列数据，并结合长短期记忆网络-贝叶斯模块和转换器模型，准确输出用户行为兴趣标签，并形成具有深度和广度的群体性用户画像，以提高融媒体内容推荐的准确性和个性化程度，解决现有技术中用户行为数据利用不充分和用户画像更新不及时的问题。

2、本专利技术第一方面提供了一种基于行为数据的用户画像的生成方法，包括：

3、s101：获取所述用户的第一行为数据、所述用户身份数据，并实时更新所述第一行为数据，记录所述第一行为数据的时间戳。

4、s102：判断是否产生第二用户行为数据，并更新所述用户行为数据序列。

5、s103：将更新后的用户行为数据序列输入到长短期记忆网络-贝叶斯模块，得到用户的兴趣标签。

6、s104：将所述兴趣标签转换为转换器模型的输入格式，特征提取所述用户兴趣标签序列，得到所述用户兴趣标签的全局特征向量。

7、s105：根据用户兴趣标签的全局特征向量和所述用户身份数据，生成所述用户画像。

8、根据本专利技术的一个实施例，所述步骤s102中，判断是否产生第二用户行为数据，并更新所述用户行为数据，包括：s201：设置固定采样时间周期，并记录所述固定采样时间周期内的第一用户行为数据。

9、s202：判断是否产生第二用户行为数据，如果产生所述第二用户行为数据，将所述第一用户行为数据中非固定采样时间周期的用户行为数据删除，更新所述用户行为数据序列，包括：

10、记录产生第二用户行为数据的时间戳，判断所述第二用户行为数据时间戳与所述第一用户行为的时间戳差值是否小于所述固定采样时间周期。

11、如果所述第二用户行为数据时间戳与所述第一用户行为的时间戳差值小于所述固定采样时间周期，记录所述第二用户行为数据。

12、如果所述第二用户行为数据时间戳与所述第一用户行为的时间戳差值不小于所述固定采样时间周期，删除所述第一用户行为数据。

13、根据本专利技术的一个实施例，所述步骤s103中，将更新后的用户行为数据序列输入到长短期记忆网络-贝叶斯模块，得到用户的兴趣标签，包括：采用贝叶斯公式，预测用户的兴趣标签，如式（1）所示。

14、式（1）

15、其中，表示给定行为序列下用户具有特定标签的概率，表示具有特定标签的用户产生该行为数据序列的概率，是先验概率，表示用户具有该标签的固有概率，是用户行为数据序列的边缘概率。

16、根据本专利技术的一个实施例，所述步骤s104中，将所述兴趣标签转换为转换器模型的输入格式，特征提取所述用户兴趣标签序列，得到所述用户兴趣标签的全局特征向量，包括：

17、所述兴趣标签被嵌入向量，形成序列，表示如式（2）：

18、式（2）

19、其中，e1,e2,...,en表示所述每个兴趣被嵌入的向量，表示被嵌入向量后形成的兴趣标签序列。

20、再在所述嵌入向量中添加位置编码，如式（3）所示：

21、式（3）

22、其中，表示被嵌入向量添加位置信息后形成的兴趣标签序列。

23、所述位置编码，如式（4）表示：

24、式（4）

25、其中，是位置索引，是向量维度索引，是所述嵌入向量的维度。

26、通过自注意力多头注意力机制，提取所述用户兴趣序列的全局特征向量。

27、本专利技术第二方面提供了一种基于行为数据的用户画像的生成系统，所述系统包括：

28、获取模块，用于获取所述用户的第一行为数据、所述用户身份数据，并实时更新所述第一行为数据，记录所述第一行为数据的时间戳。

29、更新模块，用于判断是否产生第二用户行为数据，并更新所述用户行为数据序列。

30、第一计算模块，用于将更新后的用户行为数据序列输入到长短期记忆网络-贝叶斯模块，得到用户的兴趣标签。

31、第二计算模块，用于将所述兴趣标签转换为转换器模型的输入格式，特征提取所述用户兴趣标签序列，得到所述用户兴趣标签的全局特征向量。

32、第三计算模块，用于根据用户兴趣标签的全局特征向量和所述用户身份数据，生成所述用户画像。

33、本专利技术第三方面提供了一种智能设备，包括发送器、接收器、存储器和处理器；所述存储器用于存储计算机指令；所述处理器用于运行所述存储器存储的所述计算机指令实现以上基于行为数据的用户画像的生成方法。

34、本专利技术第四方面提供了一种存储介质，包括：可读存储介质和计算机指令，所述计算机指令存储在所述可读存储介质中；所述计算机指令用于实现以上所述基于行为数据的用户画像的生成方法。

35、本专利技术提供的有益效果：通过时域滚动方式持续更新用户行为序列数据，避免了计算的冗余，同时能够有效捕捉本文档来自技高网...

【技术保护点】

1.基于行为数据的用户画像的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤S102中，判断是否产生第二用户行为数据，并更新所述用户行为数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述步骤S103中，将更新后的用户行为数据序列输入到长短期记忆网络-贝叶斯模块，得到用户的兴趣标签，包括：

4.根据权利要求3所述的方法，其特征在于，所述步骤S104中，将所述兴趣标签转换为转换器模型的输入格式，特征提取所述用户兴趣标签序列，得到所述用户兴趣标签的全局特征向量，包括：

5.根据权利要求4所述的方法，其特征在于，所述步骤S105中根据用户兴趣标签的全局特征向量和所述用户身份数据，生成所述用户画像，包括：

6.基于行为数据的用户画像的生成系统，其特征在于，所述系统包括：

7.一种智能设备，其特征在于，包括：发送器、接收器、存储器和处理器；

8.一种存储介质，其特征在于，包括：可读存储介质和计算机指令，所述计算机指令存储在所述可读存储介质中；所述计算机指令用于

...

【技术特征摘要】

1.基于行为数据的用户画像的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤s102中，判断是否产生第二用户行为数据，并更新所述用户行为数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述步骤s103中，将更新后的用户行为数据序列输入到长短期记忆网络-贝叶斯模块，得到用户的兴趣标签，包括：

4.根据权利要求3所述的方法，其特征在于，所述步骤s104中，将所述兴趣标签转换为转换器模型的输入格式，特征提取所述用户兴趣标签序列，得到所述用户兴趣标签...

【专利技术属性】
技术研发人员：燕宪文，
申请(专利权)人：北京同方凌讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人