一种用户画像构建方法、系统、设备及存储介质技术方案

技术编号：34406175 阅读：22 留言：0更新日期：2022-08-03 21:52

本发明专利技术公开了一种用户画像构建方法、系统、设备及存储介质，S1，获取用户数据；S2，采用词嵌入模型对用户数据进行处理，得到嵌入词向量；S3，使用Kmeans聚类算法对嵌入词向量进行聚类分析，得到聚类结果；S4，使用KNN模型对嵌入词向量中的匿名用户分类，并打上对应的标签，得到所有用户的标签；S5，根据嵌入词向量、聚类结果和用户的标签，构建出用户画像模型。可以将虚假用户有效删除，提高数据的真实性，构建出精准实时的用户画像模型。构建出精准实时的用户画像模型。构建出精准实时的用户画像模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种用户画像构建方法、系统、设备及存储介质

[0001]本专利技术属于推荐算法领域，涉及一种用户画像构建方法、系统、设备及存储介质。

技术介绍

[0002]“交互设计之父”Alan Cooper提出了用户画像的概念，Alan Cooper认为用户画像是真实用户的虚拟表示，是建立在一系列真实属性数据之上的目标用户模型。用户画像是根据大量用户的真实信息构建用户标签体系，将用户的基础数据、行为数据和兴趣进行特征化处理进而形成虚拟的用户模型，会将一个真实的用户全面、动态的表示出来。用户画像在推荐系统中起着至关重要的作用，一个优秀的用户画像会大大提升推荐系统的推荐效率。用户画像可分为以下四种流派：
[0003](1)用户画像行为流派
[0004]用户画像行为流派根据用户的真实行为数据构建用户画像模型。用户行为数据是指用户在操作某网站时留下来的行为痕迹，比如用户在某电商网站中浏览、点击、加购物车和购买等行为表现。用户画像行为流派通过用户的与系统交互作用时所表现出来的行为数据构建用户画像模型，主要对用户行为数据进行研究。
[0005]国外的研究主要有：Adomavicius等人通过对用户阅读时间和点击率等行为进行构建了用户画像模型，该模型可以有效的分析到用户的行为特征。Svendsen等人认为性格和接受技术程度有很大关系，以性格和接受技术程度作为行为特征构建用户画像模型，该模型可以明显的发现技术接受程度与人的性格之间的关系，发现性格比较内向的人接受技术程度不高，而越外向的人接受技术的程度越高，该模型也可以有...

【技术保护点】

【技术特征摘要】
1.一种用户画像构建方法，其特征在于，包括以下过程：S1，获取用户数据；S2，采用词嵌入模型对用户数据进行处理，得到嵌入词向量；S3，使用Kmeans聚类算法对嵌入词向量进行聚类分析，得到聚类结果；S4，使用KNN模型对嵌入词向量中的匿名用户分类，并打上对应的标签，得到所有用户的标签；S5，根据嵌入词向量、聚类结果和用户的标签，构建出用户画像模型。2.根据权利要求1所述的用户画像构建方法，其特征在于，S1中，用户数据包括用户基本数据、用户行为数据和物品属性数据。3.根据权利要求2所述的用户画像构建方法，其特征在于，用户基本数据为用户的基本信息；用户行为数据为用户的订单信息；物品属性数据为该订单所属物品的信息。4.根据权利要求1所述的用户画像构建方法，其特征在于，S1结束进入S2之前，对用户数据进行清洗和过滤。5.根据权利要求1所述的用户画像构建方法，其特征在于，S1结束进入S2之前，对用户数据进行关键词的特征提取。6.根据权利要求1所述的用户画像构建方法，其特征在于，S3中聚类分析的具体过程为：(1)在嵌入词向量中随机取k个用户，作为k个初始聚类中心用户u＝u1,u2,u3,...uk,；(2)对于嵌入词向量中的除了聚类中心用户u的每一个用户xi，分别计算xi到k个初始聚类用户u的欧氏距离，将距离小于阈值的xi分给相应的聚类中心u中；(3)对每一个聚类中心重新计算中心用户u，根据新的聚类中心用户使用步骤(2)重新聚类；(4)重复步骤(2)和步骤(3)，直到新的聚类中心用户和旧的聚类中心用户相...

【专利技术属性】
技术研发人员：刘江伟，叶娜，张翔，
申请(专利权)人：西安建筑科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人