【技术实现步骤摘要】
一种用户画像优化方法
[0001]本专利技术涉及信息
,尤其涉及一种用户画像优化方法。
技术介绍
[0002]用户对自身的画像都是无法感知的,只有系统后台通过数据库数据记录。但是,用户画像有时会跟用户真实情况脱节,因此有必要通过确认或者通过少量交互提示来达到更好的画像修改。例如,通过跟用户确认,他的画像推荐了这些,有哪些是他不喜欢的,来避免错误推荐。目前多数画像系统、推荐系统采用后台画像推荐算法,整个过程通过收集用户数据实现,用户基本没有修改调整的权利。本方法通过将系统后台画像,展示给用户,或者通过间接途径,使用户能感知部分画像,方便用户参与画像设计过程中,进行自我优化和改良。通过交互式的用户画像能够实现更好的用户画像刻画,以及用户服务推荐。但是,应该在什么场景进行交互,能够展示多么详细的画像标签,是否可以告诉用户他的很多私人标签。这些都是不确定的,向一个不喜欢进行用户画像的用户交互,可能会引起用户反感。为了识别用户对画像交互的接受情况,需要对用户进行最初的个人关于用户画像的画像识别,即元画像。
技术实现思路
[0003]本专利技术提供了一种用户画像优化方法,主要包括:获取用户数据并进行有效性检验;用户原始数据进行向量化处理;根据用户画像向量构建用户元画像;使用用户数据建立一般用户标签画像;通过聚类距离判定画像标签确定度;根据标签内容划分用户标签种类;根据元画像接受度类型决定用户画像交互方式;通过分析用户接受度,判断可交互画像的类别、层级和数量;根据不同场景类别设计进行不同的标签交互;用户对自我 ...
【技术保护点】
【技术特征摘要】
1.一种用户画像优化方法,其特征在于,所述方法包括:获取用户数据并进行有效性检验;用户原始数据进行向量化处理;根据用户画像向量构建用户元画像;使用用户数据建立一般用户标签画像;通过聚类距离判定画像标签确定度;根据标签内容划分用户标签种类;根据元画像接受度类型决定用户画像交互方式;通过分析用户接受度,判断可交互画像的类别、层级和数量;根据不同场景类别设计进行不同的标签交互;用户对自我画像标签进行交互修正;针对用户修改后的画像,进行双重推荐置信度检验;根据用户交互行为重新定义用户画像接受类型。2.根据权利要求1所述的方法,其中,所述获取用户数据并进行有效性检验,包括:绘制用户画像,需要多维用户数据,根据用户画像使用需要,确定数据收集维度;若用户不允许访问个人数据,或不接受进行交互推荐,则放弃为用户画像,放弃进行用户画像交互;若用户允许访问个人数据,愿意进行交互推荐,则获取用户基本个人数据,用户隐私偏好设置,以及用户行为习惯数据;对数据进行预处理,通过数据冲突判断,检测用户数据是否完整,对用户数据进行数据清洗。3.根据权利要求1所述的方法,其中,所述用户原始数据进行向量化处理,包括:获取用户原始数据,判断数据是否与用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关,如果数据相关,则将数据划分为用户客观数据;如果数据与浏览内容、浏览时间、浏览频率相关,则将数据划分为用户行为数据;用户客观数据采用独热码将离散型变量数据化,用向量化处理,获取用户客观信息向量;用户行为数据采用统计方法,对用户行为数据进行加权求和,排列用户行为数据,建立用户行为偏好向量;将用户客观信息向量和用户行为偏好向量组合,构成用户画像向量,作为用户画像数据基础。4.根据权利要求1所述的方法,其中,所述根据用户画像向量构建用户元画像,包括:随机选择相同数量开启用户画像交互和关闭用户画像交互的用户;从选择用户的用户画像向量中,获取用户客观数据中用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关数据,作为用户分类数据;对用户分类数据进行归一化处理,去除取值尺度的影响;将用户分类数据投射到高维数据空间中,假设存在高维超平面,按照用户是否支持进行用户画像交互维度进行划分;分别计算用户分类数据与假设超平面之间的距离,所有用户与平面之间的距离和记作;以分类器作为分类条件,获得高维超平面也就是支持向量;根据用户向量与支持向量的距离,小于设定的阈值,则划分为不确定型,大于设定的阈值,且在支持向量正向,则划分为积极型,大于设定的阈值,且在支持向量负向,则划分为保守型;不同类别用户对于用户画像交互接受度不同;将用户交互支持判断结果和用户基本数据组合,建立用户元画像。5.根据权利要求1所述的方法,其中,所述使用用户数据建立一般用户标签画像,包括:对所有用户,获取用户画像向量,选择用户画像方向,针对每一维度方向数据进行聚类分析,获取聚类中心向量;选择聚类中心设定阈值范围内用户的用户客观信息向量和用户行为偏好向量;将用户客观信息向量按照独热码规则,反推出离散型变量,提取离散型变量名称;提取用户行为偏好向量中设定阈值排名之前的用户浏览主题;对离散型变量名称进行统计分析,以重复最多的字词作为用户基本标签;对用户浏览主题进行统计分析,以重复最多的浏览主图作为用户行为标签;将用户基本标签和用户行为标签整合,构建一般用户画像。
6.根据权利要求1所述的方法,其中,所述通过聚类距离判定画像标签确定度,包括:获取聚类中心向量以及用户画像向量,计算用户画像向量与聚类中心的欧式距离;根据距离大小,衡量用户标签的确定度;距离小于设定的阈值,则判定用户标签为确定性标签;距离大于设定的阈值,则判定用户标签为模糊类标签;将标签判定结果添加到一般用户画像中,标识一般用户画像的标签,重构为一般用户画像。7.根据权利要求1所述的方法,其中,所述根据标签内容划分用户标签种类,包括:对于一般用户画像中的画像标签进行自然语言分析处理,判断标签是否涉及关键信息;若标签涉及营销类信息,将标签归入营销类标签中;若标签涉及个人隐私信息...
【专利技术属性】
技术研发人员:彭飞凌,刘玲玲,
申请(专利权)人:数效深圳科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。