一种用户画像优化方法技术

技术编号:35369329 阅读:8 留言:0更新日期:2022-10-29 18:10
本申请提供一种用户画像优化方法,包括:获取用户数据并进行有效性检验;用户原始数据进行向量化处理;根据用户画像向量构建用户元画像;使用用户数据建立一般用户标签画像;通过聚类距离判定画像标签确定度;根据标签内容划分用户标签种类;根据元画像接受度类型决定用户画像交互方式;通过分析用户接受度,判断可交互画像的类别、层级和数量;根据不同场景类别设计进行不同的标签交互;用户对自我画像标签进行交互修正;针对用户修改后的画像,进行双重推荐置信度检验;根据用户交互行为重新定义用户画像接受类型。定义用户画像接受类型。定义用户画像接受类型。

【技术实现步骤摘要】
一种用户画像优化方法


[0001]本专利技术涉及信息
,尤其涉及一种用户画像优化方法。

技术介绍

[0002]用户对自身的画像都是无法感知的,只有系统后台通过数据库数据记录。但是,用户画像有时会跟用户真实情况脱节,因此有必要通过确认或者通过少量交互提示来达到更好的画像修改。例如,通过跟用户确认,他的画像推荐了这些,有哪些是他不喜欢的,来避免错误推荐。目前多数画像系统、推荐系统采用后台画像推荐算法,整个过程通过收集用户数据实现,用户基本没有修改调整的权利。本方法通过将系统后台画像,展示给用户,或者通过间接途径,使用户能感知部分画像,方便用户参与画像设计过程中,进行自我优化和改良。通过交互式的用户画像能够实现更好的用户画像刻画,以及用户服务推荐。但是,应该在什么场景进行交互,能够展示多么详细的画像标签,是否可以告诉用户他的很多私人标签。这些都是不确定的,向一个不喜欢进行用户画像的用户交互,可能会引起用户反感。为了识别用户对画像交互的接受情况,需要对用户进行最初的个人关于用户画像的画像识别,即元画像。

技术实现思路

[0003]本专利技术提供了一种用户画像优化方法,主要包括:获取用户数据并进行有效性检验;用户原始数据进行向量化处理;根据用户画像向量构建用户元画像;使用用户数据建立一般用户标签画像;通过聚类距离判定画像标签确定度;根据标签内容划分用户标签种类;根据元画像接受度类型决定用户画像交互方式;通过分析用户接受度,判断可交互画像的类别、层级和数量;根据不同场景类别设计进行不同的标签交互;用户对自我画像标签进行交互修正;针对用户修改后的画像,进行双重推荐置信度检验;根据用户交互行为重新定义用户画像接受类型;进一步可选地,所述获取用户数据并进行有效性检验包括:绘制用户画像,需要多维用户数据,根据用户画像使用需要,确定数据收集维度;若用户不允许访问个人数据,或不接受进行交互推荐,则放弃为用户画像,放弃进行用户画像交互;若用户允许访问个人数据,愿意进行交互推荐,则获取用户基本个人数据,用户隐私偏好设置,以及用户行为习惯数据;对数据进行预处理,通过数据冲突判断,检测用户数据是否完整,对用户数据进行数据清洗。
[0004]进一步可选地,所述用户原始数据进行向量化处理包括:获取用户原始数据,判断数据是否与用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关,如果数据相关,则将数据划分为用户客观数据;如果数据与浏览内容、浏览时间、浏览频率相关,则将数据划分为用户行为数据;用户客观数据采用独热码将离散型变量数据化,用向量化处理,获取用户客观信息向量;用户行为数据采用统计方法,对用户行为数据进行加权求和,排列用户行为数据,建立用户行为偏好向量;将用户客观信息向
量和用户行为偏好向量组合,构成用户画像向量,作为用户画像数据基础。
[0005]进一步可选地,所述根据用户画像向量构建用户元画像包括:随机选择相同数量开启用户画像交互和关闭用户画像交互的用户;从选择用户的用户画像向量中,获取用户客观数据中用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关数据,作为用户分类数据;对用户分类数据进行归一化处理,去除取值尺度的影响;将用户分类数据投射到高维数据空间中,假设存在高维超平面P,按照用户是否支持进行用户画像交互维度进行划分;分别计算用户分类数据与假设超平面之间的欧式距离D,所有用户与平面之间的距离和记作DP;以最小化DP作为高维超平面优化条件,获得高维超平面也就是支持向量;根据用户向量与支持向量的距离D,D小于设定的阈值,则划分为不确定型,D大于设定的阈值,且在支持向量正向,则划分为积极型,D大于设定的阈值,且在支持向量负向,则划分为保守型;不同类别用户对于用户画像交互接受度不同;将用户交互支持判断结果和用户基本数据组合,建立用户元画像。
[0006]进一步可选地,所述使用用户数据建立一般用户标签画像包括:对所有用户,获取用户画像向量,选择用户画像方向,针对每一维度方向数据进行聚类分析,获取聚类中心向量;选择聚类中心设定阈值范围内用户的用户客观信息向量和用户行为偏好向量;将用户客观信息向量按照独热码规则,反推出离散型变量,提取离散型变量名称;提取用户行为偏好向量中设定阈值排名之前的用户浏览主题;对离散型变量名称进行统计分析,以重复最多的字词作为用户基本标签;对用户浏览主题进行统计分析,以重复最多的浏览主图作为用户行为标签;将用户基本标签和用户行为标签整合,构建一般用户画像。
[0007]进一步可选地,所述通过聚类距离判定画像标签确定度包括:获取聚类中心向量以及用户画像向量,计算用户画像向量与聚类中心的欧式距离;根据距离大小,衡量用户标签的确定度;距离小于设定的阈值,则判定用户标签为确定性标签;距离大于设定的阈值,则判定用户标签为模糊类标签;将标签判定结果添加到一般用户画像中,标识一般用户画像的标签,重构为一般用户画像。
[0008]进一步可选地,所述根据标签内容划分用户标签种类包括:对于一般用户画像中的画像标签进行自然语言分析处理,判断标签是否涉及关键信息;若标签涉及营销类信息,将标签归入营销类标签中;若标签涉及个人隐私信息,需要额外判断标签是否属于确定性标签;如果属于模糊类标签,展示可能引起用户反感,则拒绝在用户画像交互过程中展示;将其他不涉及关键信息的标签,归入通用类标签。
[0009]进一步可选地,所述根据元画像接受度类型决定用户画像交互方式包括:根据元画像中将用户划分为保守型,积极型,不确定型三类;不同类型元画像的用户,对于用户画像交互行为接受度不一致,需要设计不同的交互方式;积极型用户愿意接受全面用户画像交互,不确定型用户愿意接受部分交互方式,保守型不愿意接受公开用户画像交互方式;对于积极型用户,提供展示用户画像标签,增加、减少用户标签机会,以及用户自定义画像标签的主动交互机会;对于不确定型用户,选择展示部分用户画像标签、增删用户标签的主动交互方式;对于保守型用户,由系统进行后台数据画像,用户对不满意标签进行删除,但无法添加和修改标签,减少用户画像交互参与度,由画像系统收集数据,调整用户画像;对于模糊类、个人隐私、营销类标签交互,提供弹窗询问的交互模式。
[0010]进一步可选地,所述通过分析用户接受度,判断可交互画像的类别、层级和数量包括:根据用户对于用户画像交互的元画像分类,每个用户展示出的用户画像标签内容和详细程度也有所不同;对于保守型用户,不进行主动用户画像交互,推荐算法按照设置正常运行;对于不确定型用户,提供营销类标签,通用类标签,不提供隐私类标签;对于积极型用户,提供所有类别标签;根据用户接受度判定用户画像交互标签提供数量和标签层级,接受度越高,标签提供数量越多,标签层级越深入。
[0011]进一步可选地,所述根据不同场景类别设计进行不同的标签交互包括:采集交互场景的地址信息,从地址信息数据库中检索判断是否为常见场景,识别场景类型;若地址信息不在检索范围内,采集进行用户画像交互的场景信息、标题文字,通过统计分析识别得出出现频率最高的文字,判断场景主题;根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户画像优化方法,其特征在于,所述方法包括:获取用户数据并进行有效性检验;用户原始数据进行向量化处理;根据用户画像向量构建用户元画像;使用用户数据建立一般用户标签画像;通过聚类距离判定画像标签确定度;根据标签内容划分用户标签种类;根据元画像接受度类型决定用户画像交互方式;通过分析用户接受度,判断可交互画像的类别、层级和数量;根据不同场景类别设计进行不同的标签交互;用户对自我画像标签进行交互修正;针对用户修改后的画像,进行双重推荐置信度检验;根据用户交互行为重新定义用户画像接受类型。2.根据权利要求1所述的方法,其中,所述获取用户数据并进行有效性检验,包括:绘制用户画像,需要多维用户数据,根据用户画像使用需要,确定数据收集维度;若用户不允许访问个人数据,或不接受进行交互推荐,则放弃为用户画像,放弃进行用户画像交互;若用户允许访问个人数据,愿意进行交互推荐,则获取用户基本个人数据,用户隐私偏好设置,以及用户行为习惯数据;对数据进行预处理,通过数据冲突判断,检测用户数据是否完整,对用户数据进行数据清洗。3.根据权利要求1所述的方法,其中,所述用户原始数据进行向量化处理,包括:获取用户原始数据,判断数据是否与用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关,如果数据相关,则将数据划分为用户客观数据;如果数据与浏览内容、浏览时间、浏览频率相关,则将数据划分为用户行为数据;用户客观数据采用独热码将离散型变量数据化,用向量化处理,获取用户客观信息向量;用户行为数据采用统计方法,对用户行为数据进行加权求和,排列用户行为数据,建立用户行为偏好向量;将用户客观信息向量和用户行为偏好向量组合,构成用户画像向量,作为用户画像数据基础。4.根据权利要求1所述的方法,其中,所述根据用户画像向量构建用户元画像,包括:随机选择相同数量开启用户画像交互和关闭用户画像交互的用户;从选择用户的用户画像向量中,获取用户客观数据中用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关数据,作为用户分类数据;对用户分类数据进行归一化处理,去除取值尺度的影响;将用户分类数据投射到高维数据空间中,假设存在高维超平面,按照用户是否支持进行用户画像交互维度进行划分;分别计算用户分类数据与假设超平面之间的距离,所有用户与平面之间的距离和记作;以分类器作为分类条件,获得高维超平面也就是支持向量;根据用户向量与支持向量的距离,小于设定的阈值,则划分为不确定型,大于设定的阈值,且在支持向量正向,则划分为积极型,大于设定的阈值,且在支持向量负向,则划分为保守型;不同类别用户对于用户画像交互接受度不同;将用户交互支持判断结果和用户基本数据组合,建立用户元画像。5.根据权利要求1所述的方法,其中,所述使用用户数据建立一般用户标签画像,包括:对所有用户,获取用户画像向量,选择用户画像方向,针对每一维度方向数据进行聚类分析,获取聚类中心向量;选择聚类中心设定阈值范围内用户的用户客观信息向量和用户行为偏好向量;将用户客观信息向量按照独热码规则,反推出离散型变量,提取离散型变量名称;提取用户行为偏好向量中设定阈值排名之前的用户浏览主题;对离散型变量名称进行统计分析,以重复最多的字词作为用户基本标签;对用户浏览主题进行统计分析,以重复最多的浏览主图作为用户行为标签;将用户基本标签和用户行为标签整合,构建一般用户画像。
6.根据权利要求1所述的方法,其中,所述通过聚类距离判定画像标签确定度,包括:获取聚类中心向量以及用户画像向量,计算用户画像向量与聚类中心的欧式距离;根据距离大小,衡量用户标签的确定度;距离小于设定的阈值,则判定用户标签为确定性标签;距离大于设定的阈值,则判定用户标签为模糊类标签;将标签判定结果添加到一般用户画像中,标识一般用户画像的标签,重构为一般用户画像。7.根据权利要求1所述的方法,其中,所述根据标签内容划分用户标签种类,包括:对于一般用户画像中的画像标签进行自然语言分析处理,判断标签是否涉及关键信息;若标签涉及营销类信息,将标签归入营销类标签中;若标签涉及个人隐私信息...

【专利技术属性】
技术研发人员:彭飞凌刘玲玲
申请(专利权)人:数效深圳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1