本发明专利技术实施例提供一种用户标签挖掘方法、装置、服务器及存储介质,该方法包括:获取用户的行为日志;根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。本发明专利技术实施例可以提升挖掘的用户标签的精度,可应用于相似用户确定,推荐相似用户等场景。
【技术实现步骤摘要】
一种用户标签挖掘方法、装置、服务器及存储介质
本专利技术实施例涉及数据处理
,具体涉及一种用户标签挖掘方法、装置、服务器及存储介质。
技术介绍
用户标签是表示用户特性的标签信息,其可以作为用户画像的一部分,常用于用户聚类、信息推荐等场景;用户标签对于精细化用户运营至关重要,因此如何准确挖掘用户标签一直是本领域技术人员的研究热点。随着在线互联网平台的普及,用户的网上行为越来越多,因此如何利用用户的网上行为,提升挖掘的用户标签的精度,成为了难题。
技术实现思路
有鉴于此,本专利技术实施例提供一种用户标签挖掘方法、装置、服务器及存储介质,以提升挖掘的用户标签的精度。为实现上述目的,本专利技术实施例提供如下技术方案:第一方面,本专利技术实施例提供一种用户标签挖掘方法,包括:获取用户的行为日志;根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。结合第一方面,本专利技术实施例在第一方面的第一种实现方式中,所述用户信息为用户向量;所述方法还包括:根据所述行为日志,确定所述用户的搜索关键词;所述至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息包括:基于所述目标对象及所述搜索关键词生成所述用户的用户行为向量;将所述用户行为向量与所述用户的用户属性向量相拼接,得到所述用户向量。结合第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,所述用户属性向量包括:由所述用户的基础属性信息生成的基础属性向量,及由所述用户的连续信息生成的非线性向量,所述连续信息至少指示所述用户的用户价值。结合第一方面的第二种实现方式,本专利技术实施例在第一方面的第三种实现方式中,所述将所述用户行为向量与所述用户的用户属性向量相拼接,得到所述用户向量包括:利用机器学习模型的全链接层拼接所述用户行为向量与所述用户属性向量,得到所述用户向量;其中,所述全链接层的非线性激活函数处理所述非线性向量。结合第一方面,本专利技术实施例在第一方面的第四种实现方式中,所述迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小包括:根据所述用户向量与各对象的对象向量,确定所述用户针对各对象的输入向量;迭代优化根据所述用户针对各对象的输入向量所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与所述用户针对各对象的偏好标记值的误差最小。结合第一方面的第四种实现方式,本专利技术实施例在第一方面的第五种实现方式中,所述迭代优化根据所述用户针对各对象的输入向量所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与所述用户针对各对象的偏好标记值的误差最小包括:将所述用户针对各对象的输入向量,分别输入机器学习模型中对应的激活函数,其中,一个对象在所述机器学习模型中对应一个激活函数;以所述激活函数输出的所述用户针对各对象的偏好值,与所述用户针对各对象的偏好标记值的误差最小为优化目标,对所述机器学习模型的参数进行迭代优化,以得到优化后的机器学习模型;获取优化后的机器学习模型中的激活函数输出的所述用户针对各对象的偏好值。结合第一方面,本专利技术实施例在第一方面的第六种实现方式中,所述用户标签挖掘方法还包括:根据多个对象等级及各对象等级的多个对象评分档次,对初始对象进行分类,得到所述预设的多个对象。第二方面,本专利技术实施例还提供一种用户标签挖掘装置,包括:日志获取模块,用于获取用户的行为日志;目标对象确定模块,用于根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;用户信息确定模块,用于至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;优化模块,用于迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;用户标签生成模块,用于以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。第三方面,本专利技术实施例还提供一种服务器,包括至少一个存储器和至少一个处理器,所述存储器存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如上述所述的用户标签挖掘方法。第四方面,本专利技术实施例还提供一种存储介质,所述存储介质存储一条或多条计算机指令,所述一条或多条计算机指令用于实现如上述所述的用户标签挖掘方法。本专利技术实施例提供的用户标签挖掘方法,可以基于用户的行为日志,确定用户执行设定行为所针对的目标对象,从而至少基于目标对象确定出表示用户的行为偏好的用户信息;由于用户信息能够表示用户的行为偏好,因此本专利技术实施例可基于所述用户信息确定用户针对各对象的偏好值,为使得确定的用户针对各对象的偏好值更为准确,本专利技术实施例可以预确定的用户针对各对象的偏好标记值为指导,从而迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与所述用户针对各对象的偏好标记值的误差最小,使得优化后的用户针对各对象的偏好值,能够准确表达用户针对各对象的偏好程度;通过准确性较高的优化后的用户针对各对象的偏好值,生成用户的用户标签,可以精准的挖掘出用户标签。本专利技术实施例提供的用户标签挖掘方法,可以准确的确定用户针对在线互联网平台的对象的偏好,以通过准确性较高的用户针对各对象的偏好,生成用户标签,实现用户标签的精准挖掘,提升挖掘的用户标签的精度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的用户标签挖掘方法的流程图;图2为对对象重新进行划分的示例图;图3为本专利技术实施例提供的用户向量的示例图;图4为本专利技术实施例提供的用户标签挖掘方法的另一流程图;图5为本专利技术实施例提供的机器学习模型的示例图;图6为对对象重新进行划分的另一示例图;图7为本专利技术实施例提供的用户标签挖掘方法的再一流程图;图8为对对象进行偏好用户复制的示例图;图9为本专利技术实施例的应用示例图;图10为本专利技术实施例提供的用户标签挖掘装置的框图;图11为本专利技术实施例提供的用本文档来自技高网...
【技术保护点】
1.一种用户标签挖掘方法,其特征在于,包括:/n获取用户的行为日志;/n根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;/n至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;/n迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;/n以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。/n
【技术特征摘要】
1.一种用户标签挖掘方法,其特征在于,包括:
获取用户的行为日志;
根据所述行为日志,从预设的多个对象中确定所述用户执行设定行为所针对的目标对象;
至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息;
迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小;
以优化后的所述用户针对各对象的偏好值,生成所述用户的用户标签。
2.根据权利要求1所述的用户标签挖掘方法,其特征在于,所述用户信息为用户向量;所述方法还包括:
根据所述行为日志,确定所述用户的搜索关键词;
所述至少基于所述目标对象,确定表示所述用户的行为偏好的用户信息包括:
基于所述目标对象及所述搜索关键词生成所述用户的用户行为向量;
将所述用户行为向量与所述用户的用户属性向量相拼接,得到所述用户向量。
3.根据权利要求2所述的用户标签挖掘方法,其特征在于,所述用户属性向量包括:由所述用户的基础属性信息生成的基础属性向量,及由所述用户的连续信息生成的非线性向量,所述连续信息至少指示所述用户的用户价值。
4.根据权利要求3所述的用户标签挖掘方法,其特征在于,所述将所述用户行为向量与所述用户的用户属性向量相拼接,得到所述用户向量包括:
利用机器学习模型的全链接层拼接所述用户行为向量与所述用户属性向量,得到所述用户向量;其中,所述全链接层的非线性激活函数处理所述非线性向量。
5.根据权利要求2-4任一项所述的用户标签挖掘方法,其特征在于,所述迭代优化根据所述用户信息所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与预确定的所述用户针对各对象的偏好标记值的误差最小包括:
根据所述用户向量与各对象的对象向量,确定所述用户针对各对象的输入向量;
迭代优化根据所述用户针对各对象的输入向量所确定的所述用户针对各对象的偏好值,直至优化后的所述用户针对各对象的偏好值,与所述...
【专利技术属性】
技术研发人员:赵呈路,李雪,
申请(专利权)人:北京星选科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。