用户属性信息的获取方法、系统、服务器及存储介质技术方案

技术编号:22167085 阅读:36 留言:0更新日期:2019-09-21 10:39
本公开实施例公开了一种用户属性信息的获取方法、系统、服务器及存储介质;该方法包括:获取第一用户群体中用户的样本行为数据;其中,样本行为数据包括:第一类样本行为数据和第二类样本行为数据;根据第一类样本行为数据和预设规则确定第一用户群体中用户的属性信息;根据第二类样本行为数据和第一用户群体中用户的属性信息,对用户画像模型进行训练,以获取用户画像模型中的模型参数;根据获取的用户画像模型中的模型参数确定用户画像模型;获取待分类用户群体中用户的特征行为数据,根据待分类用户群体中用户的特征行为数据和用户画像模型获取待分类用户群体中用户的属性信息。能够在没有数据样本的情况下获取到用户属性信息。

Access Method, System, Server and Storage Medium of User Attribute Information

【技术实现步骤摘要】
用户属性信息的获取方法、系统、服务器及存储介质
本公开实施例涉及计算机
,尤其涉及一种用户属性信息的获取方法、装置及系统。
技术介绍
随着互联网技术的发展,各个网站或者应用软件APP拥有大量的用户,这些网站或者APP可以对其拥有的用户进行画像,即将用户的属性信息进行采集,并基于各个用户的画像结果对各个用户提供个性化服务。用户画像,是一种用于勾画目标用户特点的手段,其可以表现为获取针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒,进而可以利用用户画像挖掘用户需求,分析用户偏好,并通过匹配用户画像提供给用户更高效和更有针对性的信息输送,以及更贴近个人习惯的用户体验。例如,若某个用户的属性信息是单身属性信息,则可以为该用户提供单身相关的个性化服务;若某个用户的属性信息是已婚属性信息,则可以为该用户提供已婚相关的个性化服务。现有的用户属性信息的获取方法可以包括以下两种:第一、基于调查问卷的方式获取用户属性信息,该方法需要占用大量的人力和时间,而且用户属性信息的准确性难以保证;第二、基于数据模型的方式获取用户属性信息,该方法需要大量的数据样本进行分析,以获取数据模型,但是没有数据样本的情况下,则无法获取对应的数据模型,并进而进行用户属性信息的获取。
技术实现思路
本公开实施例提供一种用户属性信息的获取方法、系统、服务器及存储介质,能够在没有样本数据的情况下获取到用户属性信息。第一方面,本专利技术实施例提供了一种用户属性信息的获取方法,所述方法包括:获取第一用户群体中用户的样本行为数据;其中,所述样本行为数据包括第一类样本行为数据和第二类样本行为数据;根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息;根据所述第二类样本行为数据和所述第一用户群体中用户的属性信息,对用户画像模型进行训练,以获取所述用户画像模型中的模型参数;根据获取的所述用户画像模型中的模型参数确定所述用户画像模型;获取待分类用户群体中用户的特征行为数据,根据所述待分类用户群体中用户的特征行为数据和用户画像模型获取所述待分类用户群体中用户的属性信息。在上述实施例中,所述第一类样本行为数据和所述第二类样本行为数据的类型不同,所述待分类用户群体中用户的特征行为数据的类型和所述第二样本行为数据的类型相同。在上述实施例中,所述第一样本行为数据包括至少一个正样本数据和至少一个负样本数据,根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息,包括:根据所述至少一个正样本数据和至少一个负样本数据,以及预设规则确定所述第一用户群体中用户的属性信息。在上述实施例中,所述方法还包括:根据待筛选用户群体中用户的正样本数据分布,和/或,所述待筛选用户群体的负样本数据分布,确定所述第一用户群体所包含的用户。在上述实施例中,所述根据获取的所述用户画像模型中的模型参数确定所述用户画像模型之后,所述方法还包括:获取第二用户群体中用户的特征行为数据,根据所述第二用户群体中用户的特征行为数据对所述用户画像模型进行验证;根据对所述用户画像模型的验证结果选择所述至少一个正样本数据和所述至少一个负样本数据。在上述实施例中,所述根据所述第二用户群体中用户的样本行为数据对所述用户画像模型进行验证,包括:根据所述第二用户群体中用户的特征行为数据,通过所述用户画像模型获取第二用户群体中用户的属性信息;获取所述第二用户群体中用户的属性信息的区分度图,并根据所述第二群体的属性信息的区分度图对所述用户画像模型进行验证。在上述实施例中,所述根据获取的所述用户画像模型中的模型参数确定所述用户画像模型之后,所述方法还包括:计算用户画像模型的模型指标,根据用户画像模型的模型指标对用户画像模型进行验证。在上述实施例中,所述方法还包括:根据所述待分类用户群体中用户的属性信息确定所述用户的类型;其中,所述用户的类型包括:用户婚姻状态、用户职业、用户购买力或用户的商品兴趣中的至少一个。在上述实施例中,所述获取待分类用户群体中用户的特征行为数据包括:获取待分类用户群体中用户的原始特征行为数据,并对所述原始特征行为数据的评分值进行归一化处理;根据归一化后的评分值获取各用户预设数量的原始特征行为数据,作为待分类用户群体中用户的特征行为数据。在上述实施例中,由拼接服务器执行所述获取第一用户群体中用户的样本行为数据;根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息;根据所述第二类样本行为数据和所述第一用户群体中用户的属性信息,对用户画像模型进行训练,以获取所述用户画像模型中的模型参数的操作;由模型服务器执行所述根据获取的所述用户画像模型中的模型参数确定所述用户画像模型的操作;由预测服务器执行所述获取待分类用户群体中用户的特征行为数据,根据所述待分类用户群体中用户的特征行为数据和用户画像模型获取所述待分类用户群体中用户的属性信息的操作。第二方面,本专利技术实施例提供了一种用户属性信息的获取系统,所述系统包括:拼接服务器、预测服务器、模型服务器和分类服务器;其中,所述拼接服务器,用于获取第一用户群体中用户的样本行为数据;其中,所述样本行为数据包括:第一类样本行为数据和第二类样本行为数据;所述预测服务器,用于根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息;所述模型服务器,用于根据所述第二类样本行为数据和所述第一用户群体中用户的属性信息,对用户画像模型进行训练,以获取所述用户画像模型中的模型参数;以及根据获取的所述用户画像模型中的模型参数确定所述用户画像模型;所述分类服务器,用于获取待分类用户群体中用户的特征行为数据,根据所述待分类用户群体中用户的特征行为数据和用户画像模型获取所述待分类用户群体中用户的属性信息。在上述实施例中,所述第一类样本行为数据和所述第二类样行为数据的类型不同,所述待分类用户群体中用户的特征行为数据的类型和所述第二样本行为数据的类型相同。在上述实施例中,所述第一样本行为数据包括至少一个正样本数据和至少一个负样本数据,根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息,预测服务器具体用于根据所述至少一个正样本数据和至少一个负样本数据,以及预设规则确定所述第一用户群体中用户的属性信息。在上述实施例中,拼接服务器还用于根据待筛选用户群体中用户的正样本数据分布,和/或,所述待筛选用户群体的负样本数据分布,确定所述第一用户群体所包含的用户。在上述实施例中,还可以包括验证服务器,验证服务器还用于在根据获取的所述用户画像模型中的模型参数确定所述用户画像模型之后,获取第二用户群体中用户的特征行为数据,根据所述第二用户群体中用户的特征行为数据对所述用户画像模型进行验证;根据对所述用户画像模型的验证结果选择所述至少一个正样本数据和所述至少一个负样本数据。在上述实施例中,验证服务器根据所述第二用户群体中用户的样本行为数据对所述用户画像模型进行验证,包括:根据所述第二用户群体中用户的特征行为数据,通过所述用户画像模型获取第二用户群体中用户的属性信息;获取所述第二用户群体中用户的属性信息的区分度图,并根据所述第二群体的属性信息的区分度图对所述用户画像模型进行验证。在上述实施例中,还有一种验本文档来自技高网...

【技术保护点】
1.一种用户属性信息的获取方法,其特征在于,所述方法包括:获取第一用户群体中用户的样本行为数据;其中,所述样本行为数据包括第一类样本行为数据和第二类样本行为数据;根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息;根据所述第二类样本行为数据和所述第一用户群体中用户的属性信息,对用户画像模型进行训练,以获取所述用户画像模型中的模型参数;根据获取的所述用户画像模型中的模型参数确定所述用户画像模型;获取待分类用户群体中用户的特征行为数据,根据所述待分类用户群体中用户的特征行为数据和用户画像模型获取所述待分类用户群体中用户的属性信息。

【技术特征摘要】
1.一种用户属性信息的获取方法,其特征在于,所述方法包括:获取第一用户群体中用户的样本行为数据;其中,所述样本行为数据包括第一类样本行为数据和第二类样本行为数据;根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息;根据所述第二类样本行为数据和所述第一用户群体中用户的属性信息,对用户画像模型进行训练,以获取所述用户画像模型中的模型参数;根据获取的所述用户画像模型中的模型参数确定所述用户画像模型;获取待分类用户群体中用户的特征行为数据,根据所述待分类用户群体中用户的特征行为数据和用户画像模型获取所述待分类用户群体中用户的属性信息。2.根据权利要求1所述的方法,其特征在于,所述第一类样本行为数据和所述第二类样本行为数据的类型不同,所述待分类用户群体中用户的特征行为数据的类型和所述第二样本行为数据的类型相同。3.根据权利要求1所述的方法,其特征在于,所述第一样本行为数据包括至少一个正样本数据和/或至少一个负样本数据,根据所述第一类样本行为数据和预设规则确定所述第一用户群体中用户的属性信息,包括:根据所述至少一个正样本数据和/或至少一个负样本数据,以及预设规则确定所述第一用户群体中用户的属性信息。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:根据待筛选用户群体中用户的正样本数据分布,和/或,所述待筛选用户群体中用户的负样本数据分布,确定所述第一用户群体所包含的用户。5.根据权利要求3所述的方法,其特征在于,所述根据获取的所述用户画像模型中的模型参数确定所述用户画像模型之后,所述方法还包括:获取第二用户群体中用户的特征行为数据,根据所述第二用户群体中用户的特征行为数据对所述用户画像模型进行验证;根据对所述用户画像模型的验证结果选择所述至少一个正样本数据和/或所述至少一个负样本数据。6.根据权利要求5所述的方法,其特征在于,所述根据所述第二用户群体中用户的样本行为数据对所述用户画像模型进行验证包括:根据所述第二用户群体中用户的特征行为数据,通过所述用户画像模型获取第二用户群体中用户的属性信息;获取所述第二用户群体中用户的属性信息的区分度图,并根据所述第二群体的属性信息的区分度图对所述用户画像模型进行验证。7.根据权利要求3所述的方法,其特征在于,所述根据获取的所述用户画像模型中的模型参数确定所述用户画像模型之后,所述方法还包括:计算用户画像模型的模型指标,根据用户画像模型的模型指标对用户画像模型进行验证。8.根据权利要求1所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:李昂
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1