System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及大数据以及用户画像领域,尤其涉及一种用户画像构建方法、基于用户画像的个性化推荐方法及装置、计算机可读存储介质、计算机程序产品、电子设备。
技术介绍
1、用户画像通常基于用户的行为习惯和人口信息学数据构建得到,用以实现对用户感兴趣的内容进行推荐;其中,行为习惯可以是购物偏好、浏览记录、搜索习惯、运动数据等,以及人口信息学数据是年龄、性别等。
2、现有的构建用户画像构建方法所依赖的数据,无论是用户的行为习惯还是人口信息学数据,都是在较长时间跨度内获取的,即仅是简单地关注到了用户的历史数据。因此,现有用户画像的建立未充分考虑到数据的时效性和易变性,构建出的用户画像在理解用户实时状态方面上存在不足。例如,用户在跑步、工作或休息等不同实时状态下,其行为习惯会随着实时状态的变化而改变,以及在不同状态下用户的即时需求也是不同的,而现有的用户画像构建方法无法根据用户实时状态的变化及时做出改变,从而降低了用户画像的精确性,进而造成推荐给用户的信息不准确。
技术实现思路
1、本专利技术实施例的目的在于,提供一种用户画像构建方法、基于用户画像的个性化推荐方法及装置、计算机可读存储介质、计算机程序产品、电子设备,根据用户在实时状态下的运动行为数据建立动态画像,同时基于用户的静态信息数据建立静态画像,将两者结合生成用户的个体孪生动静态画像,这样不仅使得用户画像能够根据实时状态的变化而更新,还能够显著提高用户画像的精确性,进而提高信息推荐的准确性和即时性。
2、本专利技术
3、获取用户的静态信息数据和动态特征数据;其中,所述动态特征数据为一个行为状态下的人体形态数据;
4、根据所述静态信息数据和所述动态特征数据,获得与用户行为状态匹配的群体动态聚类簇;
5、计算所述群体动态聚类簇中人群的动态特征数据在预设置信区间内的第一均值,并将所述第一均值作为对应聚类类别的动态特征参考值;
6、将所述静态信息数据作为所述用户的静态画像,且将所述动态特征参考值作为所述用户的动态画像;
7、根据所述静态画像和所述动态画像生成所述用户的个体孪生动静态画像。
8、可选地,所述根据所述静态信息数据和所述动态特征数据,获得与用户行为状态匹配的群体动态聚类簇,包括:
9、将所述静态信息数据发送给云端,以使得所述云端能够根据所述静态信息数据与云端存储的所有群体孪生静态画像的静态信息边界进行比对,选定与用户静态信息匹配的群体孪生静态画像作为所述用户的个体孪生静态画像模板,并获得所述个体孪生静态画像模板对应的聚类簇集合;
10、接收所述云端反馈的聚类簇集合,将所述动态特征数据与所述聚类簇集合中所有群体动态聚类簇的动态特征边界进行比对,获得与用户行为状态匹配的群体动态聚类簇。
11、可选地,所述根据所述静态画像和所述动态画像生成所述用户的个体孪生动静态画像,包括:
12、将所述静态画像和所述动态画像输入至误差修正模型中,获取修正误差预测值;
13、根据所述修正误差预测值对所述动态特征参考值进行修正,得到修正后的动态特征参考值;
14、将修正后的动态特征参考值作为所述用户的个体孪生动静态画像。
15、进一步地,所述云端存储的所有群体孪生静态画像由云端通过以下步骤获得:
16、获取样本数据集;其中,所述样本数据集包含若干个样本的静态信息数据和动态特征数据;
17、对所述样本数据集中的所有动态特征数据进行聚类,得到k个不同类别的群体动态聚类簇;其中,k≥1;
18、分别统计每个群体动态聚类簇中样本的静态信息数据和动态特征数据的分布范围,获得每个群体动态聚类簇对应的静态信息边界和动态特征边界;
19、分别将具有相同静态信息边界的群体动态聚类簇进行组合,获得不同的聚类簇集合;
20、对每个所述聚类簇集合进行分析,得到对应的群体孪生静态画像;其中,每个所述群体孪生静态画像均具有一个静态信息边界。
21、进一步地,所述对所有样本的动态特征数据进行聚类,得到k个不同类别的群体动态聚类簇,包括:
22、设置聚类的类别数为k个、最大迭代次数为m1次和最大更新次数为m2次;其中,m1≥1;m2≥1;
23、在每次迭代过程中,从所有样本的动态特征数据中选取k个数据作为初始化的聚类中心;
24、根据每个动态特征数据到k个聚类中心的距离,将所有动态特征数据划分为k个不同类别的聚类簇;并对k个聚类中心进行更新,并记录更新次数;
25、当所述更新次数达到所述最大更新次数时,停止对所述k个聚类中心的更新,并将所述更新次数重置为0;
26、当所述更新次数小于所述最大更新次数时,判断更新后的所有聚类中心与更新前的所有聚类中心是否全部相同;
27、若至少有一个不相同,则继续对所述k个聚类中心进行更新;
28、若全部相同,则停止对所述k个聚类中心的更新。
29、进一步地,所述对k个聚类中心进行更新,具体为:
30、判断每个聚类簇中样本数量是否在预设数量区间内;
31、若在,则计算每个聚类簇中人群的动态特征数据的第二均值,并根据所述第二均值更新对应聚类簇的聚类中心;
32、若不在,则从所述样本数据集的所有动态特征数据中选取一个动态特征数据,更新对应聚类簇的聚类中心。
33、进一步地,所述对所有样本的动态特征数据进行聚类,得到k个不同类别的群体动态聚类簇,进一步包括:
34、在停止更新聚类中心后,计算每个样本的簇内相似度系数和簇间不相似度系数;
35、基于所有的所述簇内相似度系数和所述簇间不相似度系数,计算群体孪生效果评价系数;其中,所述群体孪生效果评价系数用于表征聚类效果;
36、判断所述群体孪生效果评价系数是否大于预设阈值;
37、若小于或等于预设阈值,则继续迭代;
38、若大于预设阈值,则停止迭代,得到k个不同类别的群体动态聚类簇。
39、进一步地,所述误差修正模型由以下步骤获得:
40、获取所述用户的个体孪生静态画像模板对应的聚类簇集合;
41、计算所述聚类簇集合中每个群体动态聚类簇的所有动态特征数据的第三均值,并将所述第三均值作为对应聚类类别的动态特征综合参数;其中,所述聚类簇集合中每个样本均对应一个动态特征综合参数;
42、将所述聚类簇集合中所有样本的静态信息数据和对应的动态特征综合参数作为模型的训练数据;
43、根据所述每个样本的动态特征数据计算损失函数;
44、基于所述损失函数和所述训练数据,训练得到一个误差修正模型。
45、进一步地,所述基于所述损失函数和所述训练数据,训练得到一个误差修正模型,包括:<本文档来自技高网...
【技术保护点】
1.一种用户画像构建方法,其特征在于,由用户终端执行,所述方法包括:
2.如权利要求1所述的用户画像构建方法,其特征在于,所述根据所述静态信息数据和所述动态特征数据,获得与用户行为状态匹配的群体动态聚类簇,包括:
3.如权利要求1所述的用户画像构建方法,其特征在于,所述根据所述静态画像和所述动态画像生成所述用户的个体孪生动静态画像,包括:
4.如权利要求2所述的用户画像构建方法,其特征在于,所述云端存储的所有群体孪生静态画像由云端通过以下步骤获得:
5.如权利要求4所述的用户画像构建方法,其特征在于,所述对所有样本的动态特征数据进行聚类,得到K个不同类别的群体动态聚类簇,包括:
6.如权利要求5所述的用户画像构建方法,其特征在于,所述对K个聚类中心进行更新,具体为:
7.如权利要求6所述的用户画像构建方法,其特征在于,所述对所有样本的动态特征数据进行聚类,得到K个不同类别的群体动态聚类簇,进一步包括:
8.如权利要求3所述的用户画像构建方法,其特征在于,所述误差修正模型由以下步骤获得:
10.如权利要求4或8所述的用户画像构建方法,其特征在于,所述方法还包括:
11.一种基于用户画像的个性化推荐方法,其特征在于,包括:
12.一种用户画像构建装置,其特征在于,包括:
13.一种基于用户画像的个性化推荐装置,其特征在于,包括:
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如权利要求1~10中任一项所述的用户画像构建方法,或者,如权利要求11所述的基于用户画像的个性化推荐方法。
15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现如权利要求1~10中任一项所述的用户画像构建方法,或者,如权利要求11所述的基于用户画像的个性化推荐方法。
16.一种电子设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如权利要求1~10中任一项所述的用户画像构建方法,或者,如权利要求11所述的基于用户画像的个性化推荐方法。
...【技术特征摘要】
1.一种用户画像构建方法,其特征在于,由用户终端执行,所述方法包括:
2.如权利要求1所述的用户画像构建方法,其特征在于,所述根据所述静态信息数据和所述动态特征数据,获得与用户行为状态匹配的群体动态聚类簇,包括:
3.如权利要求1所述的用户画像构建方法,其特征在于,所述根据所述静态画像和所述动态画像生成所述用户的个体孪生动静态画像,包括:
4.如权利要求2所述的用户画像构建方法,其特征在于,所述云端存储的所有群体孪生静态画像由云端通过以下步骤获得:
5.如权利要求4所述的用户画像构建方法,其特征在于,所述对所有样本的动态特征数据进行聚类,得到k个不同类别的群体动态聚类簇,包括:
6.如权利要求5所述的用户画像构建方法,其特征在于,所述对k个聚类中心进行更新,具体为:
7.如权利要求6所述的用户画像构建方法,其特征在于,所述对所有样本的动态特征数据进行聚类,得到k个不同类别的群体动态聚类簇,进一步包括:
8.如权利要求3所述的用户画像构建方法,其特征在于,所述误差修正模型由以下步骤获得:
9.如权利要求8所述的用户画像构建方法,其特征在于,所述基于所述损失函数和所述训练数...
【专利技术属性】
技术研发人员:郑智民,巩晨,崔春风,潘成康,王启星,刘建军,刘光毅,袁弋非,丁海煜,
申请(专利权)人:中国移动通信有限公司研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。