用户行为分析方法及装置、设备、存储介质制造方法及图纸

技术编号:35158557 阅读:26 留言:0更新日期:2022-10-12 17:16
本申请实施例公开了一种用户行为分析方法及装置、设备、存储介质;其中,所述方法包括:将用户的行为数据集划分为至少一个第一行为数据子集;确定每一所述第一行为数据子集的密度阈值,其中,所述密度阈值用于表征占用属于所述第一行为数据子集的用户数据的个数的比例;根据所述密度阈值,对对应的第一行为数据子集进行聚类处理,得到第一子类;根据聚类处理得到的第一子类,对所述用户的行为进行分析,得到分析结果。得到分析结果。得到分析结果。

【技术实现步骤摘要】
用户行为分析方法及装置、设备、存储介质


[0001]本申请实施例涉及信息处理技术,涉及但不限于用户行为分析方法及装置、设备、存储介质。

技术介绍

[0002]随着信息技术、数据收集和存储技术的不断发展和日益普及,各行各业都面临着海量的用户数据,从这些海量的数据中挖掘出用户的兴趣爱好,发现用户的行为习惯具有重要意义。

技术实现思路

[0003]有鉴于此,本申请实施例提供的用户行为分析方法及装置、设备、存储介质,能够有针对性地利用对应的密度阈值进行聚类,从而能够提高聚类准确度,避免出现所有的行为数据子集共同使用一个密度阈值而导致的聚类质量下降的问题。本申请实施例提供的用户行为分析方法及装置、设备、存储介质是这样实现的:
[0004]本申请实施例提供的用户行为分析方法,包括:将用户的行为数据集划分为至少一个第一行为数据子集;确定每一所述第一行为数据子集的密度阈值,其中,所述密度阈值用于表征占用属于所述第一行为数据子集的用户数据的个数的比例;根据所述密度阈值,对对应的第一行为数据子集进行聚类处理,得到第一子类;根据聚类处理得到的第一子类,对所述用户的行为进行分析,得到分析结果。
[0005]本申请实施例提供的用户行为分析装置,包括:划分模块,用于将用户的行为数据集划分为至少一个第一行为数据子集;确定模块,用于确定每一所述第一行为数据子集的密度阈值,其中,所述密度阈值用于表征占用属于所述第一行为数据子集的用户数据的个数的比例;聚类模块,用于根据所述密度阈值,对对应的第一行为数据子集进行聚类处理,得到第一子类;分析模块,用于根据聚类处理得到的第一子类,对所述用户的行为进行分析,得到分析结果。
[0006]本申请实施例提供的电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请实施例所述的方法。
[0007]本申请实施例提供的计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请实施例提供的所述的方法。
[0008]在本申请实施例中,提供一种用户行为分析方法,通过对用户的行为数据集进行分区,得到第一行为数据子集;然后确定每一所述第一行为数据子集的密度阈值,并根据密度阈值,对对应的第一行为数据子集进行聚类处理,得到第一子类;最终根据聚类处理得到的第一子类,对所述用户的行为进行分析,得到分析结果;如此,对于每一个划分后的第一行为数据子集,均是有针对性地利用对应的密度阈值进行聚类,从而能够提高聚类准确度,避免出现所有的行为数据子集共同使用一个密度阈值而导致的聚类质量下降的问题。
附图说明
[0009]此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
[0010]图1为本申请实施例用户行为分析方法的实现流程示意图;
[0011]图2为本申请实施例用户行为分析方法的实现流程示意图;
[0012]图3为行为数据子集投影至X轴的数据分布图;
[0013]图4为本申请实施例用户行为分析方法的实现流程示意图;
[0014]图5为本申请实施例用户行为分析方法的实现流程示意图;
[0015]图6为本申请实施例提供的用户行为分析系统的模块流程图;
[0016]图7为本申请实施例提供的用户行为分析系统的详细流程图;
[0017]图8为本申请实施例提供的改进的基于密度峰值的空间聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)的具体实现步骤流程图;
[0018]图9为本申请实施例提供的类中心点的变化曲线图;
[0019]图10为本申请实施例提供的数据集4的数据分布示意图;
[0020]图11为本申请实施例提供的数据集4未进行投影分区的决策图;
[0021]图12为本申请实施例提供的数据集4进行投影分区后的决策图;
[0022]图13为本申请实施例提供的对数据集4引入类合并后的聚类效果图;
[0023]图14为本申请实施例提供的用户行为分析系统运行的流程示意图;
[0024]图15为本申请实施例提供的用户行为分析装置的结构示意图;
[0025]图16为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0026]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
[0027]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0028]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0029]需要指出,本申请实施例所涉及的术语“第一\第二\第三”用以区别类似或不同的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
[0030]本申请实施例提供一种用户行为分析方法,该方法应用于电子设备,该电子设备在实施的过程中可以为各种类型的具有信息处理能力的设备,例如所述电子设备可以包括手机、平板电脑、个人计算机、笔记本电脑、服务器、集群服务器等。该方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介
质中,可见,该电子设备至少包括处理器和存储介质。
[0031]图1为本申请实施例提供的用户行为分析方法的实现流程示意图,如图1所示,该方法可以包括以下步骤101至步骤104:
[0032]步骤101,将用户的行为数据集划分为至少一个第一行为数据子集。
[0033]可以理解地,在对用户行为进行分析之前,需要先采集用户行为数据,并对采集到的用户行为数据进行预处理,以得到用户的行为数据集。
[0034]在一些实施例中,电子设备可以通过爬虫技术将不同网络环境中的用户行为数据采集到本地数据库中,其中,不同网络环境包括移动数据网络环境和无线网络环境;然后,对采集到的用户行为数据进行预处理操作,如对采集到的用户行为数据进行过滤、清洗和转换等;再对预处理后的用户行为数据提取特征值,如用户的性别、年龄层次、职业、消费水平、访问站点、访问时间、停留时间和/或浏览次数等属性特征,形成用户的行为数据集。
[0035]可以理解地,在预处理过程中,对用户行为数据进行过滤操作,能够减少最终用于聚类的数据集的数据量;对用户行为数据进行清洗操作,能够填充缺失值,将单个用户行为数据作为潜本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为分析方法,其特征在于,所述方法包括:将用户的行为数据集划分为至少一个第一行为数据子集;确定每一所述第一行为数据子集的密度阈值,其中,所述密度阈值用于表征占用属于所述第一行为数据子集的用户数据的个数的比例;根据所述密度阈值,对对应的第一行为数据子集进行聚类处理,得到第一子类;根据聚类处理得到的第一子类,对所述用户的行为进行分析,得到分析结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述密度阈值,对对应的第一行为数据子集进行聚类处理,得到第一子类,包括:根据至少两个所述第一行为数据子集的密度阈值,并行地对所述至少两个所述第一行为数据子集进行聚类处理,得到至少两个第一子类。3.根据权利要求1所述的方法,其特征在于,所述将用户的行为数据集划分为至少一个第一行为数据子集,包括:确定所述行为数据集的分布特性;根据所述行为数据集的分布特性,对所述行为数据集进行划分,得到第二行为数据子集;将所述第二行为数据子集分配至分布式文件系统中对应的数据节点上;通过所述数据节点对被分配的所述第二行为数据子集进行划分,得到至少一个所述第一行为数据子集。4.根据权利要求3所述的方法,其特征在于,所述通过所述数据节点对被分配的所述第二行为数据子集进行分区,得到至少一个所述第一行为数据子集,包括:通过所述数据节点将被分配的所述第二行为数据子集投影至坐标轴上,得到投影数据集;确定所述投影数据集的波峰和波谷;根据所述投影数据集的波峰和波谷,对所述投影数据集进行分区,得到至少一个所述第一行为数据子集。5.根据权利要求1所述的方法,其特征在于,所述根据聚类处理得到的第一子类,对所述用户的行为进行分析,得到分析结果,包括:对聚类处理得到的第一子类进行合并处理,得到至少一个第二子类;根据所述至少一个第二子类,对所述用户的行为进行分析,得到分析结果。6.根据权利要求5所述的方法,其特征在于,聚类处理得到的第一子类存储在第一存储结构中;所述对聚类处理得到的第一子类进行合并处理,得到至少一个第二子类,包括:确定所述第一存储结构中的N个第一子类是否满足合并条件;其中,N大于1;如果所述N个第一子类满足所述合并条件,将所述N个第一子类进行合并,得到合并子类,以及将所述合...

【专利技术属性】
技术研发人员:戴娇叶青毛爱平
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1