【技术实现步骤摘要】
基于大数据的用户行为数据处理方法、系统及云平台
[0001]本申请涉及数据处理
,具体而言,涉及基于大数据的用户行为数据处理方法、系统及云平台。
技术介绍
[0002]大数据(big data)是规模非常巨大和复杂的数据集,传统数据库管理工具处理起来面临很多问题,比如说获取、存储、检索、共享、分析和可视化。在将大数据具体应用到用户行为数据处理的过程中时,可能会存在数据处理不准确以及数据处理紊乱的问题,进而可能会导致用户行为挖掘不准确的问题,这样一来,无法确保用户行为数据处理的可信度。
技术实现思路
[0003]鉴于此,本申请提供了基于大数据的用户行为数据处理方法、系统及云平台。
[0004]第一方面,提供一种基于大数据的用户行为数据处理方法,应用于用户行为数据处理系统,所述方法至少包括:确定叠加用户行为数据集,其中,所述叠加用户行为数据集分别涵盖第一行为信息记录和第二行为信息记录;对所述第一行为信息记录进行行为描述挖掘,得到第一关键描述集;对所述第二行为信息记录中的各组行为事件进行挖掘,得到各组行为事件中的目标操作主题的显著性表达,根据所述第二行为信息记录和所述目标操作主题的显著性表达,生成携带目标操作主题的显著性表达的第三行为信息记录,对所述第三行为信息记录进行行为描述挖掘,得到第二关键描述集。
[0005]在一种独立实施的实施例中,确定叠加用户行为数据集方式包括:确定由合法爬虫线程爬取的基础第一可视化行为数据集,重构所述第一可视化行为数据集,得到基础第二可视化行为数据集。r/>[0006]在一种独立实施的实施例中,确定叠加用户行为数据集的步骤还包括:确定由合法爬虫线程爬取的用户行为数据集,通过配置存在动态的数据处理策略将所述用户行为数据集拆解成混合用户行为数据集,其中,所述混合用户行为数据集包括第一阶段性用户行为数据集和第二阶段性用户行为数据集。
[0007]在一种独立实施的实施例中,所述目标操作主题的显著性表达包括:所述目标操作主题的要素显著性表达中的习惯显著性表达至少一个。
[0008]在一种独立实施的实施例中,根据所述第二行为信息记录和所述目标操作主题的显著性表达,生成携带目标操作主题的显著性表达的第三行为信息记录之后包括:在各组行为事件中根据所述目标操作主题的显著性表达、所述目标操作主题的显著性表达在对应行为事件中的分布描述以及定位关键词,确定各组行为事件中的所述目标操作主题的显著性表达在基础行为事件中的关联数据集,记录基础行为事件中与所述关联数据集相关联的动态行为事件、所述动态行为事件的定位关键词以及动态行为事件的分布
描述。
[0009]在一种独立实施的实施例中,记录基础行为事件中与所述关联数据集相关联的动态行为事件、所述动态行为事件的定位关键词以及动态行为事件的分布描述包括:检测是否需要对所述关联数据集相关联的动态行为事件进行调整;如果需要,对所述关联数据集相关联的动态行为事件进行调整后,记录调整后的动态行为事件、所述动态行为事件的定位关键词以及动态行为事件的分布描述。
[0010]在一种独立实施的实施例中,检测是否需要对所述关联数据集相关联的动态行为事件进行调整包括:根据云端数据库的容量部署第一判定值,在对所述动态行为事件进行统计时,根据所述动态行为事件信息量确定所匹配的统计资源量化值,检测所匹配的统计资源量化值是否超过所述第一判定值,如果需要,对所述关联数据集相关联的动态行为事件进行调整。
[0011]在一种独立实施的实施例中,对所述第三行为信息记录进行行为描述挖掘,得到第二关键描述集之后包括:对动态行为事件进行特征挖掘,得到特征挖掘后的动态行为事件;在检测需要将所述第二关键描述集解码成用户行为数据集时,根据所述第二关键描述集得到多组待解码的行为事件以及各组待解码行为事件的定位关键词,根据待解码行为事件的定位关键词找到相关联的特征挖掘后动态行为事件,将所述特征挖掘后动态行为事件根据所述动态行为事件的分布描述加载至所述待解码行为事件中,得到解码后行为事件;对解码后行为事件的进行处理得到用户行为数据集。
[0012]在一种独立实施的实施例中,所述方法还包括:确定当前行为事件的第一目标操作主题,根据所述第一目标操作主题确定前x组行为事件中第一目标操作主题的显著性表达,将前x组行为事件的所述第一目标操作主题的显著性表达添加到当前行为事件中,基于当前的行为事件输出前x组行为事件的第一目标操作主题显著性表达,其中,x为大于1的整数。
[0013]在一种独立实施的实施例中,对所述第二行为信息记录中的各组行为事件进行挖掘,得到各组行为事件中的目标操作主题的显著性表达之后包括:以定位关键词为参照记录各组行为事件中的目标操作主题的显著性表达;检测所述第一关键描述集中是否需要带有目标操作主题的显著性表达;如果需要,根据所述定位关键词将各组行为事件的目标操作主题的显著性表达补充至所述第一关键描述集中。
[0014]第二方面,提供一种基于大数据的用户行为数据处理系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
[0015]第三方面,本申请实施例提供一种云平台,所述云平台包括存储有程序的可读存储介质,以实现所述的方法。
[0016]本申请实施例所提供的基于大数据的用户行为数据处理方法、系统及云平台,通过确定叠加用户行为数据集,其中,叠加用户行为数据集分别涵盖第一行为信息记录和第二行为信息记录;对第一行为信息记录进行行为描述挖掘,得到第一关键描述集;以及对第二行为信息记录中的各组行为事件进行挖掘,得到各组行为事件中的目标操作主题的显著
性表达,根据第二行为信息记录和目标操作主题的显著性表达,生成携带目标操作主题的显著性表达的第三行为信息记录,对第三行为信息记录进行行为描述挖掘,得到第二关键描述集。在本实施例中,第一关键描述集和第二关键描述集存在潜在的对应关系,通过第一关键描述集和第二关键描述集的共同作用下,提高用户行为数据处理的可信度。
附图说明
[0017]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0018]图1为本申请实施例所提供的一种基于大数据的用户行为数据处理方法的流程图。
[0019]图2为本申请实施例所提供的一种基于大数据的用户行为数据处理装置的框图。
[0020]图3为本申请实施例所提供的一种基于大数据的用户行为数据处理系统的架构图。
具体实施方式
[0021]为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的用户行为数据处理方法,其特征在于,应用于用户行为数据处理系统,所述方法至少包括:确定叠加用户行为数据集,其中,所述叠加用户行为数据集分别涵盖第一行为信息记录和第二行为信息记录;对所述第一行为信息记录进行行为描述挖掘,得到第一关键描述集;对所述第二行为信息记录中的各组行为事件进行挖掘,得到各组行为事件中的目标操作主题的显著性表达,根据所述第二行为信息记录和所述目标操作主题的显著性表达,生成携带目标操作主题的显著性表达的第三行为信息记录,对所述第三行为信息记录进行行为描述挖掘,得到第二关键描述集。2.如权利要求1所述的基于大数据的用户行为数据处理方法,其特征在于,确定叠加用户行为数据集方式包括:确定由合法爬虫线程爬取的基础第一可视化行为数据集,重构所述第一可视化行为数据集,得到基础第二可视化行为数据集。3.如权利要求1所述的基于大数据的用户行为数据处理方法,其特征在于,确定叠加用户行为数据集的步骤还包括:确定由合法爬虫线程爬取的用户行为数据集,通过配置存在动态的数据处理策略将所述用户行为数据集拆解成混合用户行为数据集,其中,所述混合用户行为数据集包括第一阶段性用户行为数据集和第二阶段性用户行为数据集。4.如权利要求1所述的基于大数据的用户行为数据处理方法,其特征在于,根据所述第二行为信息记录和所述目标操作主题的显著性表达,生成携带目标操作主题的显著性表达的第三行为信息记录之后包括:在各组行为事件中根据所述目标操作主题的显著性表达、所述目标操作主题的显著性表达在对应行为事件中的分布描述以及定位关键词,确定各组行为事件中的所述目标操作主题的显著性表达在基础行为事件中的关联数据集,记录基础行为事件中与所述关联数据集相关联的动态行为事件、所述动态行为事件的定位关键词以及动态行为事件的分布描述。5.如权利要求4所述的基于大数据的用户行为数据处理方法,其特征在于,记录基础行为事件中与所述关联数据集相关联的动态行为事件、所述动态行为事件的定位关键词以及动态行为事件的分布描述包括:检测是否需要对所述关联数据集相关联的动态行为事件进行调整;如果需要,对所述关联数据集相关联的动态行为事件进行调整后,记录调整后的动态行为事件、所述动态行为事件的定位关键词以及动态行为事件的分布描述。6.如权...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。