【技术实现步骤摘要】
一种数据分析方法和装置
本申请涉及计算机
,具体涉及一种数据分析方法和装置。
技术介绍
随着大数据时代的到来,用户的网络行为可以通过应用来表现,因此,通过用户的应用数据对用户进行分析,可以更好地刻画用户的属性以及对应用进行用户行为预测,从而可以精准地对用户进行数据推荐与信息推送,例如,可以推荐用户可能感兴趣的内容、判断用户是否有还款能力,等等。在对相关技术的研究和实践过程中,本申请的专利技术人发现,在基于应用数据进行用户分析的过程中,由于无法准确区分用户针对应用的活跃情况,而且,十分依赖于是否能够获取用户生成的内容,从而增加了基于应用数据进行用户分析的难度,也容易导致得到的结论错误率较高。
技术实现思路
本申请实施例提供一种数据分析方法及装置,可以通过分析用户针对应用的文件更新数据来进行用户行为预测。本申请实施例提供一种数据分析方法,包括:获取至少一个用户针对应用的使用时间和文件更新数据,其中,所述文件更新数据包括所述应用的文件更新路径集合,所述文件更新路径集合包括至少一条文件更新路径、以及所述文件更新路径对应的文件更新时间;从所述文件更新路径集合中选取文件更新时间与所述使用时间相匹配的匹配文件更新路径,得到各个用户的候选文件更新路径集合;统计所述匹配文件更新路径在各候选文件更新路径集合中出现的总频数;基于匹配文件更新路径对应的总频数,确定所述匹配文件更新路径为目标文件更新路径,得到所述应用的目标文件更新路径集合;基于所述目标文件更新路 ...
【技术保护点】
1.一种数据分析方法,其特征在于,包括:/n获取至少一个用户针对应用的使用时间和文件更新数据,其中,所述文件更新数据包括所述应用的文件更新路径集合,所述文件更新路径集合包括至少一条文件更新路径、以及所述文件更新路径对应的文件更新时间;/n从所述文件更新路径集合中选取文件更新时间与所述使用时间相匹配的匹配文件更新路径,得到各个用户的候选文件更新路径集合;/n统计所述匹配文件更新路径在各候选文件更新路径集合中出现的总频数;/n基于匹配文件更新路径对应的总频数,确定所述匹配文件更新路径为目标文件更新路径,得到所述应用的目标文件更新路径集合;/n基于所述目标文件更新路径集合对所述应用进行用户行为预测。/n
【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:
获取至少一个用户针对应用的使用时间和文件更新数据,其中,所述文件更新数据包括所述应用的文件更新路径集合,所述文件更新路径集合包括至少一条文件更新路径、以及所述文件更新路径对应的文件更新时间;
从所述文件更新路径集合中选取文件更新时间与所述使用时间相匹配的匹配文件更新路径,得到各个用户的候选文件更新路径集合;
统计所述匹配文件更新路径在各候选文件更新路径集合中出现的总频数;
基于匹配文件更新路径对应的总频数,确定所述匹配文件更新路径为目标文件更新路径,得到所述应用的目标文件更新路径集合;
基于所述目标文件更新路径集合对所述应用进行用户行为预测。
2.根据权利要求1所述的数据分析方法,其特征在于,从所述文件更新路径集合中选取文件更新时间与所述使用时间相匹配的匹配文件更新路径,包括:
从所述文件更新路径集合中提取待匹配的文件更新路径;
确定所述文件更新路径的文件更新时间与所述使用时间之间的关联信息;
基于所述文件更新路径对应的关联信息,确定所述文件更新路径为所述匹配文件更新路径。
3.根据权利要求2所述的数据分析方法,其特征在于,所述使用时间包括开始使用时间和结束使用时间;
确定所述文件更新路径的文件更新时间与所述使用时间之间的关联信息,包括:
确定所述文件更新时间对应的时间匹配精度;
根据所述时间匹配精度,对所述文件更新时间进行时间数据截取;
基于所述使用时间的开始使用时间和结束使用时间,生成所述用户的使用时间区间;
若所述截取后的文件更新时间属于所述使用时间区间,则确定所述关联信息为完全关联。
4.根据权利要求1所述的数据分析方法,其特征在于,统计所述匹配文件更新路径在各候选文件更新路径集合中出现的总频数,包括:
计算所述匹配文件更新路径在各候选文件更新路径集合中出现的频数;
对所述频数进行求和操作,得到所述总频数。
5.根据权利要求1所述的数据分析方法,其特征在于,基于匹配文件更新路径对应的总频数,确定所述匹配文件更新路径为目标文件更新路径,得到所述应用的目标文件更新路径集合,包括:
确定所述目标文件更新路径的用户覆盖数量阈值;
基于所述用户覆盖数量阈值和所述匹配文件更新路径对应的总频数,确定所述目标文件更新...
【专利技术属性】
技术研发人员:谢毅,张燕,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。