【技术实现步骤摘要】
本专利技术涉及数据挖掘技术,特别是一种可用于基于用户上网偏好进行营销目标挖 掘的用户上网偏好数据识别方法。
技术介绍
传统方法在基于用户上网偏好进行营销目标挖掘时,通常通过用户上网行为日 志,从经分数据仓库获取用户基础信息以规则限定的方式给用户打上偏好标签。 例如:音乐网站偏好,本月通过手机上网访问音乐网站次数大于10次的用户就为 音乐网站偏好用户;咪咕音乐偏好,本月通过手机使用咪咕音乐客户端大于5次的用户为 咪咕音乐偏好用户。 基于规则限定的方式,在传统数据库上识别用户的偏好过程中,根据用户手机 上网的记录(例:网访问音乐网站次数大于10次的用户)打上偏好标签,无法保证较高的 识别精准度,缺乏统一的、标准的算法,精确度无法保障。
技术实现思路
本专利技术要解决的技术问题为:通过利用现有的中位数概念、H-index算法,根据用 户的上网行为特征,对用户的偏好进行偏好、偏好度识别,提高数据识别的准确度和识别效 率。 本专利技术采取的技术方案具体为:用户上网偏好数据识别方法,包括以下步骤: 1)获取用户上网行为日志数据,所述上网行为数据包括用户使用的应用、访问的 内容、上网的时段、上网的位置数据; 2)将用户上网行为日志数据根据不同应用进行分别汇总; 3)指定用户访问各应用的指标类型包括访问次数、流量、访问频次,从各不同应用 对应的汇总数据中分别取出各指标的最大值和最小值; 4)对于各不同应用的不同指标,分别根据最大值与最小值进行指标值标准化:定 义某指标的最大值为a_max,最小值为a_mi ...
【技术保护点】
一种用户上网偏好数据识别方法,其特征是,包括以下步骤:1)获取用户上网行为日志数据,所述上网行为数据包括用户使用的应用、访问的内容、上网的时段、上网的位置数据;2)将用户上网行为日志数据根据不同应用进行分别汇总;3)指定用户访问各应用的指标类型包括访问次数、流量、访问频次,从各不同应用对应的汇总数据中分别取出各指标的最大值和最小值;4)对于各不同应用的不同指标,分别根据最大值与最小值进行指标值标准化:定义某指标的最大值为a_max,最小值为a_min,标准化指标值为index,则此指标的标准化指标值为:index=(当前值‑a_min)/(a_max‑a_min);5)对于各不同应用,获取步骤4)中所得到的各指标对应的标准化指标值的权重weight,并根据标准化的指标值及相应权重计算各应用的偏好度score:score(n)=index(1)*weight(1)+index(2)*weight(2)+index(3)*weight(3)...index(n)*weight(n)式中:n代表指标的种类数量;index(n)和weight(n)分别代表第n类指标的标准化指标值和权重值;6) ...
【技术特征摘要】
1. 一种用户上网偏好数据识别方法,其特征是,包括w下步骤: 1) 获取用户上网行为日志数据,所述上网行为数据包括用户使用的应用、访问的内容、 上网的时段、上网的位置数据; 2) 将用户上网行为日志数据根据不同应用进行分别汇总; 3) 指定用户访问各应用的指标类型包括访问次数、流量、访问频次,从各不同应用对应 的汇总数据中分别取出各指标的最大值和最小值; 4) 对于各不同应用的不同指标,分别根据最大值与最小值进行指标值标准化;定义某 指标的最大值为a_max,最小值为a_min,标准化指标值为index,则此指标的标准化指标值 为: index =(当前值-a_min) / (a_max-a_min); 5) 对于各不同应用,获取步骤4)中所得到的各指标对应的标准化指标值的权重 wei曲t,并根据标准化的指标值及相应权重计算各应用的偏好度score ; score (...
【专利技术属性】
技术研发人员:刘雷,
申请(专利权)人:亚信科技南京有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。