一种多维度移动用户偏好动态识别方法,用以解决移动用户的偏好随着时空分布规律动态改变的问题。本发明专利技术通过引入移动用户偏好衰减因子,动态更新移动用户偏好时间变化情况,再结合移动用户偏好的空间变化规律,解决移动用户偏好随时空而改变的问题,更加精准的识别移动用户偏好,以便提供个性化的服务。
【技术实现步骤摘要】
所属
本专利技术涉及数据挖掘
,尤其涉及一种多维度移动用户偏好动态识别方法。
技术介绍
随着移动互联网、智能手机的普及,用户在移动端上网的时长、流量日益增加。另一方面,互联网用户庞大,且兴趣多样化,针对所有用户提供相同的业务适配与推荐成本高而且效率低。在现有的技术方案中,基于网页内容进行用户偏好分析,只要用户在上网过程中浏览网页,系统就可分析用户上网访问的URL记录,根据URL库进行深入分析匹配归类,总结出用户的偏好属性,从而根据用户的偏好在网站上个性化地展现对其有价值的内容。传统的方法大多是根据静态的“URL-偏好类别数据库”对用户的URL进行分类,之后对每个用户的偏好类别进行频次统计,给用户打上“标签”。CN104331404A公开了一种基于用户手机上网数据的用户行为预测方法和装置,根据手机用户使用移动互联网的数据记录,建立手机用户行为的张量模型,对手机用户使用移动互联网的新的数据记录,结合张量模型,预测手机用户的行为。CN104573021A公开了一种针对互联网行为进行分析的方法,它包括将URL清单与关键词库和网址分类库进行匹配,生成网络用户URL清单和URL兴趣点汇总表,得出用户上网偏好表,实现对用户上网行为的识别,并打上相应的标签,通过对这些行为信息的分析和理解,制定对用户的贴心服务及个性化推荐。然而,因为移动用户偏好的动态改变,以及没有考虑移动用户上网的时空分布规律等问题带来了移动用户偏好识别精度下降的问题。
技术实现思路
本专利技术的目的是提供一种多维度移动用户偏好动态识别方法,用以解决移动用户的偏好随着时空分布规律动态改变的问题,进一步提高用户偏好识别精度。一种多维度移动用户偏好动态识别方法的步骤如下:步骤1:分析移动用户上网数据,结合移动应用分类库,生成移动用户访问记录;所述移动用户访问记录包括用户ID、用户访问发生时间、用户访问地基站信息、用户访问的应用名。步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好;然后根据不同的移动用户行为,赋予移动用户不同的偏好权重W;计算得初始移动用户偏好K: K = ( n m ) * W ]]>其中m为移动用户访问的总频次数,表示用户访问频次比例。步骤3:由步骤2计算得初始移动用户偏好,随着时间的变化用户初始偏好发生变化,动态识别用户偏好,其具体步骤为。步骤31:根据当前移动用户访问记录计算用户访问各个应用的频次,获取当前移动用户偏好,由步骤2计算公式得当前移动用户偏好K'。步骤32:计算移动用户偏好的衰减;引入衰减因子α,根据访问时间间隔确定相应的衰减因子数值。衰减因子α计算公式如下:α=β*(ti-tj)ti-tj表示两次相邻访问的时间间隔,β为相关系数;衰减后的偏好比例系数γ:γ=1-α衰减后的初始移动用户偏好Q计算公式如下:Q=K*γ步骤33:更新衰减后的当前移动用户偏好Q';由步骤2计算当前移动用户偏好K',如果当前移动用户偏好列表中的偏好包含初始移动用户偏好,则将当前移动用户偏好K'与衰减后的初始移动用户偏好Q相加;否则,衰减后的当前移动用户偏好Q'即为K'。Q'表示衰减后的当前移动用户偏好,计算公式:Q'=Q+K'=K*γ+K'K=0时,表示当前移动用户偏好列表中的偏好不包含初始移动用户偏好。步骤4:引入空间分布规律,精确识别用户偏好:步骤41:获取移动用户位置信息;根据移动用户信令数据中记录的基站LAC和CELL-ID以及事件类型,获取用户位置。步骤42:确定移动用户空间位置-移动用户偏好之间关联关系;根据步骤41获得移动用户位置信息,步骤1、2和3获得的初始移动用户偏好、当前移动用户偏好、衰减后的初始移动用户偏好和衰减后的当前移动用户偏好,得到移动用户空间位置对应的移动用户偏好之间的关联关系。步骤43:更新移动用户偏好随着空间位置的变化;根据步骤42获得移动用户偏好与位置信息之间的关联关系,追踪移动用户的移动轨迹更新移动用户偏好。进一步,所述移动用户行为包括:浏览、收藏、分享。进一步,所述访问阈值2<N<10,N最优值取4。本专利技术提出一种多维度移动用户偏好识别方法。通过引入移动用户偏好衰减因子,动态更新移动用户偏好时间变化情况,再结合移动用户偏好的空间变化规律,解决用户偏好动态改变的问题,更加精准的识别移动用户偏好,以便提供个性化的服务。附图说明图1本专利技术的处理流程图;图2本专利技术在时间维度动态更新移动用户偏好流程图;图3本专利技术时间-空间维度移动用户偏好流程图。具体实施例以下结合实施例来具体说明本专利技术,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。参见图1、图2和图3,本专利技术实施例提供一种多维度移动用户偏好动态识别方法,根据移动用户访问时间间隔,引入衰减因子,随时间变化动态更新移动用户偏好,然后分析移动用户偏好的空间变化规律,更加精准的识别移动用户偏好,以便提供个性化的服务。步骤1:获取移动用户上网数据,每条数据记录包括用户ID、用户访问发生时间、用户访问地基站信息、URL信息,结合应用分类库如下:分类规则类别网站http://sports.shouhu.com/*体育搜狐网http://ent.qq.com/*娱乐腾讯网http://news.qq.com/*新闻腾讯网………………识别移动用户访问应用。步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N(N=4)行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好。然后根据移动用户行为,包括“浏览”、“收藏”、“分享”等,赋予移动用户不同偏好于权重。例如,由步骤1识别移动用户访问“新浪新闻”5次,“美图”1次,分享“电影”4次,计算用户访问各应用占比:“新浪新闻”0.5,“美图”因为只访问一次小于既定阈值,不是用户偏好,“视频”0.4;然后分析移动用户行为,赋予不同的行为不同的权重,“浏览”40,“收藏”60,“分享”90等。由移动用户初始偏好计算公式可得,初始移动用户偏好分别为“新浪新闻”20,“视频”36。步骤3:随着时间的变化用户初始偏好可能会发生变化,需要动态识别用户偏好。由步骤2得到初始移动用户偏好的数值,按一定的偏好更新比例计算衰减后的初始移动用户偏好Q。所述偏好更新比例的计算方式是时间间隔越大,衰减比例越大,更新比例越小,例如,可以用“1-衰减因子”来表示该比例。假如,衰减因子等于0.3,那么偏好更新比例等于0.7。例如,以0.7为偏好更新比例计算衰减后的当前移动用户偏好。首先,由步骤2得到初始移动用户偏好“新浪新闻”20,“电影”36。再按照步骤2计算当前移动用户偏好,假如,“电影”20,“音乐”40。然后,计算衰减后的初始移动用户偏好Q,“新浪新闻”14,“电影”25.2。最后,采用如下公式计算衰减后的当前用户偏好Q':Q'=K*γ+K'K为初始移动用户偏好(K=0表示当前移动用户偏好列本文档来自技高网...
【技术保护点】
一种多维度移动用户偏好动态识别方法,其特征在于,该方法的步骤如下:步骤1:分析移动用户上网数据,结合移动应用分类库,生成移动用户访问记录;所述移动用户访问记录包括用户ID、用户访问发生时间、用户访问地基站信息、用户访问的应用名;步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N进行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好;然后根据不同的移动用户行为,赋予移动用户不同的偏好权重W;计算得初始移动用户偏好K:K=(nm)*W]]>其中m为移动用户访问的总频次数,表示用户访问频次比例;步骤3:由步骤2计算得初始移动用户偏好,随着时间的变化用户初始偏好发生变化,动态识别用户偏好,其具体步骤为:步骤31:根据当前移动用户访问记录计算用户访问各个应用的频次,获取当前移动用户偏好,由步骤2计算公式得当前移动用户偏好K';步骤32:计算移动用户偏好的衰减;引入衰减因子α,根据访问时间间隔确定相应的衰减因子数值;衰减因子α计算公式如下:α=β*(ti‑tj)ti‑tj表示两次相邻访问的时间间隔,β为相关系数;衰减后的偏好比例系数γ:γ=1‑α衰减后的初始移动用户偏好Q计算公式如下:Q=K*γ步骤33:更新衰减后的当前移动用户偏好Q';由步骤2计算当前移动用户偏好K',如果当前移动用户偏好列表中的偏好包含初始移动用户偏好,则将当前移动用户偏好K'与衰减后的初始移动用户偏好Q相加;否则,衰减后的当前移动用户偏好Q'即为K';Q'表示衰减后的当前移动用户偏好,计算公式:Q'=Q+K'=K*γ+K'K=0时,表示当前移动用户偏好列表中的偏好不包含初始移动用户偏好;步骤4:引入空间分布规律,精确识别用户偏好:步骤41:获取移动用户位置信息;根据移动用户信令数据中记录的基站LAC和CELL‑ID以及事件类型,获取用户位置;步骤42:确定移动用户空间位置‑移动用户偏好之间关联关系;根据步骤41获得移动用户位置信息,步骤1、2和3获得的初始移动用户偏好、当前移动用户偏好、衰减后的初始移动用户偏好和衰减后的当前移动用户偏好,得到移动用户空间位置对应的移动用户偏好之间的关联关系;步骤43:更新移动用户偏好随着空间位置的变化;根据步骤42获得移动用户偏好与位置信息之间的关联关系,追踪移动用户的移动轨迹更新移动用户偏好。...
【技术特征摘要】
1.一种多维度移动用户偏好动态识别方法,其特征在于,该方法的步骤如下:步骤1:分析移动用户上网数据,结合移动应用分类库,生成移动用户访问记录;所述移动用户访问记录包括用户ID、用户访问发生时间、用户访问地基站信息、用户访问的应用名;步骤2:根据移动用户访问记录计算用户访问各个应用的频次,与已知的访问阈值N进行比较,判断用户所访问应用是否属于用户偏好,如果n<N,不是用户偏好,如果n>N,则为用户偏好;然后根据不同的移动用户行为,赋予移动用户不同的偏好权重W;计算得初始移动用户偏好K: K = ( n m ) * W ]]>其中m为移动用户访问的总频次数,表示用户访问频次比例;步骤3:由步骤2计算得初始移动用户偏好,随着时间的变化用户初始偏好发生变化,动态识别用户偏好,其具体步骤为:步骤31:根据当前移动用户访问记录计算用户访问各个应用的频次,获取当前移动用户偏好,由步骤2计算公式得当前移动用户偏好K';步骤32:计算移动用户偏好的衰减;引入衰减因子α,根据访问时间间隔确定相应的衰减因子数值;衰减因子α计算公式如下:α=β*(ti-tj)ti-tj表示两次相邻访问的时间间隔,β为相关系数;衰减后的偏好比例系数γ:γ=1-α衰减后的初始移动用户偏好Q...
【专利技术属性】
技术研发人员:程克非,李耀辉,雒江涛,易燕,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。