基于二维码洞察用户路径的方法及系统技术方案

技术编号:34376155 阅读:21 留言:0更新日期:2022-07-31 13:35
本发明专利技术涉及用户路径洞察技术领域,解决了无法精准的体现用户特征以及描述用户画像不够准确的技术问题,尤其涉及一种基于二维码洞察用户路径的方法,包括以下过程:获取用户上网记录数据;将上述获取的用户上网记录数据进行数据预处理,将经过预处理的用户上网记录数据输入用户访问兴趣度模型,其中用户访问兴趣度模型包括定义访问路径、定义子路径、定义兴趣度、定义兴趣度阈值以及定义兴趣路径。本发明专利技术能够通过洞察用户路径信息提高业务质量,满足用户个性化的需求,在海量数据中发现用户的信息,充分利用大数据技术挖掘用户的特征,找到用户的实际需求或潜在需求。到用户的实际需求或潜在需求。到用户的实际需求或潜在需求。

Method and system of user path insight based on QR code

【技术实现步骤摘要】
基于二维码洞察用户路径的方法及系统


[0001]本专利技术涉及用户路径洞察
,尤其涉及一种基于二维码洞察用户路径的方法及系统。

技术介绍

[0002]随着移动互联网蓬勃发展,大部分的用户越来越不满足于传统的业务服务和大众化服务,用户对个性化服务要求越来越高,企业通过整合和分析用户路径信息,并结合用户路径信息挖掘用户特征,描述用户画像,帮助向用户有针对的营销比如,精准营销,根据产品的属性,匹配符合该产品的目标用户,从而占据竞争优势、提高收益。
[0003]而目前针对用户在Web所产生的用户浏览访问记录日志,在通过Web日志洞察用户路径信息中,并没有把访问路径作为序列来考虑,或者没有考虑访问的时间,导致识别出来的用户路径粒度太粗,在时间因素上的考虑也有欠缺,没有挖掘出用户真正的浏览路径,从而导致不能够精确地体现出用户特征,描述用户画像不够准确。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种基于二维码洞察用户路径的方法及系统,解决了无法精准的体现用户特征以及描述用户画像不够准确的技术问题,本专利技术能够通过洞察用户路径信息提高业务质量,满足用户个性化的需求,在海量数据中发现用户的信息,充分利用大数据技术挖掘用户的特征,找到用户的实际需求或潜在需求。
[0005]为解决上述技术问题,本专利技术提供了如下技术方案:一种基于二维码洞察用户路径的方法,包括以下过程:
[0006]获取用户上网记录数据,所述用户上网记录数据包括用户在Web所产生的用户浏览访问记录日志,其中用户浏览访问记录日志包括访问频度、访问时间以及访问兴趣;
[0007]将上述获取的用户上网记录数据进行数据预处理,所述数据预处理包括数据净化、用户会话识别以及事务路径提取;
[0008]将经过预处理的用户上网记录数据输入用户访问兴趣度模型,其中用户访问兴趣度模型包括定义访问路径、定义子路径、定义兴趣度、定义兴趣度阈值以及定义兴趣路径;
[0009]输出用户兴趣路径值,得出洞察用户路径信息。
[0010]进一步地,所述数据净化包括以下过程:
[0011]将Web日志转化为适合数据挖掘的可靠的精确的数据,Web日志记录包括用户IP地址、用户ID、用户请求访问的URL页面、请求方法、访问时间、传输协议、传输的字节数、错误代码相关属性;
[0012]删除Web日志中与数据挖掘不相关的冗余项,与数据挖掘相关的只有用户IP地址、用户请求访问的URL页面及访问时间,与数据挖掘不相关的冗余项则采用SQL语句进行清理。
[0013]进一步地,所述用户会话识别包括以下过程:
[0014]获取Web日志中有效的单次用户请求访问的URL页面及访问时间;
[0015]对用户有效的单次用户请求访问的URL页面及访问时间设定定义;
[0016]识别用户会话,如果用户连续的两页面时间的差值超过一定的界限则认为用户开始了一个新的会话。
[0017]进一步地,所述用户会话识别还包括以下过程:
[0018]对用户会话进行划分,将用户会话划分为具有一定语义的事务;
[0019]按一定时间排序内的所有访问事务构成事务会话集,其中事务会话集由多个用户访问行为组成,用户访问行为从Web日志数据中获取。
[0020]进一步地,所述从Web日志数据中获取用户访问行为包括以下过程:
[0021]对Web日志数据进行预处理,该处的预处理为上述的数据净化过程;
[0022]根据每一个访问者的IP地址划分Web日志,即在Web日志中寻找每一个访问者的访问记录集;
[0023]对每一个访问者的访问记录集,根据C进行分割,找到每一个访问者的每一次访问记录集,每一次访问集构成一个访问行为;
[0024]在访问事务中保留第一次出现的URL地址,如重复出现,其余的则被删除;
[0025]最终按时间排序的所有访问事务构成事务会话集。
[0026]进一步地,所述事务路径提取采用包括以下过程:
[0027]获取URL序列中当前访问页的引用页;
[0028]判断URL序列中当前访问页的引用页是否等于前一个访问页,如果URL序列中当前访问页的引用页等于前一个访问页,则将这两个访问页连接起来;
[0029]否则,将当前己连接起来的访问页作为一条MFP输出到哈希表中临时保存,同时从存放针对该会话已识别出的MFP的哈希表中找到包含该引用页的最近的一条MFP,并返回这条MFP从开始到出现引用页的那段路径,用于连接下一个访问页,重复上述过程,直至处理完URL序列中的最后一个访问页,最后,哈希表中的内容便是从该会话中识别出的MFP;
[0030]将一个用户的所有路径合并在一条记录中,最终在数据库显示中每个用户的信息包括:用户id、所有的事务路径、每个路径中每个访问页面对应的停留时间。
[0031]本专利技术还提供了一种用于执行上述洞察用户路径方法的装置,包括:
[0032]数据获取模块,所述数据获取模块用于取用户上网记录数据,所述用户上网记录数据包括用户在Web所产生的用户浏览访问记录日志,其中用户浏览访问记录日志包括访问频度、访问时间以及访问兴趣;
[0033]数据预处理模块,所述数据预处理模块用于将上述获取的用户上网记录数据进行数据预处理,所述数据预处理包括数据净化、用户会话识别以及事务路径提取;
[0034]输入模型模块,所述输入模型模块用于将经过预处理的用户上网记录数据输入用户访问兴趣度模型,其中用户访问兴趣度模型包括定义访问路径、定义子路径、定义兴趣度、定义兴趣度阈值以及定义兴趣路径;
[0035]输出模块,所述输出模块用于输出用户兴趣路径值,得出洞察用户路径信息。
[0036]本专利技术还提供了一种用于执行上述洞察用户路径方法以及装置的系统,包括:
[0037]用户端,所述用户端用于出示编码标签并授予权限;
[0038]识别设备,所述识别设备用于扫描用户端出示的编码标签并识别与其相对应的用
户信息;
[0039]本地服务器,所述本地服务器用于根据编码标签获取用户上网记录数据,并根据上网记录数据洞察用户路径信息;
[0040]运营商服务器,所述运营商服务器用于通过预设传输协议向本地服务器发送用户上网记录数据。
[0041]进一步地,所述编码标签为二维码。
[0042]借由上述技术方案,本专利技术提供了一种基于二维码洞察用户路径的方法及系统,至少具备以下有益效果:
[0043]1、本专利技术通过对访问路径作为序列来考虑并结合用户访问的时间,同时对用户上网记录数据进行数据预处理,并通过运算分析挖掘出用户真正的浏览路径,解决了无法精准的体现用户特征以及描述用户画像不够准确的技术问题。
[0044]2、本专利技术能够通过洞察用户路径信息提高业务质量,满足用户个性化的需求,保持、提高用户忠诚度,在海量数据中发现用户的信息,充分利用大数据技术挖掘用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于二维码洞察用户路径的方法,其特征在于,包括以下过程:获取用户上网记录数据,所述用户上网记录数据包括用户在Web所产生的用户浏览访问记录日志,其中用户浏览访问记录日志包括访问频度、访问时间以及访问兴趣;将上述获取的用户上网记录数据进行数据预处理,所述数据预处理包括数据净化、用户会话识别以及事务路径提取;将经过预处理的用户上网记录数据输入用户访问兴趣度模型,其中用户访问兴趣度模型包括定义访问路径、定义子路径、定义兴趣度、定义兴趣度阈值以及定义兴趣路径;输出用户兴趣路径值,得出洞察用户路径信息。2.根据权利要求1所述的基于二维码洞察用户路径的方法,其特征在于:所述数据净化包括以下过程:将Web日志转化为适合数据挖掘的可靠的精确的数据,Web日志记录包括用户IP地址、用户ID、用户请求访问的URL页面、请求方法、访问时间、传输协议、传输的字节数、错误代码相关属性;删除Web日志中与数据挖掘不相关的冗余项,与数据挖掘相关的只有用户IP地址、用户请求访问的URL页面及访问时间,与数据挖掘不相关的冗余项则采用SQL语句进行清理。3.根据权利要求1所述的基于二维码洞察用户路径的方法,其特征在于:所述用户会话识别包括以下过程:获取Web日志中有效的单次用户请求访问的URL页面及访问时间;对用户有效的单次用户请求访问的URL页面及访问时间设定定义;识别用户会话,如果用户连续的两页面时间的差值超过一定的界限则认为用户开始了一个新的会话。4.根据权利要求1所述的基于二维码洞察用户路径的方法,其特征在于:所述用户会话识别还包括以下过程:对用户会话进行划分,将用户会话划分为具有一定语义的事务;按一定时间排序内的所有访问事务构成事务会话集,其中事务会话集由多个用户访问行为组成,用户访问行为从Web日志数据中获取。5.根据权利要求4所述的基于二维码洞察用户路径的方法,其特征在于:所述从Web日志数据中获取用户访问行为包括以下过程:对Web日志数据进行预处理,该处的预处理为上述的数据净化过程;根据每一个访问者的IP地址划分Web日志,即在Web日志中寻找每一个访问者的访问记录集;对每一个访问者的访问记录集,根据C进行分割,找到每一个访问者的每一次访问记录集,每一次访问集构成一个访问行为;在访问事务中保留第一次出现的URL地址,如重复出现,其余的则被删除;最终按时间排序的所有访问事务构成事务会话集。6....

【专利技术属性】
技术研发人员:锁进
申请(专利权)人:杭州澍脉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1