基于用户浏览行为的用户属性值计算方法和计算装置制造方法及图纸

技术编号:16128780 阅读:26 留言:0更新日期:2017-09-01 20:49
本申请的具体实施例提供了一种基于用户浏览行为的用户属性值计算方法和计算装置,其中,用户属性值计算方法包括:从用户信息数据库中调取用户日常访问的历史网页;根据页面属性值数据库获取所述历史网页对应的页面属性值;根据所述页面属性值获得对应用户的用户属性值。用户属性值计算装置包括:调度设备,用于从用户信息数据库中调取用户日常访问的历史网页;获取设备,用于根据页面属性值数据库获取所述历史网页对应的页面属性值;获得设备,用于根据所述页面属性值获得对应用户的用户属性值。本申请不需要用户申请即可以充分了解用户的属性信息,便于有针对性地进行服务推送或信息提供。

Method and device for calculating user attribute value based on user browsing behavior

The specific embodiment of the application provides a calculating method and device, the user attribute value based on user browsing behavior, the user attribute value calculation method includes: from the user information database and obtain the user daily access historical web page according to the attribute; obtaining the web page corresponding to the attribute value of history database according to the value; the page attribute value corresponding user attribute values for the user. User attribute value calculation device includes: dispatching equipment, used from the user information database and obtain the user daily access history page; acquiring device for the page according to the attribute value page attribute database to obtain the history of \the corresponding value; to obtain equipment, according to the attribute value to obtain the corresponding user properties page user value. This application does not require user application, that is, it can fully understand the user's attribute information and facilitate targeted service push or information provision.

【技术实现步骤摘要】
基于用户浏览行为的用户属性值计算方法和计算装置
本申请涉及计算机领域,尤其涉及一种获取用户属性值的方法,具体来说就是一种基于用户浏览行为的用户属性值计算方法和计算装置。
技术介绍
随着互联网的发展,特别是近年来互联网与金融的有机结合,如何利用互联网中积累的大数据信息有效服务于金融行业成为一个亟待解决的技术问题。在大数据时代,用户访问的绝大部分日志信息都会被记录下来,包括用户的登录信息、浏览行为信息、鼠标移动信息、击键行为信息以及用户属性信息等等。由于不同的网页站点往往具有不同的主题,譬如有些网页站点主要关注金融领域,有些网页站点主要关注科技领域,还有些网页站点主要关注政治领域。因此,根据用户日常浏览的网页,可以分析出用户的多种行为。具体到互联网金融领域,金融领域的网页站点一般可以包括投资理财相关的页面和借贷相关的页面,通常来说,一个有投资需求的用户更多地会去访问投资理财方面的页面,关注投资收益率和风险等方面的信息;而一个具有借贷需求的用户更多地会去访问借款方面的页面,关注借款利率和借款期限等方面信息。因而,根据用户的日常浏览的有关金融方面的网页,可以得知用户的资金需求。了解用户的资金需求属性值,无论是在用户的营销方面,还是在资金的融资配置方面都具有很大的用处。因此,本领域技术人员亟待研发出一种基于用户浏览行为获得用户资金需求的方法,以便金融服务商利用互联网中的大数据信息有效服务于互联网金融行业,促进互联网金融行业的发展。
技术实现思路
有鉴于此,本申请要解决的技术问题就是提供一种基于用户浏览行为的用户属性值计算方法和计算装置,解决了现有技术中无法根据用户浏览网页的行为获得用户属性值的问题。为了解决上述问题,本申请的具体实施方式提供一种基于用户浏览行为的用户属性值计算方法,包括:从用户信息数据库中调取用户日常访问的历史网页;根据页面属性值数据库获取所述历史网页对应的页面属性值;根据所述页面属性值获得对应用户的用户属性值。本申请的另一具体实施方式还提供一种基于用户浏览行为的用户属性值计算装置,包括:调度设备,用于从用户信息数据库中调取用户日常访问的历史网页;获取设备,用于根据页面属性值数据库获取所述历史网页对应的页面属性值;获得设备,用于根据所述页面属性值获得对应用户的用户属性值。根据本申请的上述具体实施方式,可以得知基于用户浏览行为的用户属性值计算方法和计算装置至少具有以下有效效果或特点:主要是通过对用户日常访问网站的日志进行分析,对访问页面进行大数据信息挖掘,设计统计模型判别出用户的属性值,不需要用户进行申请操作即可以充分了解用户的需求,便于有针对性地向用户推送信息或提供服务,进而促使国民经济的快速发展。当然实施本申请的任一产品或者方法必不一定需要同时达到以上所述的所有优点。应了解的是,上述一般描述及以下具体实施方式仅为示例性及阐释性的,其并不能限制本申请所欲主张的范围。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请具体实施方式提供的一种基于用户浏览行为的用户属性值计算方法的流程图;图2为本申请具体实施方式提供的一种基于用户浏览行为的页面属性值数据库的生成流程图;图3为本申请具体实施方式提供的一种基于用户浏览行为的用户属性值计算方法的综合流程图;图4为本申请具体实施方式提供的一种基于用户浏览行为的用户属性值计算装置的框图;图5为本申请具体实施方式提供的一种基于用户浏览行为的网页属性值的求解单元的框图;图6为本申请具体实施方式提供的一种基于用户浏览行为的用户属性值计算装置的总体框图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚明白,下面将以附图及详细叙述清楚说明本申请所揭示内容的精神,任何所属
技术人员在了解本申请内容的实施例后,当可由本申请内容所教示的技术,加以改变及修饰,其并不脱离本申请内容的精神与范围。本申请的示意性实施例及其说明用于解释本申请,但并不作为对本申请的限定。另外,在附图及实施方式中所使用相同或类似标号的元件/构件是用来代表相同或类似部分。关于本文中所使用的“第一”、“第二”、…等,并非特别指称次序或顺位的意思,也非用以限定本申请,其仅为了区别以相同技术用语描述的元件或操作。关于本文中所使用的方向用语,例如:上、下、左、右、前或后等,仅是参考附图的方向。因此,使用的方向用语是用来说明并非用来限制本创作。关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。关于本文中所使用的“及/或”,包括所述事物的任一或全部组合。关于本文中所使用的用语“大致”、“约”等,用以修饰任何可以微变化的数量或误差,但这些微变化或误差并不会改变其本质。一般而言,此类用语所修饰的微变化或误差的范围在部分实施例中可为20%,在部分实施例中可为10%,在部分实施例中可为5%或是其他数值。本领域技术人员应当了解,前述提及的数值可依实际需求而调整,并不以此为限。某些用以描述本申请的用词将于下或在此说明书的别处讨论,以提供本领域技术人员在有关本申请的描述上额外的引导。图1为本申请具体实施方式提供的一种基于用户浏览行为的用户属性值计算方法的流程图,本申请通过对用户日常访问网站的日志进行分析,对访问网页进行数据挖掘,获得用户对需求(例如投资需求或者借贷需求),不需要用户进行申请操作即可以充分了解用户的需求,便于有针对性地向用户推送信息或提供服务。该附图具体实施方式包括:步骤101:从用户信息数据库中调取用户日常访问的历史网页。本申请的具体实施例中,收集各个业务场景中用户浏览的网页,假如把用户A访问的网页记为U(A)={u1,u2,…,un},其中ui表示用户A访问的每一个网页的URL,n表示在预定历史阶段中用户A访问的网页的数量,预定历史阶段可以为过去一个月、半年、一年、三年等,历史网页包括用户日常访问的多种网页,包括新闻类网页、科技类网页、理财借贷类网页、政治娱乐类网页等。用户信息数据库可以为某一大型网站记录的用户浏览信息,也可以为多家网站联合记录的用户浏览信息,存储在一个多家共享的数据库中,供多家服务系统调用,本申请不以此为限。步骤102:滤除历史网页中与目标属性无关的网页。本申请的具体实施例中,为了节省后续处理开销,可以根据业务需求或目标属性指定后续待分析的网页,譬如过滤掉历史网页中不属于指定站点的网页,即保留与理财借贷相关的站点(网站)的网页,譬如陆金所、人人贷和你我贷等相关的投资理财和借贷相关的站点网页。指定的待分析网页的URL列表为F={f1,f2,…,fm},fi表示第i个指定的URL,其中m表示指定的URL的数量。本申请的具体实施例中,步骤102进一步包括:步骤1021:收集与目标属性相关的站点网页。假如本申请的目标属性为了获取用户的资金需要信息,那么与理财借贷相关的站点包括:陆金所、人人贷、你我贷等与投资理财和借贷融资相关的站点。步骤1022:根据URL滤除历史网页中不属于所述站点网页的网页。由于每个本文档来自技高网
...
基于用户浏览行为的用户属性值计算方法和计算装置

【技术保护点】
一种基于用户浏览行为的用户属性值计算方法,其特征在于,该用户属性值计算方法包括:从用户信息数据库中调取用户日常访问的历史网页;根据页面属性值数据库获取所述历史网页对应的页面属性值;以及根据所述页面属性值获得对应用户的用户属性值。

【技术特征摘要】
1.一种基于用户浏览行为的用户属性值计算方法,其特征在于,该用户属性值计算方法包括:从用户信息数据库中调取用户日常访问的历史网页;根据页面属性值数据库获取所述历史网页对应的页面属性值;以及根据所述页面属性值获得对应用户的用户属性值。2.如权利要求1所述的基于用户浏览行为的用户属性值计算方法,其特征在于,根据页面属性值数据库获取所述历史网页对应的页面属性值的步骤之前,该用户属性值计算方法还包括:滤除历史网页中与目标属性无关的网页,以便计算经过滤除处理的历史网页的页面属性值。3.如权利要求2所述的基于用户浏览行为的用户属性值计算方法,其特征在于,滤除历史网页中与目标属性无关的网页,具体包括:收集与目标属性相关的站点网页;以及根据URL滤除历史网页中不属于所述站点网页的网页。4.如权利要求1所述的基于用户浏览行为的用户属性值计算方法,其特征在于,根据所述页面属性值获得对应用户的用户属性值的步骤之后,该用户属性值计算方法还包括:根据所述用户属性值向对应用户推送特定信息。5.如权利要求1所述的基于用户浏览行为的用户属性值计算方法,其特征在于,根据所述页面属性值获得对应用户的用户属性值,具体包括:获取用户访问每个历史网页的访问时间;根据所述访问时间给对应的所述页面属性值分配权值;以及根据所述页面属性值和所述权值获得对应用户的用户属性值。6.如权利要求1所述的基于用户浏览行为的用户属性值计算方法,其特征在于,所述页面属性值数据库的具体生成步骤包括:收集与目标属性相关的站点网页;处理所述站点网页从而获得对应所述站点网页的词表;计算所述词表中每个词的属性值;根据所述属性值获得每个所述站点网页对应的页面属性值;以及根据所述站点网页对应的页面属性值生成页面属性值数据库。7.如权利要求6所述的基于用户浏览行为的用户属性值计算方法,其特征在于,处理所述站点网页,具体包括:获取所述站点网页的信息;对所述信息进行归一化处理获得标准信息;以及对所述标准信息分词处理从而获得对应所述站点网页的词表。8.如权利要求7所述的基于用户浏览行为的用户属性值计算方法,其特征在于,获取所述站点网页的信息的步骤之前,处理所述站点网页的步骤还包括:获得所述站点网页的访问热度,以便根据所述访问热度获取所述站点网页的信息。9.如权利要求6所述的基于用户浏览行为的用户属性值计算方法,其特征在于,计算所述词表中每个词的属性值的步骤之前,所述页面属性值数据库的具体生成步骤还包括:以网页为单位从所述词表随机选取预定比例的词,以便计算随机选取的词的属性值。10.如权利要求9所述的基于用户浏览行为的用户属性值计算方法,其特征在于,随机选取的词的所述属性值P(di)的计算公式为:其中,|dij|为词表中第di个词在随机选取的第j个站点网页cj中出现的次数,i≤s,s为词表中词的数量;yj为第j个站点网页的标签,标签为+1表示正属性,标签为-1表示负属性;z为随机选取的站点网页的数量,z≤m,j≤z,m为站点网页的数量。11.如权利要求6所述的...

【专利技术属性】
技术研发人员:李辉高俊鑫沈栋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1