一种通过大数据对无纸化信息进行挖掘推送方法技术

技术编号:20546009 阅读:64 留言:0更新日期:2019-03-09 18:56
本发明专利技术公开了一种通过大数据对无纸化信息进行挖掘推送方法,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。本发明专利技术能够对阅读新闻的浏览者进行感兴趣的信息进行推送,引起浏览人的关注。

A Method of Mining and Pushing Paperless Information by Big Data

The invention discloses a method for mining and pushing paperless information through large data, which includes the following steps: S1, obtaining the data browsed by the first browser and the data browsed by the second browser who browses the same data with the first browser, forming a browsing database; S2, processing the data in the browsing database, obtaining the first browser and the second browser. To judge whether the correlation between the first browser and the second browser is greater than or equal to the preset correlation value: if the correlation between the first browser and the second browser is greater than or equal to the preset correlation value, the second browser is executed; if the correlation between the first browser and the second browser is smaller than the preset correlation value, the next browser will be executed. As a second browser, a browser executes 2; S3 to push data of interest to the first browser. The invention can push the interested information of the viewer who reads the news and arouse the attention of the viewer.

【技术实现步骤摘要】
一种通过大数据对无纸化信息进行挖掘推送方法
本专利技术涉及一种信息推送
,特别是涉及一种通过大数据对无纸化信息进行挖掘推送方法。
技术介绍
由于手机随身携带、以及用户浏览手机中信息较为频繁的特点,依托于手机进行各种新闻的浏览,如何给浏览者推送浏览者感兴趣的新闻,引起浏览者的关注,是现目前亟待解决的问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种通过大数据对无纸化信息进行挖掘推送方法。为了实现本专利技术的上述目的,本专利技术公开了一种通过大数据对无纸化信息进行挖掘推送方法,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。在本专利技术的一种优选实施方式中,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v共同浏览的历史浏览数据,计算浏览人u和浏览人v间的共同浏览相关性,若共同浏览相关性大于或等于预设第一相关性,则浏览人v与浏览人u相关,否则浏览人v与浏览人u不相关;其浏览人u和浏览人v间的共同浏览相关性的计算方法为:其中,sim(u,v)′是浏览人u和浏览人v之间的共同浏览相关性;Ru,k是浏览人u对共同浏览项目集合Iu,v中浏览项目k的浏览值;是浏览人u对共同浏览项目集合Iu,v的平均浏览值;Rv,k是浏览人v对共同浏览项目集合Iu,v中浏览项目k的浏览值;是浏览人v对共同浏览项目集合Iu,v的平均浏览值;Iu,v是浏览人u和浏览人v共同浏览项目的集合;α是浏览人u和浏览人v的第一调节系数,取值范围(0,1)。在本专利技术的一种优选实施方式中,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v所有浏览的历史浏览数据,若共同浏览相关性大于或等于预设第一相关性,则判断所有浏览相关性是否大于或等于预设第二相关性,若所有浏览相关性大于或等于预设第二相关性,所述预设第二相关性大于预设第一相关性,则浏览人u与浏览人v相关,否则浏览人u和浏览人v不相关;其浏览人u和浏览人v间的所有浏览相关性的计算方法为:其中,sim(u,v)″是浏览人u和浏览人v之间的所有浏览相关性;Iu是浏览人u所有浏览项目的集合;Iv是浏览人v所有浏览项目的集合;β为第二调节参数,且为小于α的正数;Su,p是浏览人u对浏览项目集合Iu中浏览项目p的浏览值;是浏览人u对浏览项目集合Iu的平均浏览值;Sv,g是浏览人v对浏览项目集合Iv中浏览项目g的浏览值;是浏览人v对浏览项目集合Iv的平均浏览值。在本专利技术的一种优选实施方式中,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v各自单独浏览的历史浏览数据,若共同浏览相关性大于或等于预设第一相关性,或/和所有浏览相关性大于或等于预设第二相关性,则判断单独浏览互斥性是否大于或等于预设互斥性,若单独浏览互斥性大于或等于预设互斥性,则浏览人u与浏览人v不相关,否则浏览人u和浏览人v相关;其浏览人u和浏览人v间的单独浏览互斥性的计算方法为:其中,sim(u,v)″′是浏览人u和浏览人v之间的浏览互斥性;Hu是浏览人u单独浏览项目的集合,不包括浏览人v浏览的集合;Hv是浏览人v单独浏览项目的集合,不包括浏览人u浏览的集合;χ为第三调节参数,取值范围(0,1);Ju,b是浏览人u对浏览项目集合Hu中浏览项目b的浏览值;是浏览人u对浏览项目集合Hu的平均浏览值;Zv,d是浏览人v对浏览项目集合Hv中浏览项目d的浏览值;是浏览人v对浏览项目集合Hv的平均浏览值。在本专利技术的一种优选实施方式中,步骤S3中推送的计算方法为:判断第一浏览人的推送值,若推送值大于或等于预设阈值,则将第二浏览者浏览的项目推送给第一浏览者,否则不将第二浏览者浏览的项目推送给第一浏览者;其中,和分别依次为预设第一相关性、预设第二相关性和预设互斥性;Pu是浏览人u的浏览推送值;是浏览人u对浏览项目集合Iu的平均浏览值;是浏览人u对共同浏览项目集合Iu,v的平均浏览值;是浏览人u对浏览项目集合Hu的平均浏览值;sim(u,v)′是浏览人u和浏览人v之间的共同浏览相关性;sim(u,v)″是浏览人u和浏览人v之间的所有浏览相关性;sim(u,v)″′是浏览人u和浏览人v之间的浏览互斥性。在本专利技术的一种优选实施方式中,还包括比较第一浏览人与第二浏览人的地理位置,具体包括以下步骤:S61,服务器接收到第一浏览人浏览请求,判断第一浏览人是否登录账号:若第一浏览人未登录账号,则服务器记录第一浏览人使用的第一客户端的ID作为第一浏览人的账号,并获取浏览时第一浏览人所处地理位置;若第一浏览人登录了账号,则服务器向第一客户端发送是否合并第一客户端未登录账号时的浏览记录:若服务器接收到合并第一客户端未登录账号时的浏览记录,则将未登录账号时的浏览记录合并到登录账号上,并获取浏览时第一浏览人所处地理位置;若服务器接收到不合并第一客户端未登录账号时的浏览记录,则不将未登录账号时的浏览记录合并到登录账号上,并获取浏览时第一浏览人所处地理位置;S62,服务器接收到第二浏览人浏览请求,判断第二浏览人是否登录账号:若第二浏览人未登录账号,则服务器记录第二浏览人使用第二客户端的ID作为第二浏览人的账号,并获取浏览时第二浏览人所处地理位置;若第二浏览人登录了账号,则服务器向第二客户端发送是否合并第二客户端未登录账号时的浏览记录:若服务器接收到合并第二客户端未登录账号时的浏览记录,则将未登录账号时的浏览记录合并到登录账号上,并获取浏览时第而浏览人所处地理位置;若服务器接收到不合并第二客户端未登录账号时的浏览记录,则不将未登录账号时的浏览记录合并到登录账号上,并获取浏览时第而浏览人所处地理位置;S63,判断第一浏览人与第二浏览人的地理位置是否属于同一区域:若第一浏览人与第二浏览人的地理位置属于同一区域,则将第二浏览人浏览的数据放入浏览数据库;若第一浏览人与第二浏览人的地理位置不属于同一区域,则不将第二浏览人浏览的数据放入浏览数据库。在本专利技术的一种优选实施方式中,还包括账号的登录:在服务器端预设有唯一的鉴权账号及与所述鉴权账号相对应的鉴权密码,判断客户端输入的鉴权账号、鉴权密码和验证码与服务器端上的鉴权账号和鉴权密码及服务器发送的验证码是否一致;若客户端输入的鉴权账号、鉴权密码和验证码与服务器端上的鉴权账号和鉴权密码及服务器发送的验证码一致,则登录成功;若客户端输入的鉴权账号与服务器端预设的所有鉴权账号均不一致,则提示输入的鉴权账号不存在,重新输入鉴权账号、鉴权密码和验证码;若客户端输入的鉴权密码与服务器上预设的鉴权账号所对应的鉴权密码不一致,则提示输入的鉴权密码错误,重新输入鉴权账号、鉴权密码和验证码;若客户端输入的验证码与服务器端发送的验证码不一致,则提示输入的验证码错误,服务器端重新发送新的验证码,重新输本文档来自技高网...

【技术保护点】
1.一种通过大数据对无纸化信息进行挖掘推送方法,其特征在于,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。

【技术特征摘要】
1.一种通过大数据对无纸化信息进行挖掘推送方法,其特征在于,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。2.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v共同浏览的历史浏览数据,计算浏览人u和浏览人v间的共同浏览相关性,若共同浏览相关性大于或等于预设第一相关性,则浏览人v与浏览人u相关,否则浏览人v与浏览人u不相关;其浏览人u和浏览人v间的共同浏览相关性的计算方法为:其中,sim(u,v)′是浏览人u和浏览人v之间的共同浏览相关性;Ru,k是浏览人u对共同浏览项目集合Iu,v中浏览项目k的浏览值;是浏览人u对共同浏览项目集合Iu,v的平均浏览值;Rv,k是浏览人v对共同浏览项目集合Iu,v中浏览项目k的浏览值;是浏览人v对共同浏览项目集合Iu,v的平均浏览值;Iu,v是浏览人u和浏览人v共同浏览项目的集合;α是浏览人u和浏览人v的第一调节系数,取值范围(0,1)。3.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v所有浏览的历史浏览数据,若共同浏览相关性大于或等于预设第一相关性,则判断所有浏览相关性是否大于或等于预设第二相关性,若所有浏览相关性大于或等于预设第二相关性,所述预设第二相关性大于预设第一相关性,则浏览人u与浏览人v相关,否则浏览人u和浏览人v不相关;其浏览人u和浏览人v间的所有浏览相关性的计算方法为:其中,sim(u,v)″是浏览人u和浏览人v之间的所有浏览相关性;Iu是浏览人u所有浏览项目的集合;Iv是浏览人v所有浏览项目的集合;β为第二调节参数,且为小于α的正数;Su,p是浏览人u对浏览项目集合Iu中浏览项目p的浏览值;是浏览人u对浏览项目集合Iu的平均浏览值;Sv,g是浏览人v对浏览项目集合Iv中浏览项目g的浏览值;是浏览人v对浏览项目集合Iv的平均浏览值。4.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v各自单独浏览的历史浏览数据,若共同浏览相关性大于或等于预设第一相关性,或/和所有浏览相关性大于或等于预设第二相关性,则判断单独浏览互斥性是否大于或等于预设互斥性,若单独浏览互斥性大于或等于预设互斥性,则浏览人u与浏览人v不相关,否则浏览人u和浏览人v相关;其浏览人u和浏览人v间的单独浏览互斥性的计算方法为:其中,sim(u,v)″′是浏览人u和浏览人v之间的浏览互斥性;Hu是浏览人u单独浏览项目的集合,不包括浏览人v浏览的集合;Hv是浏览人v单独浏览项目的集合,不包括浏览人u浏览的集合;χ为第三调节参数,取值范围(0,1);Ju,b是浏览人u对浏览项目集合Hu中浏览项目b的浏览值;是浏览人u对浏览项目集合Hu的平均浏览值;Zv,d是浏览人v对浏览项目集合Hv中浏览项目d的浏览值;是浏览人v对浏览项目集合Hv的平均浏览值。5.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S3中推送的计算方法为:判断第一浏览人的推送值,若推送值大于或等于预设阈值,则将第二浏览者浏览的项目推送给第一浏览者,否则...

【专利技术属性】
技术研发人员:杨琴陈银
申请(专利权)人:重庆扬升信息技术有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1