The invention discloses a method for mining and pushing paperless information through large data, which includes the following steps: S1, obtaining the data browsed by the first browser and the data browsed by the second browser who browses the same data with the first browser, forming a browsing database; S2, processing the data in the browsing database, obtaining the first browser and the second browser. To judge whether the correlation between the first browser and the second browser is greater than or equal to the preset correlation value: if the correlation between the first browser and the second browser is greater than or equal to the preset correlation value, the second browser is executed; if the correlation between the first browser and the second browser is smaller than the preset correlation value, the next browser will be executed. As a second browser, a browser executes 2; S3 to push data of interest to the first browser. The invention can push the interested information of the viewer who reads the news and arouse the attention of the viewer.
【技术实现步骤摘要】
一种通过大数据对无纸化信息进行挖掘推送方法
本专利技术涉及一种信息推送
,特别是涉及一种通过大数据对无纸化信息进行挖掘推送方法。
技术介绍
由于手机随身携带、以及用户浏览手机中信息较为频繁的特点,依托于手机进行各种新闻的浏览,如何给浏览者推送浏览者感兴趣的新闻,引起浏览者的关注,是现目前亟待解决的问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种通过大数据对无纸化信息进行挖掘推送方法。为了实现本专利技术的上述目的,本专利技术公开了一种通过大数据对无纸化信息进行挖掘推送方法,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。在本专利技术的一种优选实施方式中,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v共同浏览的历史浏览数据,计算浏览人u和浏览人v间的共同浏览相关性,若共同浏览相关性大于或等于预设第一相关性,则浏览人v与浏览人u相关,否则浏览人v与浏览人u不相关;其浏览人u和浏览人v间的共同浏览相关性的计算方法为:其中,sim(u,v)′是浏览人u和浏览人v之间的共同浏 ...
【技术保护点】
1.一种通过大数据对无纸化信息进行挖掘推送方法,其特征在于,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。
【技术特征摘要】
1.一种通过大数据对无纸化信息进行挖掘推送方法,其特征在于,包括以下步骤:S1,获取第一浏览人浏览的数据及与所述第一浏览人浏览相同数据的第二浏览人浏览的数据,形成浏览数据库;S2,对所述浏览数据库中的数据进行处理,获取第一浏览人与第二浏览人所浏览的相关性,判断第一浏览人与第二浏览人所浏览的相关性的大小是否大于或等于预设相关值:若第一浏览人与第二浏览人所浏览的相关性的大小大于或等于预设相关值,执行步骤S3;若第一浏览人与第二浏览人所浏览的相关性的大小小于预设相关值,则将下一位浏览人作为第二浏览人,执行步骤S2;S3,向第一浏览人推送第一浏览人感兴趣的数据。2.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v共同浏览的历史浏览数据,计算浏览人u和浏览人v间的共同浏览相关性,若共同浏览相关性大于或等于预设第一相关性,则浏览人v与浏览人u相关,否则浏览人v与浏览人u不相关;其浏览人u和浏览人v间的共同浏览相关性的计算方法为:其中,sim(u,v)′是浏览人u和浏览人v之间的共同浏览相关性;Ru,k是浏览人u对共同浏览项目集合Iu,v中浏览项目k的浏览值;是浏览人u对共同浏览项目集合Iu,v的平均浏览值;Rv,k是浏览人v对共同浏览项目集合Iu,v中浏览项目k的浏览值;是浏览人v对共同浏览项目集合Iu,v的平均浏览值;Iu,v是浏览人u和浏览人v共同浏览项目的集合;α是浏览人u和浏览人v的第一调节系数,取值范围(0,1)。3.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v所有浏览的历史浏览数据,若共同浏览相关性大于或等于预设第一相关性,则判断所有浏览相关性是否大于或等于预设第二相关性,若所有浏览相关性大于或等于预设第二相关性,所述预设第二相关性大于预设第一相关性,则浏览人u与浏览人v相关,否则浏览人u和浏览人v不相关;其浏览人u和浏览人v间的所有浏览相关性的计算方法为:其中,sim(u,v)″是浏览人u和浏览人v之间的所有浏览相关性;Iu是浏览人u所有浏览项目的集合;Iv是浏览人v所有浏览项目的集合;β为第二调节参数,且为小于α的正数;Su,p是浏览人u对浏览项目集合Iu中浏览项目p的浏览值;是浏览人u对浏览项目集合Iu的平均浏览值;Sv,g是浏览人v对浏览项目集合Iv中浏览项目g的浏览值;是浏览人v对浏览项目集合Iv的平均浏览值。4.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S2中相关性的计算方法为:获取浏览人u和浏览人v各自单独浏览的历史浏览数据,若共同浏览相关性大于或等于预设第一相关性,或/和所有浏览相关性大于或等于预设第二相关性,则判断单独浏览互斥性是否大于或等于预设互斥性,若单独浏览互斥性大于或等于预设互斥性,则浏览人u与浏览人v不相关,否则浏览人u和浏览人v相关;其浏览人u和浏览人v间的单独浏览互斥性的计算方法为:其中,sim(u,v)″′是浏览人u和浏览人v之间的浏览互斥性;Hu是浏览人u单独浏览项目的集合,不包括浏览人v浏览的集合;Hv是浏览人v单独浏览项目的集合,不包括浏览人u浏览的集合;χ为第三调节参数,取值范围(0,1);Ju,b是浏览人u对浏览项目集合Hu中浏览项目b的浏览值;是浏览人u对浏览项目集合Hu的平均浏览值;Zv,d是浏览人v对浏览项目集合Hv中浏览项目d的浏览值;是浏览人v对浏览项目集合Hv的平均浏览值。5.根据权利要求1所述的通过大数据对无纸化信息进行挖掘推送方法,其特征在于,步骤S3中推送的计算方法为:判断第一浏览人的推送值,若推送值大于或等于预设阈值,则将第二浏览者浏览的项目推送给第一浏览者,否则...
【专利技术属性】
技术研发人员:杨琴,陈银,
申请(专利权)人:重庆扬升信息技术有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。