本发明专利技术涉及基于浏览器图标缓存的持久化身份识别方法、介质、设备,分配每个访问用户的唯一标识并与浏览器图标缓存绑定;任一用户访问网站时,利用URL
【技术实现步骤摘要】
基于浏览器图标缓存的持久化身份识别方法、介质、设备
[0001]本专利技术涉及计算;推算;计数的
,特别涉及信息安全
的基于浏览器图标缓存的持久化身份识别方法、介质、设备。
技术介绍
[0002]现代网站中,对匿名用户身份的追踪是十分重要的一部分,为了预防或是追踪恶意行为,网站常常需要能够借助基于IP、cookie以外的手段来追踪用户身份,同时由于现代浏览器的不断完善发展,使得各类新型追踪手段不断出现。
[0003]事实上,现代浏览器为了提高网站性能与可访问性等指标,提供了多样的缓存方式,例如localstorage、index DB等,这类缓存能够较简单地通过浏览器设置进行清除,因此处于用户控制范围内。
[0004]除以上常见缓存之外,浏览器中还存在一种favicon 缓存(F
‑
Cache,也就是用于存储网站图标的缓存)。2021年初,伊利诺伊大学芝加哥分校的Konstantinos Solomos等人即借由浏览器图标缓存机制,实现了对已访问用户的持久化指纹,其基于F
‑
Cache实现对访问用户的持久化指纹的实现。然而,该方法只能够为用户是否访问过某个网站提供依据,实现了基于F
‑
Cache的持久化指纹,而无法实现对用户具体身份的检测识别。
技术实现思路
[0005]本专利技术解决了现有技术中存在的问题,提供了一种基于浏览器图标缓存的持久化身份识别方法、介质、设备,通过对F
‑
Cache进行更加深入的发掘,利用F
‑
Cache中的URL
‑
缓存匹配机制实现了对具体用户身份的识别。
[0006]本专利技术所采用的技术方案是,一种基于浏览器图标缓存的持久化身份识别方法,所述方法分配每个访问用户的唯一标识并与浏览器图标缓存绑定;任一用户访问网站时,利用URL
‑
缓存匹配机制对用户的身份进行识别。
[0007]现代浏览器提供了很多功能来改善和优化客户体验。其中一种功能就是 favicons,favicon 是一种小的(通常是 16
×
16 或 32
×
32 像素)标志,我们可以使用它来方便的识别一个网站。大多数的浏览器将 favicons 显示在地址栏和书签列表中的页面名称旁边。开发者可以通过在网页头部包含一个<link rel>属性来在他们的网站上提供一个favicon。如果存在这个标签,浏览器就会从设定的地址请求这个图标,如果服务器正常响应了这个图标,就可以正常的渲染并显示这个图标。如果没有正常返回,则会显示一个空白的 favicon。
[0008]现有的信息持久化流程为,由网站服务器获得浏览器是否加载过 favicon的信息,当浏览器发起一个网页的请求时,如果favicon不在本地 F
‑
Cache中就会再次请求 favicon,如果favicon已经存在于F
‑
Cache 中则不会再发请求;通过这种方式,网站服务器可以得知用户是否访问过该网站,即通过浏览器图标缓存机制,除了网站本身以外,网站服务器同样可以通过对缓存获取请求的检查来判断用户是否访问过网站的特定页面,而一个
网站往往包括任意数量的页面,因此通过单一网站即可在浏览器中留下持久化的任意数量的标记位。通过这样的方式,结合浏览器对特定 URL是否请求过favicon的状态,可以为客户端分配一唯一标识,当网站被重新加载时,Web 服务器可以分析唯一标识与客户端发送的缺失 favicon的请求的关系,进而识别特定的浏览器指纹。
[0009]优选地,所述方法包括以下步骤:步骤1:判断当前用户是否初次访问网站;若是,则在服务端为用户随机生成唯一标识,进行下一步,否则,直接进行步骤3;步骤2:将所述唯一标识与浏览器图标缓存进行绑定,使当前用户在当前网站中持久固定用户信息;进行步骤4;步骤3:读取已访问用户的身份信息;步骤4:当前用户以唯一标识在当前网站进行浏览。
[0010]优选地,所述步骤1中,对于任一用户,以被访问网页初始页面是否返回对应的首页图标请求判断用户是否初次访问网站,若返回,则用户为初次访问网站。
[0011]假设服务器端未收到对图标资源的请求,则该用户已访问过该网站,其浏览器中已经包含持久化的图标缓存指纹,直接跳转至步骤3,进行用户的身份信息的读取识别;若服务端收到浏览器对于图标资源的请求,则代表用户初次访问网站,继续接下来的ID信息写入。
[0012]此处,首页图标请求是指每个用户访问当前网站时,不论其访问的是网站的几级地址,都将先从首页,如a.com获得图标的请求。
[0013]优选地,所述唯一标识为二进制ID。
[0014]优选地,所述步骤2中,对唯一标识,分配不同的URL与所述唯一标识中的比特位一一对应,服务器将所述唯一标识存储在浏览器中,并将用户依次重定向到当前采用的所有URL;将被访问网站的首页图标请求缓存至用户的服务端。
[0015]对随机的唯一标识的每个比特位分配不同的URL,存储唯一标识的同时将用户依次、重定向到这些URL,即获得了由有序的URL所固定的比特位值,进而实现了用户的唯一标识的存储。
[0016]通过对一系列URL的连续访问检测每一个比特的数值,即为0或是1,通过之前所述的访问图标并检测后端是否收到相应请求进行是否存在对应的浏览器图标缓存的检测。
[0017]优选地,所述步骤2中,浏览器中仅存储唯一标识中值为1的比特位对应的URL的图标缓存。
[0018]由于对于全部 URL 中对应比特位为0的部分,服务器本身会返回代表资源不存在的404代码,因此在写入图标缓存的过程中,并不需要遍历全部的URL,而仅需处理对应比特位为1的部分,通过这样的方式,由于每一个比特位为1或0的概率是等同的,进而模型的平均起效时间能够缩短至原本的50%,实现时间上的优化。
[0019]这些对应比特位为0的URL只是将返回404代码,这些URL仍将按序被定向到用户。
[0020]优选地,所述步骤3中,对所有图标资源的请求返回404状态码,对于所有接收到图标缓存请求的URL对应的比特位置0,而其他页面则置1,依次还原用户的唯一标识。
[0021]经过唯一标识写入后,用户浏览器缓存中便包含了能够用于恢复此唯一标识记录的缓存信息,当用户再次访问该网站时,由于浏览器中已经包含网站首页的图标资源,因此
不会再向服务器发送获取图标资源的请求,由此网站可以判断用户是否第一次访问网站,若否,则以步骤3进行唯一标识信息的恢复(读取);为了重建一个用户的标识符,网站前端必须访问所有的可用路由,同时服务器记录浏览器请求了哪些页面的图标资源(此时浏览器请求的图标资源均为不存在于浏览器F
‑
Cache中的资源),由此可以反向推断F
‑
Cache中存在哪些 URL 对应图标的缓存本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于浏览器图标缓存的持久化身份识别方法,其特征在于:所述方法分配每个访问用户的唯一标识并与浏览器图标缓存绑定;任一用户访问网站时,利用URL
‑
缓存匹配机制对用户的身份进行识别。2.根据权利要求1所述的一种基于浏览器图标缓存的持久化身份识别方法,其特征在于:所述方法包括以下步骤:步骤1:判断当前用户是否初次访问网站;若是,则在服务端为用户随机生成唯一标识,进行下一步,否则,直接进行步骤3;步骤2:将所述唯一标识与浏览器图标缓存进行绑定,使当前用户在当前网站中持久固定用户信息;进行步骤4;步骤3:读取已访问用户的身份信息;步骤4:当前用户以唯一标识在当前网站进行浏览。3.根据权利要求2所述的一种基于浏览器图标缓存的持久化身份识别方法,其特征在于:所述步骤1中,对于任一用户,以被访问网页初始页面是否返回对应的首页图标请求判断用户是否初次访问网站,若返回,则用户为初次访问网站。4.根据权利要求2所述的一种基于浏览器图标缓存的持久化身份识别方法,其特征在于:所述唯一标识为二进制ID。5.根据权利要求4所述的一种基于浏览器图标缓存的持久化身份识别方法,其特征在于:所述步骤2中,对唯一标识,分配不同的URL与所述唯一标识中的比特位一一对应,服务器将所述唯一标识存储...
【专利技术属性】
技术研发人员:龙海霞,王佳,陈孜豪,徐新黎,肖杰,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。