本申请实施例公开了一种用户标记方法、用户标记系统、电子设备及存储介质,可对在云防护系统中访问网站的用户进行完整且准确地标记。本申请实施例方法可包括:从用户信息系统中获取目标用户的用户数据,并根据所述用户数据确定第一标签集合,所述第一标签集合包括至少一个与所述用户数据对应的第一标签;从云防护系统中获取所述目标用户对应的网络访问日志数据;基于预设规则对所述网络访问日志数据进行分析,并根据分析结果确定第二标签集合,所述第二标签集合包括至少一个与所述分析结果对应的第二标签;根据所述第一标签集合和所述第二标签集合,确定与所述目标用户对应的目标标签集合,所述目标标签集合下的标签用于对所述目标用户进行标记。所述目标用户进行标记。所述目标用户进行标记。
【技术实现步骤摘要】
用户标记方法、用户标记系统、电子设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种用户标记方法、用户标记系统、电子设备及存储介质。
技术介绍
[0002]云防护系统能够为用户的网站访问提供安全防护,用户在云防护系统中访问网站时,可对用户进行标记,以向用户提供差异化、精细化的防护服务。目前,对在云防护系统中访问网站的用户进行标记的方式比较单一,导致用户标记较为片面,不够准确。
技术实现思路
[0003]本申请实施例提供了一种用户标记方法、用户标记系统、电子设备及存储介质,可对在云防护系统中访问网站的用户进行完整且准确地标记。
[0004]本申请实施例第一方面提供了一种用户标记方法,可以包括:
[0005]从用户信息系统中获取目标用户的用户数据,并根据该用户数据确定第一标签集合,该第一标签集合包括至少一个与该用户数据对应的第一标签;
[0006]从云防护系统中获取该目标用户对应的网络访问日志数据;
[0007]基于预设规则对该网络访问日志数据进行分析,并根据分析结果确定第二标签集合,该第二标签集合包括至少一个与该分析结果对应的第二标签;
[0008]根据该第一标签集合和该第二标签集合,确定与该目标用户对应的目标标签集合,该目标标签集合下的标签用于对该目标用户进行标记。
[0009]可选的,该根据该用户数据确定第一标签集合,包括:利用命名实体识别NER技术对该用户数据进行信息提取,得到与该目标用户对应的实体信息,并根据该实体信息确定第一标签集合;其中,该实体信息包括地域信息;该根据该实体信息确定第一标签集合,包括:将该地域信息确定为第一标签集合下的第一标签;和/或,该实体信息包括机构名称信息;该根据该实体信息确定第一标签集合,包括:获取与该机构名称信息对应的行业类型,并将该行业类型确定为第一标签集合下的第一标签。
[0010]可选的,该获取与该机构名称信息对应的行业类型,并将该行业类型确定为第一标签集合下的第一标签,包括:基于预置的行业划分规则,确定与该机构名称信息对应的目标行业类型,该预置的行业划分规则包括多个机构名称信息对应的行业类型;将该目标行业类型确定为第一标签集合下的第一标签。
[0011]可选的,该基于预设规则对该网络访问日志数据进行分析,并根据分析结果确定第二标签集合,包括:对该网络访问日志数据进行分析,得到分析数据,该分析数据包括与该目标用户对应的网站地址、与请求统一资源定位器URL对应的网络资源信息、目标URL及网站的历史访问汇总信息中的至少一种;基于预设规则,确定与该分析数据对应的数据类型,并根据该数据类型确定第二标签集合。
[0012]可选的,该分析数据包括该与该目标用户对应的网站地址;该基于预设规则,确定
与该分析数据对应的数据类型,并根据该数据类型确定第二标签集合,包括:对该网站地址进行解析,确定与该网站地址对应的根域名;基于预置的第一分类规则,确定与该根域名对应的目标域名类型,该预置的第一分类规则包括多个域名类型;将该目标域名类型确定为第二标签集合下的第二标签。
[0013]可选的,该分析数据包括该与该请求URL对应的网络资源信息;该基于预设规则,确定与该分析数据对应的数据类型,并根据该数据类型确定第二标签集合,包括:获取该网络资源信息所属的资源类型对应的网页服务及该网页服务的第一特征信息;将该第一特征信息与预置的多个网页服务的特征信息进行匹配;若匹配成功,则确定与第一目标特征信息对应的目标资源类型,该第一目标特征信息为该多个网页服务的特征信息中与该第一特征信息匹配成功的特征信息;将该目标资源类型确定为第二标签集合下的第二标签。
[0014]可选的,该分析数据包括该目标URL;该基于预设规则,确定与该分析数据对应的数据类型,并根据该数据类型确定第二标签集合,包括:获取该目标URL的第二特征信息;将该第二特征信息与预置的多个URL的特征信息进行匹配;若匹配成功,则确定与第二目标特征信息对应的URL类型,该第二目标特征信息为该多个URL的特征信息中与该第二特征信息匹配成功的特征信息;将该URL类型确定为第二标签集合下的第二标签。
[0015]可选的,该分析数据包括该网站的历史访问汇总信息;该基于预设规则,确定与该分析数据对应的数据类型,并根据该数据类型确定第二标签集合,包括:在该历史访问总汇信息中,获取预设时间段内的第一访问汇总信息,该第一访问汇总信息包括该目标用户对该网站的访问次数;将该预设时间段内各个时刻的访问次数进行聚类,得到该预设时间段对应的访问曲线,该访问曲线用于反映该目标用户在该各个时刻对该网站的访问次数;将该访问曲线的第三特征信息与预置的多个访问曲线分别对应的特征信息进行匹配;若匹配成功,则确定与第三目标特征信息对应的目标标签,该第三目标特征信息为该多个访问曲线分别对应的特征信息中与该第三特征信息匹配成功的特征信息;将该目标标签确定为第二标签集合下的第二标签。
[0016]本申请实施例第二方面提供了一种用户标记系统,可以包括:
[0017]第一数据采集模块,用于从用户信息系统中获取目标用户的用户数据;
[0018]第一数据处理模块,用于根据该用户数据确定第一标签集合,该第一标签集合包括至少一个与该用户数据对应的第一标签;
[0019]第二数据采集模块,用于从云防护系统中获取该目标用户对应的网络访问日志数据;
[0020]第二数据处理模块,用于基于预设规则对该网络访问日志数据进行分析,并根据分析结果确定第二标签集合,该第二标签集合包括至少一个与该分析结果对应的第二标签;
[0021]用户标记模块,用于根据该第一标签集合和该第二标签集合,确定与该目标用户对应的目标标签集合,该目标标签集合下的标签用于对该目标用户进行标记。
[0022]可选的,第一数据处理模块,具体用于利用命名实体识别NER技术对该用户数据进行信息提取,得到与该目标用户对应的实体信息,并根据该实体信息确定第一标签集合;其中,该实体信息包括地域信息,将该地域信息确定为第一标签集合下的第一标签;和/或,该实体信息包括机构名称信息,获取与该机构名称信息对应的行业类型,并将该行业类型确
定为第一标签集合下的第一标签。
[0023]可选的,第一数据处理模块,具体用于基于预置的行业划分规则,确定与该机构名称信息对应的目标行业类型,该预置的行业划分规则包括多个机构名称信息对应的行业类型;将该目标行业类型确定为第一标签集合下的第一标签。
[0024]可选的,第二数据处理模块,具体用于对该网络访问日志数据进行分析,得到分析数据,该分析数据包括与该目标用户对应的网站地址、与请求统一资源定位器URL对应的网络资源信息、目标URL及网站的历史访问汇总信息中的至少一种;基于预设规则,确定与该分析数据对应的数据类型,并根据该数据类型确定第二标签集合。
[0025]可选的,第二数据处理模块,具体用于该分析数据包括该与该目标用户对应的网站地址;对该网站地址进行解析,确本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用户标记方法,其特征在于,包括:从用户信息系统中获取目标用户的用户数据,并根据所述用户数据确定第一标签集合,所述第一标签集合包括至少一个与所述用户数据对应的第一标签;从云防护系统中获取所述目标用户对应的网络访问日志数据;基于预设规则对所述网络访问日志数据进行分析,并根据分析结果确定第二标签集合,所述第二标签集合包括至少一个与所述分析结果对应的第二标签;根据所述第一标签集合和所述第二标签集合,确定与所述目标用户对应的目标标签集合,所述目标标签集合下的标签用于对所述目标用户进行标记。2.根据权利要求1所述的方法,其特征在于,所述根据所述用户数据确定第一标签集合,包括:利用命名实体识别NER技术对所述用户数据进行信息提取,得到与所述目标用户对应的实体信息,并根据所述实体信息确定第一标签集合;其中,所述实体信息包括地域信息;所述根据所述实体信息确定第一标签集合,包括:将所述地域信息确定为第一标签集合下的第一标签;和/或,所述实体信息包括机构名称信息;所述根据所述实体信息确定第一标签集合,包括:获取与所述机构名称信息对应的行业类型,并将所述行业类型确定为第一标签集合下的第一标签。3.根据权利要求2所述的方法,其特征在于,所述获取与所述机构名称信息对应的行业类型,并将所述行业类型确定为第一标签集合下的第一标签,包括:基于预置的行业划分规则,确定与所述机构名称信息对应的目标行业类型,所述预置的行业划分规则包括多个机构名称信息对应的行业类型;将所述目标行业类型确定为第一标签集合下的第一标签。4.根据权利要求1所述的方法,其特征在于,所述基于预设规则对所述网络访问日志数据进行分析,并根据分析结果确定第二标签集合,包括:对所述网络访问日志数据进行分析,得到分析数据,所述分析数据包括与所述目标用户对应的网站地址、与请求统一资源定位器URL对应的网络资源信息、目标URL及网站的历史访问汇总信息中的至少一种;基于预设规则,确定与所述分析数据对应的数据类型,并根据所述数据类型确定第二标签集合。5.根据权利要求4所述的方法,其特征在于,所述分析数据包括所述与所述目标用户对应的网站地址;所述基于预设规则,确定与所述分析数据对应的数据类型,并根据所述数据类型确定第二标签集合,包括:对所述网站地址进行解析,确定与所述网站地址对应的根域名;基于预置的第一分类规则,确定与所述根域名对应的目标域名类型,所述预置的第一分类规则包括多个域名类型;将所述目标域名类型确定为第二标签集合下的第二标签。6.根据权利要求4所述的方法,其特征在于,所述分析数据包括所述与所述请求URL对应的网络资源信息;所述基于预设规则,确定与所述分析数据对应的数据类型,并根据所述数据类型确定第二标签集合,包括:
获取所述网络资源信息所属的资源类型对应的网页服务及所述网页服务的第一特征信息;将所述第一特征信息与预置的多个网页服务的特征信息...
【专利技术属性】
技术研发人员:张传社,欧怀谷,王枭卿,丁倩,
申请(专利权)人:云盾智慧安全科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。