一种识别黑灰产数据的方法、装置及介质制造方法及图纸

技术编号：34039236 阅读：17 留言：0更新日期：2022-07-06 13:04

本发明专利技术提供的一种识别黑灰产数据的方法、装置及介质，适用于互联网技术领域。获取当前的流量数据和恶意网址数据库；根据预设字段比较当前的流量数据与恶意网址数据库的恶意网址数据；将与恶意网址数据匹配的当前的流量数据作为流量数据包；分析流量数据包以提取对应的流量特征；根据流量特征对当前的流量数据筛选得到黑灰产数据。该方法通过将当前的流量数据与恶意网址数据库的恶意网址数据匹配得到流量数据包，进一步提取流量特征，进而根据流量特征全面筛选当前的流量数据得到黑灰产数据。避免现有的根据人工经验筛选导致的不精准全面问题，提高筛选速度。提高筛选速度。提高筛选速度。

A method, device and medium for identifying black ash production data

全部详细技术资料下载

【技术实现步骤摘要】
一种识别黑灰产数据的方法、装置及介质

[0001]本专利技术涉及互联网
，特别是涉及一种识别黑灰产数据的方法、装置及介质。

技术介绍

[0002]近年来，新型涉网犯罪搭乘互联网与物联网技术飞速发展的快车，逐渐变得隐蔽，在内容分发网络(Content Delivery Network，CDN)技术、代理技术、云计算等技术的发展领域使得黑灰产数据伪装自己，对于相关人员打击与治理网络环境造成不利的影响，因此，如何从海量的互联网数据中发现关键的黑灰产数据成为难题。
[0003]现阶段，黑灰产数据的发现主要基于网络空间搜索引擎以及互联网等公开资源获取，在筛选过程中只能根据人工经验进行筛选，且获取不全面精准，导致筛选速度较慢。
[0004]因此，寻求一种识别黑灰产数据的方法是本领域技术人员亟需要解决的。

技术实现思路

[0005]本专利技术的目的是提供一种识别黑灰产数据的方法、装置及介质，提高筛选效率。
[0006]为解决上述技术问题，本专利技术提供一种识别黑灰产数据的方法，包括：
[0007]获取当前的流量数据和恶意网址数据库；
[0008]根据预设字段比较当前的流量数据与恶意网址数据库的恶意网址数据；
[0009]将与恶意网址数据匹配的当前的流量数据作为流量数据包；
[0010]分析流量数据包以提取对应的流量特征；
[0011]根据流量特征对当前的流量数据筛选得到黑灰产数据。
[0012]优选地，获取当前的流量数据，包括：
...

【技术保护点】

【技术特征摘要】
1.一种识别黑灰产数据的方法，其特征在于，包括：获取当前的流量数据和恶意网址数据库；根据预设字段比较所述当前的流量数据与所述恶意网址数据库的恶意网址数据；将与所述恶意网址数据匹配的所述当前的流量数据作为流量数据包；分析所述流量数据包以提取对应的流量特征；根据所述流量特征对所述当前的流量数据筛选得到所述黑灰产数据。2.根据权利要求1所述的识别黑灰产数据的方法，其特征在于，获取所述当前的流量数据，包括：获取当前的出口流量数据；将所述当前的出口流量数据输入至流量分光器进行分光得到分光流量数据；将所述分光流量数据存储为镜像得到所述当前的流量数据。3.根据权利要求1所述的识别黑灰产数据的方法，其特征在于，获取所述恶意网址数据库，包括：获取历史报案数据；将所述历史报案数据进行清洗以获取所述恶意网址数据；将所述恶意网址数据存储并建立所述恶意网址数据库。4.根据权利要求3所述的识别黑灰产数据的方法，其特征在于，所述根据预设字段比较所述当前的流量数据与所述恶意网址数据库的恶意网址数据，包括：获取所述当前的流量数据对应的请求头和当前的目标字段，其中所述预设字段包括多个目标字段；根据所述当前的目标字段比较所述请求头与所述恶意网址数据。5.根据权利要求4所述的识别黑灰产数据的方法，其特征在于，所述将与所述恶意网址数据匹配的所述当前的流量数据作为流量数据包，包括：根据所述当前的目标字段判断所述当前的流量数据是否匹配成功；若是，则将匹配成功的所述当前的流量数据作为所述流量数据包，并将所述当前的目标字段标记；若否，则获取所述预设字段内除所述当前的目标字段之外的其他目标字段作为下一个所述当前的目标字段返回至所述根据所述当前的目标字段比较所述...

【专利技术属性】
技术研发人员：宓晨希，王欣，
申请(专利权)人：杭州安恒信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人