一种面向发卡平台的主动发现方法及装置制造方法及图纸

技术编号:29614748 阅读:23 留言:0更新日期:2021-08-10 18:29
本发明专利技术公开了一种面向发卡平台的主动发现方法及装置,该方法包括:根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。采用本发明专利技术能够主动发现发卡平台。

【技术实现步骤摘要】
一种面向发卡平台的主动发现方法及装置
本专利技术涉及信息安全中的互联网安全
,特别涉及一种面向发卡平台的主动发现方法及装置。
技术介绍
因为发卡平台本身属于黑灰产行业的一种,其面向的用户,不管是售卖账号的店铺主还是购买账号的买家,主要也是非法从事黑灰产的人员,发卡平台的运营者并不希望公众能够轻易的知道其存在,这就决定了其运营者不会在互联网中进行大肆的宣传,而是会在更隐蔽的渠道或圈子中(比如QQ群、Telegram群组、论坛等等)进行宣传,监管部门要想打击这类平台,通过普通的技术手段(如在搜索引擎中进行搜索)很难发现此类平台。随着目前互联网、移动互联网技术的不断发展和网络运营者、服务提供者的安全意识不断提高,网络黑产业务模式也不断发生变化,为绕过各互联网业务提供者的安全防护以实现其各类不法目标,黑产从业者目前越来越多地使用非法帐号进行不法活动,从而催生了整个非法帐号注册、运营、销售产业。需要针对网络黑产进行重点打击,建立网络黑产线索库在恶意注册黑产链条中,资源售卖环节是黑产变现的重要环节,需要重点进行监测。其中发卡平台是重要的账户交易平台,其类似于淘宝等电商平台,交易双方可通过该平台进行各类账号的自动化交易,由于其访问地址是通过交易双方私下告知,因此存在较大的胞藏性。针对以上情况,急需通过主动发现技术进行持续发现追踪,为黑产业务监管提供支撑。
技术实现思路
本专利技术的目的在于提供一种面向发卡平台的主动发现方法及装置,能够主动发现发卡平台。为实现上述专利技术目的,本专利技术提供了一种面向发卡平台的主动发现方法,该方法包括:根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。为实现上述专利技术目的,本专利技术还提供了一种面向发卡平台的主动发现装置,该装置包括:爬取模块,根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;过滤模块,根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。综上所述,本专利技术提出的面向发卡平台的主动发现方法及装置,该方法包括:根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。本专利技术采用主动爬取方式和规则过滤方式相结合来寻找发卡平台,从而主动发现发卡平台。附图说明图1为本专利技术实施例提出的一种面向发卡平台的主动发现方法的流程示意图。图2为本专利技术实施例所爬取的帖子内容示意图。图3为本专利技术实施例发卡平台网页示意图。图4为本专利技术实施例提供的一种面向发卡平台的主动发现装置结构示意图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本专利技术所述方案作进一步地详细说明。本专利技术首先通过爬取互联网中百度贴吧及一些论坛的帖子,提取出与发卡相关的帖子内容;然后根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。在此基础上,通过已发现发卡平台的域名对应的注册信息发现新的发卡平台,有效提升了发现新发卡平台的效率和准确率。实施例一图1为本专利技术实施例提供的一种面向发卡平台的主动发现方法的流程示意图,该方法包括:步骤11、根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;其中,与发卡相关的主题词,可以是FK、发卡、FAK、FKA,FAKA等包含发卡含义的中文内容或者拼音缩写。本步骤通过主动爬取,可以提取出与发卡相关的帖子内容。所述爬取方式可以有多种实现方式,包含但不限于基于scrapy爬虫框架进行爬取。所爬取的帖子内容示意图如图2所示。域名:wenfaka.com中包括faka这个相关主题词。步骤12、根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。其中,发卡平台域名特征规则,可以是*fk*.com、*fak*.com、*fka*.com,*faka*.com等。也就是说,发卡平台域名特征规则中包括发卡含义的字母组合。本步骤通过规则过滤,提取出发卡平台的域名,从而达到本专利技术的主动发现的目的。优选地,为了进一步确定所发现的发卡平台的真实性,该方法进一步包括:使用http请求所述发卡平台的域名,且所请求的网页中包含“发卡”内容,则进一步确认该域名对应发卡平台。图3为本专利技术实施例发卡平台网页示意图。域名符合带有faka*.com特征,且网页内容中含有“发卡”,则确认该网站属于发卡平台。至此,完成了本专利技术的面向发卡平台的主动发现方法。实施例二在已发现发卡平台的基础上发现新的发卡平台步骤21、根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容。步骤22、根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。优选地,该方法进一步包括:使用http请求所述发卡平台的域名,且所请求的网页中包含“发卡”内容,则进一步确认该域名对应发卡平台。步骤23、根据所述发卡平台的域名查询域名库获取该发卡平台的域名对应的注册人或者注册人邮箱;所述域名库包含注册人、注册人邮箱、以及每个注册人或注册人邮箱所注册的网站的域名、域名的注册时间、域名的到其时间;一般地,一个注册人或者一个注册人邮箱可以对应多个域名,所以根据所述注册人或者注册人邮箱提取出该注册人注册的所有域名;使用http请求每一提取出的域名,且当所请求的网页中包含“发卡”内容时,则进一步确认该域名对应一新的发卡平台。其中,域名库包含但不限于whois库。步骤24、在发现发卡平台后,该方法进一步包括:对发卡平台的店铺信息和店铺商品信息的相关数据进行爬取,并保存入数据库。本步骤中,所述爬取方式可以有多种实现方式,包含但不限于基于scrapy爬虫框架进行爬取。其中,店铺信息包括:店铺名称、店铺简介等。店铺商品信息包括:商品名称、商品描述、库存量、售价信息等。上述为本专利技术优选实施例面向发卡平台的主动发现方法。实施例三图4为本专利技术实施例提供的一种面向发卡平台的主动发现装置结构示意图,该装置包括:爬取模块401,根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;过滤模块402,根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。优选地,该装置进一步包括:确认模块403,使用http请求所述发卡平台的域名,且所请求的网页中包含“发卡”内容,则进一步确认该域名对应发卡平台。在得到发卡平台的域名之后,该装置进一步包括:发现模块404,根据所述发卡平台的域名查询域名库获取该发卡平台的域名对应的注册人或者注册人邮箱;所述域名库包含注册人、注册人邮箱、以及每个注册人或注册人邮箱所注册的网站本文档来自技高网...

【技术保护点】
1.一种面向发卡平台的主动发现方法,其特征在于,该方法包括:/n根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;/n根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。/n

【技术特征摘要】
1.一种面向发卡平台的主动发现方法,其特征在于,该方法包括:
根据与发卡相关的主题词爬取贴吧或者论坛内容,提取出与发卡相关的帖子内容;
根据发卡平台域名特征规则,对所提取出的帖子内容进行过滤,得到发卡平台的域名。


2.如权利要求1所述的方法,其特征在于,该方法进一步包括:
使用http请求所述发卡平台的域名,且所请求的网页中包含“发卡”内容,则进一步确认该域名对应发卡平台。


3.如权利要求1所述的方法,其特征在于,在得到发卡平台的域名之后,该方法进一步包括:
根据所述发卡平台的域名查询域名库获取该发卡平台的域名对应的注册人或者注册人邮箱;所述域名库包含注册人、注册人邮箱、以及每个注册人或注册人邮箱所注册的网站的域名、域名的注册时间、域名的到其时间;
根据所述注册人或者注册人邮箱提取出该注册人注册的所有域名;
使用http请求每一提取出的域名,且当所请求的网页中包含“发卡”内容时,则进一步确认该域名对应一新的发卡平台。


4.如权利要求2或3所述的方法,其特征在于,在发现发卡平台后,该方法进一步包括:对发卡平台的店铺信息和店铺商品信息的相关数据进行爬取,并保存入数据库。


5.如权利要求4所述的方法,其特征在于,所述爬取基于scrapy爬虫框架进行爬取。


6.一种面向...

【专利技术属性】
技术研发人员:窦禹薛晨易立杨昕宇陆希玉
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1