基于下载资源名的流量识别方法和设备、管控方法和设备技术

技术编号:10493479 阅读:106 留言:0更新日期:2014-10-03 20:30
本发明专利技术公开了一种基于下载资源名称的网络流量识别方法、识别设备、管控方法和管控设备。所述网络流量识别方法包括接收请求报文;识别所述请求报文中的下载资源链接;如果识别成功,则解析所述请求报文,提取下载资源名称。从网络流量中提取下载资源名称,可以进一步根据下载资源名称进行网络流量的管理和控制。本发明专利技术具有针对下载流量识别细化的功能,将识别粒度的精细度加大,可以使用户对下载流量的审计和管控更加精细,对下载流量有更深层次的信息提取。

【技术实现步骤摘要】
基于下载资源名的流量识别方法和设备、管控方法和设备
本专利技术属于网络应用流量识别与分类
,特别是涉及一种基于下载资源名称的网络流量识别方法、识别设备、管控方法和管控设备。
技术介绍
随着互联网技术的迅猛发展,网络已经成为人们生活中不可分割的组成部分。随着P2P等网络技术的出现,同时也带来了网络安全、带宽占用、内容计费、信息安全等一系列新的课题。出于对网络流量的管理,流量识别技术目前开始处于十分重要的位置,其是网络中内容过滤、流量分析、带宽管理、安全通信及互联网监管和运维等多方面的基础。所谓的流量识别是指利用流以及流中报文的某些信息(例如:协议特征、指纹、签名等)将网络上的流划分为既定的若干类别(例如:各种应用类型的流)的技术;其中流是指在某一段固定时间间隔内通过网络上的一个观测点的IP(Internet Protocol,网络互联协议)报文的集合,这些报文具有相同的五元组(源IP、源端口、目的IP、目的端口和协议类型)标识;其中一个流属于流量的一部分。 目前流量识别的方式主要包括:基于端口映射的流量识别方式、基于IP地址的流量识别方式、基于DPI (Deep Packet Inspect1n,深度包检测)的流量识别方式和基于DFI (Deep Flow Inspect1n,深度流检测)的流量识别方式。目前各大网络设备生产商所推出的流量识别技术或产品大多使用了深度包检测技术(DPI),除了在性能和精度上有所差别外,其技术本质是相同的。 目前DPI的识别结果粒度过粗,都是限于应用级的,例如使用迅雷软件下载一部电影《红星闪闪》,各大设备厂商都会对当前流量识别为“迅雷下载”,不会识别为《红星闪闪》。当前情况首先会导致用户无法获取网络中下载流量的具体信息,无法对海量数据进行统计。其次假如用户对公司网络设置了流量控制策略,用户无法针对资源的类别或者关键字进行下载管理,因此网络流控设备对于下载流量的监控受到很大的限制。
技术实现思路
有鉴于此,本专利技术提供了一种基于下载资源名称的网络流量识别和管控方案,具有针对下载流量识别细化的功能,将识别粒度的精细度加大,可以使用户对下载流量的审计和管控更加精细,对下载流量有更深层次的信息提取。 为了解决上述技术问题,本专利技术一方面提供了一种网络流量的识别方法,该方法包括以下步骤:接收请求报文;识别所述请求报文中的下载资源链接;如果识别成功,则解析所述请求报文,提取下载资源名称。还可以进一步提取下载资源类型。 进一步地,利用上述识别方法从网络流量中提取了下载资源名称之后,就可以根据下载资源名称进行网络流量的管理和控制。 本专利技术第二方面提供了一种网络流量的识别设备。该设备包括接收单元,用于接收请求报文;识别单元,用于识别所述请求报文中的下载资源链接;解析单元,用于解析成功识别出下载资源链接的请求报文,从中提取下载资源名称。还可以进一步提取下载资源类型。 进一步地,利用上述识别设备从网络流量中提取了下载资源名称之后,网络流量管理单元就可以根据下载资源名称进行网络流量的管理和控制。 有益效果: (I)本专利技术提供了更细粒度的识别结果,当使用迅雷软件下载一部电影《红星闪闪》,采用本专利技术方案可以识别为《红星闪闪》,而不仅仅是“迅雷下载”。那么,有了本专利技术的识别结果就可以在网络流量管控中,对海量数据进行更有针对性的统计,设置以下载资源名称为目标的流量控制策略,从而使得用户能够针对资源关键字进行下载管理,例如禁止用户下载特定名称的资源,从而大大拓宽了网络流控设备对于下载流量的监控功能。 (2)本专利技术通过签名对请求报文进行解析,签名解析可读性高,易于读者理解,且解析速度快,便于快速提取出需要的资源名称信息。 本专利技术识别精细度高、可实现性强,可作为网络流控设备功能实现,可用于策略中的网络应用控制,并可进行网络应用时监控。 【附图说明】 图1为本专利技术实施例下载流量设备的应用场景; 图2为本专利技术实施例下载流量的识别方法流程图; 图3为本专利技术实施例下载流量的识别设备结构图。 【具体实施方式】 下面结合附图并举实施例,对本专利技术进行详细描述。 图1为本专利技术实施例下载流量识别设备的应用场景。如图1所示,客户端A通过网络流量监控设备B访问远程服务器C。C为下载资源服务器,它不断的监听来自A客户端的请求。一旦连接建立起来,客户端A就会向下载资源服务器C发出下载资源的请求报文,下载资源服务器C接着就返回数据作为响应。最后,连接就被释放。 网络流控设备B转发并监控客户端A和下载资源服务器C之间交互的信息。通过客户端A向下载资源服务器C发出的请求报文来识别出此条链接为下载资源链接。 图2为本专利技术实施例中基于下载资源名称的网络流量识别方法的流程图。该方法包括步骤1-3。此部分以在百度下吧中下载QQ2013为例。 步骤1:接收请求报文。 在步骤I中,当用户通过客户端A的浏览器点击百度下吧中QQ2013的下载链接时,客户端A会通过网络流控设备B向百度服务器发送HTTP请求报文。客户端A通过网络流控设备B向下载资源服务器C发送的HTTP请求报文如下: GET/ sw-search-sp / gaosu / 2014_03_13_16/bindl / 1 2 3 5 0/QQ2013SP6.2288047051.exe HTTP/1.1 Host: dlsw.baidu.com User-Agent:Mozilla/5.0 (Windows NT 6.1 ; WOff 6 4 ; r v: 2 4.0)Gecko/20100101Firefox/24.0 Accept:text/html, applicat1n/xhtml+xml, applicat1n/xml ;q = 0.9, */* ;q=0.8 Accept-Language: zh-cn, zh ;q = 0.8, en_us ;q = 0.5, en ;q = 0.3 Accept-Encoding:gzip, deflate 请求方式是以“GET”的方式向下载资源服务器C进行数据请求,服务器地址为“dlsw.baidu.com,,,iVsw-search-sp/gaosu/2014_03_13_16/bindl/12350/,,是一个相对地址,代表存储下载资源的文件夹。“QQ2013SP6.2288047051.exe”就是用户下载的具体资源名称,这是一个QQ的可执行程序文件。 步骤2:识别所述请求报文中的下载资源链接。 在步骤2中,网络流控设备B将会对送进来的请求报文进行识别。具体识别时,在网络流控设备B中设置一个特征库,该特征库中包含多个特征。通过特征库中的特征识别所述请求报文中的下载资源链接。特征是用于标识下载资源的信息,通过对不同应用的下载资源请求报文的分析,可以获得相应特征信息。不同应用对应的特征不同。例如QQ、迅雷就采用了不同的特征信息来表示报文属于下载连接请求报文。 在实际中,在特征码识别的基础上,还可以加入DPI识别,从而实现应用层面的流量识别。DPI识别在本处不做过多陈述。 以HTTP请求报文为例,例如特征库中有一个如下特征: Nam本文档来自技高网
...

【技术保护点】
一种基于下载资源名称的网络流量识别方法,其特征在于:包括以下步骤:接收请求报文;识别所述请求报文中的下载资源链接;如果识别成功,则解析所述请求报文,提取下载资源名称。

【技术特征摘要】
1.一种基于下载资源名称的网络流量识别方法,其特征在于:包括以下步骤:接收请求报文;识别所述请求报文中的下载资源链接;如果识别成功,则解析所述请求报文,提取下载资源名称。2.根据权利要求1所述的方法,其特征在于:所述识别所述请求报文中的下载资源链接的步骤包括:通过特征库中的用于表征下载资源的特征识别所述请求报文中的下载资源链接。3.根据权利要求2所述的方法,其特征在于:所述特征库中每个特征对应一个标识ID,对下载资源链接进行标识ID的标记,用于标示和区分下载链接。4.根据权利要求1所述的方法,其特征在于:所述解析所述请求报文,提取下载资源名称的步骤包括:通过签名库中的签名解析所述请求报文,提取下载资源名称。5.一种基于下载资源名称的网络流量识别设备,其特征在于:包括:接收单元,用于接收请求报文;识别单元,用于识别所述请求报文中的下载资源链接;解析单元,用于解析成功识别出下载资源链接的请求报文,从中提取下载资源名称。6.根据...

【专利技术属性】
技术研发人员:袁媛贾艳会李城龙齐晓璐于贺威卫冰洁曹首峰贺龙涛
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1