【技术实现步骤摘要】
数据流的分类方法和报文转发设备
本申请涉及通信
,特别涉及一种数据流的分类方法和报文转发设备。
技术介绍
软件定义广域网(softwaredefinedwideareanetwork,SD-WAN)场景中存在多种企业私有应用,识别网络流量中承载哪些应用的数据,对于网络管理是重要的。深度报文解析(deeppacketinspection,DPI)技术被应用于对数据流进行应用分类。在流量转发的过程中,DPI设备基于数据流中的字节信息提取流量特征,然后将提取的流量特征与预设的识别规则进行匹配可以得到分类结果。由于现有技术中,DPI设备对流量进行分类所用的识别规则需要由技术人员总结获取,耗时费力。
技术实现思路
本申请实施例提供了一种数据流的分类方法,应用于内部网络和互联网之间的报文转发设备,可以减少技术人员的工作量,避免应用更新带来的无法识别数据流的问题。本申请实施例第一方面提供了一种数据流的分类方法,应用于内部网络和互联网之间的报文转发设备,包括:报文转发设备获取多条数据流,并提取该多条数据流中每条数据流的地址信息和时间信息,该多条数据流是多个客户端设备分别访问多个服务产生的数据流,该服务用于实现应用的子功能,该地址信息包括源IP地址、源端口号、目的IP地址和目的端口号;该报文转发设备根据该每条数据流的源IP地址,从该多条数据流中筛选出第一客户端设备访问多个服务产生的数据流集合,该第一客户端设备是该多个客户端设备中被分配使用第一IP地址的客户端设备;该报文转发设备根据该数 ...
【技术保护点】
1.一种数据流的分类方法,其特征在于,应用于内部网络和互联网之间的报文转发设备,包括:/n报文转发设备获取多条数据流,并提取所述多条数据流中每条数据流的地址信息和时间信息,所述多条数据流是多个客户端设备分别访问多个服务产生的数据流,所述服务用于实现应用的子功能,所述地址信息包括源IP地址、源端口号、目的IP地址和目的端口号;/n所述报文转发设备根据所述每条数据流的源IP地址,从所述多条数据流中筛选出第一客户端设备访问多个服务产生的数据流集合,所述第一客户端设备是所述多个客户端设备中被分配使用第一IP地址的客户端设备;/n所述报文转发设备根据所述数据流集合中每条数据流的目的IP地址和目的端口号,确定所述第一客户端设备访问的服务集合,所述服务集合包括第一服务和第二服务,所述第一服务对应的目的IP地址和目的端口号的组合与所述第二服务对应的目的IP地址和目的端口号的组合不同;/n所述报文转发设备根据所述数据流集合中每条数据流的时间信息,确定所述服务集合中的各服务之间的相关性;/n所述报文转发设备根据所述相关性,确定所述第一服务和所述第二服务用于实现第一应用;/n所述报文转发设备确定所述第一服务 ...
【技术特征摘要】
1.一种数据流的分类方法,其特征在于,应用于内部网络和互联网之间的报文转发设备,包括:
报文转发设备获取多条数据流,并提取所述多条数据流中每条数据流的地址信息和时间信息,所述多条数据流是多个客户端设备分别访问多个服务产生的数据流,所述服务用于实现应用的子功能,所述地址信息包括源IP地址、源端口号、目的IP地址和目的端口号;
所述报文转发设备根据所述每条数据流的源IP地址,从所述多条数据流中筛选出第一客户端设备访问多个服务产生的数据流集合,所述第一客户端设备是所述多个客户端设备中被分配使用第一IP地址的客户端设备;
所述报文转发设备根据所述数据流集合中每条数据流的目的IP地址和目的端口号,确定所述第一客户端设备访问的服务集合,所述服务集合包括第一服务和第二服务,所述第一服务对应的目的IP地址和目的端口号的组合与所述第二服务对应的目的IP地址和目的端口号的组合不同;
所述报文转发设备根据所述数据流集合中每条数据流的时间信息,确定所述服务集合中的各服务之间的相关性;
所述报文转发设备根据所述相关性,确定所述第一服务和所述第二服务用于实现第一应用;
所述报文转发设备确定所述第一服务和所述第二服务对应的数据流为所述第一应用的数据流。
2.根据权利要求1所述的方法,其特征在于,所述时间信息包括:
数据流的开始时刻和/或结束时刻。
3.根据权利要求1或2所述的方法,其特征在于,所述报文转发设备根据所述相关性,确定所述第一服务和所述第二服务用于实现第一应用包括:
所述报文转发设备根据所述相关性,通过非监督算法进行聚类,确定所述第一服务和所述第二服务用于实现第一应用。
4.根据权利要求3所述的方法,其特征在于,所述聚类的方法包括:谱聚类算法、K-Means聚类算法或DBSCAN密度聚类算法。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述报文转发设备根据所述数据流集合中每条数据流的时间信息,确定所述服务集合中的各服务之间的相关性,包括:
所述报文转发设备根据所述数据流集合中每条数据流的时间信息,确定第一同现服务集合,所述第一服务和所述第二服务属于所述第一同现服务集合,所述第一同现服务集合中包括至少两个服务、且访问所述至少两个服务产生的数据流的时间信息的间隔时长小于或等于预设的时长;
所述报文转发设备根据所述第一同现服务集合,确定所述第一服务与所述第二服务之间的相关性。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
所述报文转发设备根据所述第一同现服务集合确定所述第一服务和所述第二服务之间的相似度,得到相似度矩阵;
所述报文转发设备根据所述相关性,确定所述第一服务和所述第二服务用于实现第一应用包括:
所述报文转发设备根据所述相似度矩阵确定所述第一服务和所述第二服务用于实现第一应用。
7.根据权利要求6所述的方法,其特征在于,所述报文转发设备根据所述第一同现服务集合确定所述第一服务和所述第二服务之间的相似度包括:
所述报文转发设备根据余弦相似度计算法、交并比计算法或者欧式距离计算法确定所述第一服务和所述第二服务之间的相似度。
8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:
所述报文转发设备通过图嵌入技术从所述相似度矩阵中提取所述第一服务的第一特征向量和所述第二服务的第二特征向量;
所述报文转发设备根据所述相关性,确定所述第一服务和所述第二服务用于实现第一应用包括:
所述报文转发设备根据所述第一特征向量和所述第二特征向量,确定所述第一服务和所述第二服务用于实现第一应用。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:
所述报文转发设备提取所述多条数据流的DNS特征,所述DNS特征包括所述目的IP地址和目的端口号的组合和域名的对应关系;
根据所述第一应用的数据流的目的...
【专利技术属性】
技术研发人员:邱亚平,罗奇,华卓隽,王璐,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。