处理局域网诊断数据制造技术

技术编号:27261762 阅读:34 留言:0更新日期:2021-02-06 11:21
公开了用于处理关于局域网(LAN,10)获得的局域网诊断数据的方法和装置。该方法包括:从关于LAN(10)获得的局域网诊断数据中识别出数据单元的集合,数据单元的集合包括具有预定关系的第一数据单元和相关联的第二数据单元;更新该集合的第一数据单元,以包括已识别到该集合的相关联的第二数据单元的指示;以及从LAN(10)发送更新后的第一数据单元而不发送相关联的第二数据单元,以用于在LAN之外的远程网络诊断设备(16)处的性能分析。网络诊断设备(16)处的性能分析。网络诊断设备(16)处的性能分析。

【技术实现步骤摘要】
【国外来华专利技术】处理局域网诊断数据


[0001]本专利技术涉及处理关于局域网获得的局域网诊断数据的方法和系统。具体地,本专利技术的优选实施方式涉及用于将这种诊断数据从局域网上载到(例如)互联网服务提供商以用于随后的分析、网络诊断和其它这样的处理的技术和装置。

技术介绍

[0002]在依赖于捕获和分析通过网络传输的各个数据包的网络诊断系统中,所需的存储、带宽和处理量取决于所捕获的数据包的数量和数据包的平均大小二者。因此,减少所捕获和处理的数据包的数量以及数据包的大小是有利的。
[0003]在数据包捕获或数据传输系统中,通常使用诸如GZIP压缩(稍后讨论)之类的压缩算法来减小数据包捕获的大小。可以根据要求的可接受的延迟和所需期望压缩率在逐个数据包的基础上或跨多个数据包的块来应用压缩。基于GZIP的数据包压缩具有是无损压缩方案的优点并且确保在解压缩时可以完美地重新创建所有数据包,然而这限制了可能的最大压缩量。
[0004]在基于IEEE 802.11的WiFi系统中,数据包捕获通常包含具有唯一的时间戳和帧序列号的帧,尽管数据包除了它们的存在外本身通常传达很少的有用诊断信息。然而,标准数据包捕获文件中的唯一帧时间戳和序列号通常会减少针对帧的可能的压缩量。通常,这些数据包必须相对于文件中的其它数据包在给定的时间延迟内出现,这意味着不必存储这些数据包确切的时间戳,因为可以从其相关数据包推断出该时间戳。IEEE 802.11协议内这些数据包的示例是“确认”(“ACK”:Acknowledgement)数据包和“允许发送”(“CTS”:Clear to Send)数据包,它们通常必须在其相关联的“数据”或“请求发送”(“RTS”:Request to Send)数据包的10μsec(即10微秒)内发生。此类数据包可能占数据包捕获文件内所有数据包的50%以上,尽管它们的数据包大小较小可能意味着它们可能仅占整个数据包捕获文件大小的15%。
[0005]虽然数据包捕获文件的大小会影响上载捕获数据所要求的存储量和带宽,但是(至少主要是)数据包捕获内的数据包数量确定分析数据包捕获需要多少CPU处理能力,因此去除小数据包仍然是有利的,即使这对经压缩的数据包捕获文件的大小没有显著影响。
[0006]注意将理解的是,根据OSI模型,所讨论的数据单元将通常被视为与它们在第2层的传输有关的帧,并且被视为与它们在第3层的传输有关的数据包,但是由于所讨论的帧是封装在数据包内以便将所讨论的数据作为数据包捕获的一部分上载,所以无论所讨论的数据单元被视为帧还是数据包,上述问题均适用,尤其是因为数据包捕获中的数据包的数量和大小将在很大程度上取决于它们承载的帧的数量和大小。
[0007]现在参考一些现有技术,GZIP(前面提到)是用于文件压缩和解压缩的文件格式和软件应用。简而言之,GZIP压缩使用Liv-Zempel(LZ)压缩来用单个实例替换数据中的相同字节序列,因此能够非常有效地压缩数据。LZ算法通过引用在未压缩数据流中先前存在的该数据的单个副本替换重复出现的数据来实现压缩。匹配由称为“长度-距离对”的一对数
字进行编码,这等效于以下语句:“接下来的[长度]个字符中的每个字符等于在未压缩流中在其后面恰好[距离]个字符的字符”。可以被替换的字节序列越长,压缩效率就可以越高。
[0008]然而,ZIP压缩是一种无损压缩技术,并且没有考虑字节序列之间的微不足道的差异(例如,数据包内容内具有相似但不相同的值的字段或者该值可变但不重要的字段不会被压缩)。同样,虽然ZIP压缩通常可以减少数据包捕获的大小,但由于各个数据包通常至少具有唯一的数据包号和/或时间戳,因此ZIP压缩通常不会减少解压缩后的数据包数量,因此GZIP压缩不一定会减少后端分析系统的处理要求。
[0009]有关GZIP的更多信息在标题为“GNU Gzip”的网页:https://www.gnu.org/software/gzip/manual/gzip.html和其它地方可以在线访问。
[0010]“Wireshark”提供了一种数据捕获技术,其可以“理解”各种联网协议的结构(即,封装)。Wireshark可以解析和显示字段以及不同联网协议指定的其含义。Wireshark使用“pcap”(数据包捕获)应用编程接口(API:application programming interface)捕获数据包,因此只能在“pcap”支持的网络类型上捕获数据包。
[0011]在Wireshark内,“Editcap”功能能够去除数据包捕获中的重复数据包(“数据包重复数据删除”)。为了识别相同的数据包,Wireshark基于数据包内容生成哈希值,并存储由绝对时间或由数据包数量定义的可配置历史窗口的历史哈希值。如果当前数据包哈希值与该窗口内的任何先前数据包的哈希值相同,则丢弃当前数据包。数据包哈希函数可以被配置成忽略来自数据包开始的固定字节数量,但是此数量对于所有数据包类型均相同,并且仅作为前缀。通常,这是为了允许在计算数据包哈希值时忽略时间戳和/或帧号。然而,从所有数据包中忽略相同的固定字节数。此外,在Wireshark中去除了重复的数据包,并且该数据包未保留任何记录,这意味着以后即使需要也无法将其恢复。
[0012]Pankaj Gupta和Nick McKeown的题为“Algorithms for Packet Classification”(IEEE Network:Magazine of Global Internetworking,Vol 15,Issue 2,March 2001,pages 24-32)的论文可以在http://yuba.stanford.edu/~nickm/papers/classification_tutorial_01.pdf在线访问,该论文描述了数据包分类技术,该数据包分类技术用于将数据包分组成语义相似的类,以允许将特定于类的处理(诸如流量整形或标识)应用于数据包。数据包分类器可以根据数据包类型使用数据包字段的不同子集来将数据包匹配到各种类别,即,数据包分类器可以定义相似性度量,通过该相似性度量可以将数据包与其它数据包进行比较。
[0013]Jill R.Goldschneider的题为“Lossy Compression of Scientific Data via Wavelets and Vector Quantization”(2000年2月)论文可以在https://digital.lib.washington.edu/researchworks/handle/1773/5881在线访问,该论文讨论了用于数据传输的有损压缩。在基于矢量量化(VQ:Vector Quantisation)的数据压缩中,利用最近的码本条目的索引替换数据包有效负载。VQ算法使用距离/相似性度量来对有效负载内容进行比较,以便找到最近的码本条目。通常,将单个距离度量应用于所有有效负载内容。在VQ系统中,码本通常是预定义的,并且不是从内容动态生成的,并且系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理关于局域网获得的局域网诊断数据的方法,所述局域网具有位于其中的至少一个用户设备,所述用户设备能够工作以经由局域网网关设备与所述局域网之外的通信网络中的一个或更多个远程设备进行通信,所述局域网诊断数据包括数据单元的一个或更多个集合,所述数据单元承载与关于所述局域网网关设备与位于所述局域网中的所述至少一个用户设备之间的通信的性能特性有关的数据,数据单元的各个集合至少包括具有预定关系的第一数据单元和相关联的第二数据单元,所述方法包括:从关于所述局域网获得的所述局域网诊断数据中识别出数据单元的集合,所述数据单元的集合包括具有预定关系的第一数据单元和相关联的第二数据单元;更新所述集合的所述第一数据单元,以包括已识别到所述集合的所述相关联的第二数据单元的指示;以及从所述局域网发送更新后的第一数据单元而不发送所述相关联的第二数据单元,以在所述局域网之外的所述通信网络中的远程网络诊断设备处进行局域网性能分析。2.根据权利要求1所述的方法,其中,关于所述局域网获得的所述局域网诊断数据包括符合预定版本的网络协议的多个数据包。3.根据权利要求1或2所述的方法,其中,关于所述局域网获得的所述局域网诊断数据包括符合预定无线联网协议的多个数据包。4.根据前述权利要求中任一项所述的方法,其中,所述局域网诊断数据包括以下项中的一项或更多项:-至少一个请求发送RTS数据包和至少一个相关联的允许发送CTS数据包;-至少一个数据DATA数据包和至少一个相关联的确认ACK数据包;-至少一个管理数据包和至少一个相关联的确认ACK数据包。5.根据权利要求4所述的方法,其中,以下项中的一项或更多项被识别成数据单元的集合:-请求发送RTS数据包和相关联的允许发送CTS数据包;-数据DATA数据包和相关联的确认ACK数据包;-管理数据包和相关联的确认ACK数据包。6.根据前述权利要求中任一项所述的方法,其中,所述局域网诊断数据包括数据单元的多个集合,所述数据单元承载与所述局域网的性能特性有关的数据,数据单元的各个集合至少包括具有预定关系的第一数据单元和相关联的第二数据单元。7.根据权利要求6所述的方法,其中,所述方法包括:从所述局域网诊断数据中识别出数据单元的多个集合,各个集合包括具有预定关系的第一数据单元和相关联的第二数据单元;更新各个集合的所述第一数据单元,以包括已识别到所述集合的所述相关联的第二数据单元的指示;以及从所述局域网发送更新后的局域网诊断数据,以在所述局域网之外的所述通信网络中的远程网络诊断设备...

【专利技术属性】
技术研发人员:F
申请(专利权)人:英国电讯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1