一种确定数据的传输故障原因方法及装置制造方法及图纸

技术编号:17164871 阅读:66 留言:0更新日期:2018-02-01 22:24
本申请公开了一种确定数据的传输故障原因方法及装置,能够提高在大流量下抓取故障特性信息的准确性,从而准确定位故障原因。本申请方法包括:获取数据在传输过程中所使用的传输协议信息;根据所述传输协议信息提取所述数据的故障特征信息;若检测到所述数据传输出现故障,则根据所述故障特征信息确定故障原因。

A method and device for determining the cause of data transmission failure

The application discloses a method and device for determining the cause of data transmission failure. It can improve the accuracy of grasping fault characteristic information under large flow rate, and locate the cause of the fault accurately. Including this application method: obtaining information transmission protocol data used in the transmission process; according to the fault feature information of the transmission protocol information extracted from the data; if the detected data transmission failure, according to the fault feature information to determine the fault reason.

【技术实现步骤摘要】
一种确定数据的传输故障原因方法及装置
本申请涉及通信
,尤其涉及一种确定数据的传输故障原因方法及装置。
技术介绍
在第四代移动通信技术长期演进(LongTermEvolution,LTE)标准中,使用了正交振幅调制技术、多输入多输出技术以及载波聚合等关键技术使得数据传输过程中的数据传输速率越来越高,无线空口传输下行峰值速率超过1Gbps。现阶段,第三代合作伙伴计划(ThirdGenerationPartnershipProject,3GPP)定义了第五代移动通信技术,无线空口传输下行峰值速率达到20Gbps甚至50Gbps以上。数据传输过程是一个端到端的过程,从服务器经由数通设备、核心网、传输设备以及无线基站等中间设备到达客户端。传输过程中出现丢包、乱序或时延抖动时,会影响到数据传输速率,进而影响用户的业务体验。所以在进行数据传输过程中如果出现体验不佳情况时,需要定位数据的传输故障原因,以便根据传输故障原因提出相应的解决方案。现有的一种确定数据的传输故障原因的方案为:采用实时报文全跟踪的方式,远端抓取大流量下的数据的全部报文,根据所抓取的全部报文定位故障特征,确定故障原因,进而采取相应的解决方案。然而,由于大流量下的数据的传输速率高,采用实时报文全跟踪的方式,会超过数据传输设备的中央处理器(CentralProcessingUnit,CPU)、内存以及带宽的极限能力,从而导致故障特征信息抓取不全,难以确定故障原因。
技术实现思路
本申请提供了一种确定数据的传输故障原因方法及装置,能够提高在大流量下抓取故障特性信息的准确性,从而准确定位故障原因。有鉴于此,本申请第一方面提供了一种确定数据的传输故障原因方法,可包括:获取数据在传输过程中所使用的传输协议信息,其中,数据的传输过程是一个端到端的过程,可以由服务器经由数通设备、核心网、传输设备以及无线基站等中间设备到达客户端。之后,根据传输协议信息提取数据的故障特征信息,如根据传输控制协议(TransmissionControlProtocol,TCP)提取数据的故障特征信息,根据用户数据协议(UserDataProtocol,UDP)提取数据的故障特征信息,根据通用分组无线业务隧道协议(GeneralPacketRadioServiceTunnelProtocol,GTP)提取数据的故障特征信息。最后,如果检测到数据传输出现故障,则根据故障特征信息确定故障原因,进而根据故障原因排除故障,从而保证排除故障的及时性,降低了因故障所造成的影响。可见,由于获取传输协议信息相对于获取数据的全部报文对CPU、内存以及带宽的要求要低,从而在保证实时性的同时最大限度降低对系统的冲击,所以本申请更容易提取故障特性信息,从而更容易准确定位故障原因,进而可以根据故障原因排除相应的故障。在一些可能的实现方式中,传输协议信息可以包括TCP,此时,根据传输协议信息提取数据的故障特征信息可以为:在TCP建立过程中,根据TCP提取数据的如下故障特征信息:接收窗口的窗口尺寸,最大分段大小(MaximumSegmentSize,MSS)以及差分服务码点(DifferentiatedServicesCodePoint,DSCP)。在一些可能的实现方式中,在TCP建立过程中,根据TCP所提取的数据的接收窗口的窗口尺寸用于分析是否会存在接收窗口的窗口尺寸设置过小导致限速,MSS过大导致报文分片,DSCP过小而确定存在带宽拥塞,因带宽拥塞丢弃低优先级的报文。TCP数据传输所使用的传输机制是滑窗机制,吞吐率等于接收窗口的窗口尺寸和发送窗口的窗口尺寸中的较小者除以环回时延(RoundTripTime,RTT),所以接收窗口的窗口尺寸会决定吞吐率能达到多大,如果接收窗口的窗口尺寸调得过小,比如小于第一预设阈值,那么吞吐率就会被限制,从而造成限速。客户端和服务器三次握手协商得到本次传输的最终数据传输报文大小,具体为客户端和服务器都会携带相应的MSS,经过三次握手协商后取两者中较小的MSS作为最终数据传输报文大小,如果数据传输报文大小超过中间传输设备的最大传输单元(MaximumTransmissionUnit,MTU)的传输大小,则会导致报文分片,报文分片后单位时间内的报文数就会翻倍,会对中间传输设备带来一定的冲击,导致丢包或者乱序产生。DSCP的取值范围可以为0到63,取值越高对应的报文的优先级越高,所以DSCP代表报文的优先级,在网络中可能有好多种报文,带宽往往是有限的,所以可能会对需要优先传输的报文提高优先级,以优先传输。提取DSCP信息可以是为了如发现丢包时,是否选择不丢高优先级的报文,而选择丢弃低优先级的报文,由于丢弃低优先级报文从而判断网络中可能出现了带宽拥塞等。在一些可能的实现方式中,传输协议信息可以包括TCP,此时,根据传输协议信息提取数据的故障特征信息还可以为:在TCP序号正常增长的数据传输过程中,根据TCP提取数据的如下故障特征信息:下行方向的流量大小和上行方向的流量大小、发送窗口的窗口尺寸、环回时延RTT以及确认ACK重传次数。上述下行方向的流量大小等于单位时间内接收报文数或单位时间内接收报文字节数或单位时间内接收报文比特数,上述上行方向的流量大小等于单位时间内发送报文数或单位时间内发送报文字节数或单位时间内发送报文比特数。在一些可能的实现方式中,在TCP序号正常增长的数据传输过程中,根据TCP所提取的数据的下行方向的流量大小和上行方向的流量大小、发送窗口的窗口尺寸、RTT以及ACK重传次数等信息,用于分析数据传输过程中的发包特征,即是否存在突发流量,是否存在丢包或乱序以及限速等问题。如果确定下行方向的流量大小超过传输网络最大带宽,或确定上行方向的流量大小超过传输网络最大带宽,则确定故障原因包括突发流量。TCP数据传输所使用的传输机制是滑窗机制,吞吐率等于接收窗口的窗口尺寸和发送窗口的窗口尺寸中的较小者除以RTT,所以发送窗口的窗口尺寸以及RTT的数值会决定吞吐率能达到多大,如果发送窗口的窗口尺寸调得过小,比如小于第五预设阈值,RTT的数值调得过大,比如大于第四预设阈值,那么吞吐率就会被限制,从而造成限速。此外,若RTT的数值调得过大,则故障原因也会包括高时延或时延抖动。丢包和乱序都会触发重传ACK,根据ACK重传次数可以判断是否存在丢包会乱序。即如果确定ACK重传次数大于第六预设阈值,则确定故障原因包括丢包或乱序。在一些可能的实现方式中,传输协议信息可以包括TCP,此时,根据传输协议信息提取数据的故障特征信息还可以为:在TCP序号异常增长的数据传输过程中,根据TCP提取数据的如下故障特征信息:序号跳变前后信息,序号跳变前后信息包括当前报文序列号、前报文序列号、当前报文长度、前报文长度、当前报文标识号以及前报文标识号。在一些可能的实现方式中,在TCP序号异常增长的数据传输过程中,若当前报文序列号的数值减去所述前报文序列号的数值大于前报文长度的数值,则确定故障原因包括数据跳变。在一些可能的实现方式中,在TCP序号异常增长的数据传输过程中,若当前报文序列号的数值减去前报文序列号的数值小于0,则判断当前报文标识号的数值减去前报文标识号的数值是否小于0;当当前报文标识号的数值减去本文档来自技高网...
一种确定数据的传输故障原因方法及装置

【技术保护点】
一种确定数据的传输故障原因方法,其特征在于,包括:获取数据在传输过程中所使用的传输协议信息;根据所述传输协议信息提取所述数据的故障特征信息;若检测到所述数据传输出现故障,则根据所述故障特征信息确定故障原因。

【技术特征摘要】
1.一种确定数据的传输故障原因方法,其特征在于,包括:获取数据在传输过程中所使用的传输协议信息;根据所述传输协议信息提取所述数据的故障特征信息;若检测到所述数据传输出现故障,则根据所述故障特征信息确定故障原因。2.根据权利要求1所述的方法,其特征在于,所述传输协议信息包括传输控制协议TCP,所述根据所述传输协议信息提取所述数据的故障特征信息包括:在TCP建立过程中,根据所述TCP提取所述数据的如下故障特征信息:接收窗口的窗口尺寸、最大分段大小MSS以及差分服务码点DSCP。3.根据权利要求2所述的方法,其特征在于,所述根据所述故障特征信息确定故障原因包括:若确定所述接收窗口的窗口尺寸小于第一预设阈值,则确定故障原因包括限速;若确定所述MSS的数值大于第二预设阈值,则确定故障原因包括分片;若确定所述DSCP的数值小于第三预设阈值,则确定故障原因包括带宽拥塞。4.根据权利要求1所述的方法,其特征在于,所述传输协议信息包括传输控制协议TCP,所述根据所述传输协议信息提取所述数据的故障特征信息包括:在TCP序号正常增长的数据传输过程中,根据所述TCP提取所述数据的如下故障特征信息:下行方向的流量大小和上行方向的流量大小、发送窗口的窗口尺寸、环回时延RTT以及确认ACK重传次数。5.根据权利要求4所述的方法,其特征在于,所述根据所述故障特征信息确定故障原因包括:若确定所述下行方向的流量大小超过传输网络最大带宽,或确定所述上行方向的流量大小超过所述传输网络最大带宽,则确定故障原因包括突发流量;若确定所述RTT的数值大于第四预设阈值,则确定故障原因包括高时延或时延抖动,若再确定所述发送窗口的窗口尺寸小于第五预设阈值,则确定故障原因还包括限速;若确定所述ACK重传次数大于第六预设阈值,则确定故障原因包括丢包或乱序。6.根据权利要求1所述的方法,其特征在于,所述传输协议信息包括传输控制协议TCP,所述根据所述传输协议信息提取所述数据的故障特征信息包括:在TCP序号异常增长的数据传输过程中,根据所述TCP提取所述数据的如下故障特征信息:序号跳变前后信息,所述序号跳变前后信息包括当前报文序列号、前报文序列号、当前报文长度、前报文长度、当前报文标识号以及前报文标识号。7.根据权利要求6所述的方法,其特征在于,所述根据所述故障特征信息确定故障原因包括:若所述当前报文序列号的数值减去所述前报文序列号的数值大于前报文长度的数值,则确定故障原因包括数据跳变。8.根据权利要求6所述的方法,其特征在于,所述根据所述故障特征信息确定故障原因包括:若所述当前报文序列号的数值减去所述前报文序列号的数值小于0,则判断所述当前报文标识号的数值减去所述前报文标识号的数值是否小于0;当所述当前报文标识号的数值减去所述前报文标识号的数值小于0时,则确定故障原因包括乱序;当所述当前报文标识号的数值减去所述前报文标识号的数值不小于0时,则在接收到所述当前报文序列号对应的报文之前,判断是否接收到所述当前报文序列号对应的初传报文;若接收到所述当前报文序列号对应的初传报文,则确定故障原因包括下游重传;若未接收到所述当前报文序列号对应的初传报文,则确定故障原因包括上游丢包。9.根据权利要求1至3任一项所述的方法,其特征在于,所述传输协议信息包括用户数据协议UDP。10.一种...

【专利技术属性】
技术研发人员:贺恩华
申请(专利权)人:上海华为技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1