一种IO-Link主站数据报文传输处理方法和系统技术方案

技术编号:38205291 阅读:13 留言:0更新日期:2023-07-21 16:51
本发明专利技术提供了一种IO

【技术实现步骤摘要】
一种IO

Link主站数据报文传输处理方法和系统


[0001]本专利技术涉及数据处理
,尤其是涉及一种IO

Link主站数据报文传输处理方法和系统。

技术介绍

[0002]现有的对报文数据进行压缩,主要首先通过BWT编码增强数据之间的相关性,然后通过LZ77进行压缩,但是由于报文数据中的字符类别种类较多,现有的BWT往往是固定的字符顺序,比如字典中的字符顺序进行编码,导致编码后结果往往不能充分利用数据特性。

技术实现思路

[0003]本专利技术的目的在于提供一种IO

Link主站数据报文传输处理方法和系统,以缓解了现有技术中存在的技术问题。
[0004]第一方面,本专利技术实施例提供一种IO

Link主站数据报文传输处理方法,所述方法包括:采集报文数据;根据数据属性对所述报文数据进行分段,获得多个段数据;对每个段数据根据频率处理得到对应的字符组;计算每个字符组中每个字符的中心性,得到组边缘字符;通过环形字符计算得到每个组边缘字符的衔接性,以得到衔接字符;根据所述衔接字符和所述字符组中的字符得到字符顺序,以及根据所述字符顺序对段数据进行BWT编码;对每个段数据的编码数据通过LZ77压缩,得到并传输段压缩数据。
[0005]在可选的实施方式中,所述根据数据属性对所述报文数据进行分段,获得多个段数据的步骤包括:搜索所述报文数据中的关键词;根据所述关键词将相同含义的数据放到一起,获得一个段数据。
[0006]在可选的实施方式中,所述根据所述关键词将相同含义的数据放到一起,获得一个段数据的步骤包括:根据数据前缀对所述报文数据进行分类,将前缀相同的报文数据作为一个类别的数据,标记为一个所述段数据。
[0007]在可选的实施方式中,对每个段数据根据频率处理得到对应的字符组的步骤包括:统计每个段数据中每个字符的频率值;按照每个字符的频率值进行升序排序得到升序频率序列;通过otsu多阈值分割对所述升序频率序列进行分割,得到分割点;将相邻分割点之间的频率值作为一个类别的频率值;
根据每个类别中的每个频率值对应的一个字符,得到每个类别对应的所有字符;每个类别对应的所有频率相近的字符组成所述字符组。
[0008]在可选的实施方式中,所述计算每个字符组中每个字符的中心性,得到组边缘字符的步骤包括:对每个字符组,应用KM最大匹配原则,从KM匹配中的左侧节点中找到最大边值对应的字符,作为初始节点;根据匹配关系得到所述初始节点在右侧的匹配字符;找到所述右侧的匹配字符在左侧的同名节点,以及根据匹配关系获得所述左侧的同名节点在右侧的匹配字符;多次迭代直至遍历字符组中的所有字符,以得到一条匹配链;将所述匹配链中中心性最大的两个字符作为所述组边缘字符。
[0009]在可选的实施方式中,计算字符中心性的步骤包括:获得字符对应边的边值,标记为;获得字符节点的两侧节点数量的比值,标记为;根据第一预设公式获得字符的中心性,所述第一预设公式为:其中,表示字符的中心性。
[0010]在可选的实施方式中,所述通过环形字符计算得到每个组边缘字符的衔接性,以得到衔接字符的步骤包括:按照原始字符串的顺序,逆时针方向将所有的字符排序连接,以构建环形字符;计算所述环形字符中每个字符组中每个边缘字符作为字符组首字母时,对应的末尾边缘字符的中心性,以末尾边缘字符的中心性表征衔接性;将中心性最大的末尾边缘字符对应的字符组首字母作为实际字符组首边缘字符,以所述实际字符组首边缘字符和所述实际字符组首边缘字符对应的末尾边缘字符作为衔接字符。
[0011]在可选的实施方式中,计算环形字符中末尾边缘字符中心性的步骤包括:在环形字符中得到所述边缘字符对应的所有邻域字符;将每个邻域字符的中心性作为基本值,将每个邻域字符的出现频率作为权重值,以加权求和获得所述边缘字符对应的末尾边缘字符的中心性。
[0012]在可选的实施方式中,所述方法还包括:解压数据时,通过LZ77解压所述段压缩数据,获得解压数据;对所述解压数据的每个段数据通过BWT反编码,得到原始的段数据;从所述原始的段数据中提取预设数据,得到原始报文数据。
[0013]第二方面,本专利技术实施例还提供了一种IO

Link主站数据报文传输处理系统。所述系统包括:数据采集模块,用于采集报文数据;顺序计算模块,用于根据数据属性对所述报文数据进行分段,获得多个段数据;以
及对每个段数据根据频率处理得到对应的字符组;以及计算每个字符组中每个字符的中心性,得到组边缘字符;以及通过环形字符计算得到每个组边缘字符的衔接性,以得到衔接字符;以及根据所述衔接字符和所述字符组中的字符得到字符顺序,以及根据所述字符顺序对段数据进行BWT编码;压缩传输模块,用于对每个段数据的编码数据通过LZ77压缩,得到并传输段压缩数据。
[0014]本专利技术通过字符频率处理形成字符组,提高了这些字符形成组合字符的概率,进而有助于后续的压缩性能的提升;通过计算得到每个字符组中字符的中心性,得到边缘字符,进而通过环形字符计算得到每个边缘字符的位置,使得边缘字符作为不同频率组的衔接字符不会对相近频率之间的字符压缩造成较大影响,最大限度提高压缩效果;通过计算得到的字符顺序作为BWT中的字符顺序进行数据压缩,充分利用了数据特性,可以大大提高压缩效果,实现数据的高效传输。
附图说明
[0015]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;图1为本专利技术实施例提供的一种IO

Link主站数据报文传输处理方法流程示意图;图2为本专利技术实施例提供的一种HTTP请求报文示意图;图3本专利技术实施例提供的一种根据匹配关系得到匹配链的示意图;图4本专利技术实施例提供的一种环形字符的示意图;图5本专利技术实施例提供的一种IO

Link主站数据报文传输处理的原理示意图;图6为本专利技术实施例提供的一种IO

Link主站数据报文传输处理系统的结构示意图。
具体实施方式
[0016]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0017]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0018]应注意到:相似的标号和字母在下面的附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种IO

Link主站数据报文传输处理方法,其特征在于,所述方法包括:采集报文数据;根据数据属性对所述报文数据进行分段,获得多个段数据;对每个段数据根据频率处理得到对应的字符组;计算每个字符组中每个字符的中心性,得到组边缘字符;通过环形字符计算得到每个组边缘字符的衔接性,以得到衔接字符;根据所述衔接字符和所述字符组中的字符得到字符顺序,以及根据所述字符顺序对段数据进行BWT编码;对每个段数据的编码数据通过LZ77压缩,得到并传输段压缩数据。2.根据权利要求1所述的方法,其特征在于,所述根据数据属性对所述报文数据进行分段,获得多个段数据的步骤包括:搜索所述报文数据中的关键词;根据所述关键词将相同含义的数据放到一起,获得一个段数据。3.根据权利要求2所述的方法,其特征在于,所述根据所述关键词将相同含义的数据放到一起,获得一个段数据的步骤包括:根据数据前缀对所述报文数据进行分类,将前缀相同的报文数据作为一个类别的数据,标记为一个所述段数据。4.根据权利要求1所述的方法,其特征在于,对每个段数据根据频率处理得到对应的字符组的步骤包括:统计每个段数据中每个字符的频率值;按照每个字符的频率值进行升序排序得到升序频率序列;通过otsu多阈值分割对所述升序频率序列进行分割,得到分割点;将相邻分割点之间的频率值作为一个类别的频率值;根据每个类别中的每个频率值对应的一个字符,得到每个类别对应的所有字符;每个类别对应的所有频率相近的字符组成所述字符组。5.根据权利要求1所述的方法,其特征在于,所述计算每个字符组中每个字符的中心性,得到组边缘字符的步骤包括:对每个字符组,应用KM最大匹配原则,从KM匹配中的左侧节点中找到最大边值对应的字符,作为初始节点;根据匹配关系得到所述初始节点在右侧的匹配字符;找到所述右侧的匹配字符在左侧的同名节点,以及根据匹配关系获得所述左侧的同名节点在右侧的匹配字符;多次迭代直至遍历字符组中的所有字符,以得到一条匹配链;将所述匹配链中中心性最大的两个字符作为所述组边缘字符。6.根据权...

【专利技术属性】
技术研发人员:赵家茂程超
申请(专利权)人:深圳舜昌自动化控制技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1