当前位置: 首页 > 专利查询>上海人工智能网络系统工程技术研究中心有限公司专利>正文

一种基于协同训练算法的空间信息网络资源分类方法技术

技术编号：36301409 阅读：28 留言：0更新日期：2023-01-13 10:17

本发明专利技术公开了一种基于协同训练算法的空间信息网络资源分类方法，属于网络资源分类技术领域，包括抓取网络业务实时在线流量，对在线流量进行实时特征提取和样本抽取，对抽取的样本进行特征提取，对抽取的样本按预设比例进行标记分类，将标记的样本放入有标记样本集中，将未标记的样本放入未标记样本集中，使用NF Tri

全部详细技术资料下载

【技术实现步骤摘要】
一种基于协同训练算法的空间信息网络资源分类方法

[0001]本专利技术属于网络资源分类
，具体地说，涉及一种基于协同训练算法的空间信息网络资源分类方法。

技术介绍

[0002]目前，随着互联网的发展和普及，互联网逐渐从一种专业的工具变成一种大众工具，互联网上的资源也日渐增多，同时，可以访问互联网的终端设备也不再仅限于计算机，手机、机顶盒、游戏机等多种类型的设备也开始具备了访问互联网的能力，互联网上的资源包括网页、文件、视频、音乐、应用等，保存在遍布全球数以万计的服务器中，种类繁多，数量巨大，必须有一种方法，使用相对简单的文字信息把这些资源一一分类标识出来，人们才能方便地定位和访问这些资源。
[0003]在真实的空间信息网络环境中，网络资源存在大量的噪声，其噪声主要包含由网络环境所引入的噪声，如Ka 频段受雨水、天气、太阳活动等而引起的高误码率，还有空间信息网络的长时延等问题而引入大量的噪声，这些噪声会对训练分类器造成影响，从而降低分类器的分类精度，同时传统资源流分类技术主要采用标准的Tri
‑
training分类算法，Tri
‑
training分类算法在训练辅助分类器时可能会错误标记，从而引入标记噪声，使用被标记错误的样本来训练分类器也会对分类器的精度造成影响，最终导致分类结果的错误率也因此提高。

技术实现思路

[0004]要解决的问题针对现有传统资源流分类技术在训练辅助分类器时可能会错误标记，从而引入标记噪声，使用被标记错误的样本来训练分类器也会对分...

【技术保护点】

【技术特征摘要】
1.一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，采用以下步骤：步骤1：抓取网络业务实时在线流量，对在线流量进行实时特征提取和样本抽取；步骤2：对抽取的样本进行特征提取；步骤3：对抽取的样本按预设比例进行标记分类，将标记的样本放入有标记样本集中，将未标记的样本放入未标记样本集中；步骤4：使用NF Tri
‑
Training算法对提取的特征结合标记样本集和未标记样本集进行计算训练，根据计算训练结果获得分类器；步骤5：使用分类器对提取的实时特征进行分类，获得分类结果。2.根据权利要求1所述的一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，所述步骤1和步骤2中特征提取的特征是基于包和基于流的统计分类特征。3.根据权利要求2所述的一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，所述基于包的统计特征包括最大包、最小包、平均包的大小、平均到达时间、相邻两数据包到达时间间隔均值和速率。4.根据权利要求2所述的一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，所述基于流的统计特征包括流的大小、流的持续时间、标志位个数。5.根据权利要求1所述的一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，所述步骤3中标记分类需要进行计算样本之间的距离和样本与整个样本集的距离。6.根据权利要求5所述的一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，样本之间的距离计算采用欧式距离算法，设两个样本的n维向量分别为s1( x
11
，x
12
，
…
，x
1n
) 和s2( x
21
，x
22
，
…
，x
2n
)，样本之间的计算公式如下：。7.根据权利要求5所述的一种基于协同训练算法的空间信息网络资源分类方法，其特征在于，样本与整个样本集的距离为样本差异性度量，公式如下：其中，d
i
表...

【专利技术属性】
技术研发人员：杨贻宏，
申请(专利权)人：上海人工智能网络系统工程技术研究中心有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人