System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据集复杂度评估,尤其涉及一种工业机器人数据集复杂度评估方法。
技术介绍
1、当前数据驱动技术被广泛应用于工业机器人状态监测及故障诊断领域,数据驱动技术能否发挥最佳性能,除了与数据驱动模型本身参数设置、神经网络结构有关外,很大程度上依赖于数据集质量。在大规模应用的工业场景下,为了实现对工业机器人故障检测,通常采用高频数据采集的形式获取工业机器人的运行数据,这就导致了在对几百甚至数千台工业机器人上同时进行故障监测时,会产生海量并发数据。这些采集到的工业机器人各类运行数据,类别多,数据量大。因此需要对工业机器人数据集复杂度进行评估,从而进一步支持数据驱动模型结构优化、参数设置及性能评价等,
2、一般情况下,决定数据集复杂度的因素往往包含多个方面,其中,数据重叠度和不同类别之间的边界复杂程度是决定数据可分性问题难易程度的两大关键因素。工业机器人数据集典型样本类别如下表所示,为方便叙述,如图1所示,先以两类样本数据构成的工业机器人数据集分布情况为例进行说明。两类样本集合典型的数据分布拓扑结构主要包含以下几类,(1)无重叠且边界简单;(2)无重叠且边界复杂;(3)有重叠。
3、表1工业机器人数据集典型样本类别
4、
5、
6、现有的方法通常都是通过不同的算法单独的来评估数据重叠度和边界复杂程度,但是工业机器人数据样本包含多维特征,即无法通过图形的方式直观地观测工业机器人数据样本之间的分布情况。当工业机器人数据样本分布情况对于评估者是不可见时,单纯的重叠度评估或者边界
技术实现思路
1、有鉴于此,本专利技术的目的在于提出一种工业机器人数据集复杂度评估方法,以解决目前单纯的重叠度评估或者边界复杂度评估,难以如实反映工业机器人数据集复杂度全貌的问题。
2、基于上述目的,本专利技术提供了一种工业机器人数据集复杂度评估方法,包括:
3、获取需要进行复杂度评估的工业机器人的多类数据样本集合;
4、基于所述多类数据样本集合,确定待评估的复杂度类型;
5、基于待评估的复杂度类型,选择计算重叠度r的第一算式和计算边界复杂度l的第二算式,通过所述第一算式和所述第二算式计算获得重叠度r和边界复杂度l;
6、基于所述重叠度r,通过如下算式计算获得权重ω:
7、
8、基于权重ω重新分配重叠度r和边界复杂度l数值,计算获得工业机器人数据集复杂度评估指标f。
9、可选的,所述基于权重ω重新分配重叠度r和边界复杂度l数值,计算获得工业机器人数据集复杂度评估指标f包括:
10、通过如下算式计算获得f:
11、f=ωr+(1-ω)l。
12、可选的,所述待评估的复杂度类型为某两类数据样本集合之间的复杂度;
13、所述第一算式为:
14、
15、其中|cn|和|cn+1|表示工业机器人数据样本集合cn和cn+1包含的样本数目;
16、r(cn,cn+1)计算方法如下:
17、
18、其中,pn,m表示属于cn集合的第m个样本,knn(pn,m,cn+1)表示在pn,m样本周边k个邻近点中,属于cn+1类样本集合的样本数目,θ表示阈值,取为0-k/2之间的某个整数,将|knn(pn,m,cn+1)|-θ表示为x,对于λ(x)函数取值如下,
19、
20、所述第二算式为:
21、
22、其中lsc(pn,m)表示以pn,m样本点为中心,以距离样本pn,m最近的不同类别样本点之间的距离为半径绘制的圆内包含的样本数目,ne(pn,m)∈cn+1限定与pn,m不同的样本点只能属于cn+1类,ne(pn+1,m)∈cn限定与pn+1,m不同的样本点只能属于cn类。
23、可选的,所述待评估的复杂度类型为其中一类与其余所有类数据样本集合之间的复杂度;
24、所述第一算式为:
25、
26、其中,机器人数据集u为,u=c1∪c2∪c3∪…∪cn;
27、令u-s(cn)=c1∪c2…∪cn-1∪cn+1…∪cn,knn(pn,m,u-s(cn))表示在pn,m周边k个样本中,属于u-s(cn)集合的样本点数目,|cn|表示工业机器人数据样本集合cn包含的样本数目,θ表示阈值,取为0-k/2之间的某个整数,将|knn(pn,m,u-s(cn))|-θ表示为x,对于λ(x)函数取值如下,
28、
29、所述第二算式为:
30、
31、其中lsc(pn,m)表示以pn,m样本点为中心,以距离样本pn,m最近的不同类别样本点之间的距离为半径,绘制圆,则lsc(pn,m)表示该圆内包含的样本数目,ne(pn,m)∈u-s(cn)限定了与pn,m不同的样本点只能属于u-s(cn)类。
32、可选的,所述待评估的复杂度类型为多类数据样本集合整体复杂度;
33、所述第一算式为:
34、
35、其中,机器人数据集u为,u=c1∪c2∪c3∪…∪cn;
36、令u-s(cn)=c1∪c2…∪cn-1∪cn+1…∪cn,knn(pn,m,u-s(cn))表示在pn,m周边k个样本中,属于u-s(cn)集合的样本点数目,|u|表示工业机器人数据所有样本集合包含的样本数目,将|knn(pn,m,u-s(cn))|表示为x,对于λ(x)函数取值如下,
37、
38、所述第二算式为:
39、
40、其中lsc(pn,m)表示以pn,m样本点为中心,以距离样本pn,m最近的不同类别样本点之间的距离为半径,绘制圆,则lsc(pn,m)表示该圆内包含的样本数目,ne(pn,m)∈u-s(cn)限定了与pn,m不同的样本点只能属于u-s(cn)类。
41、有益效果:
42、通过上述方法在计算数据集复杂度评估指标f时,首先根据不同的待评估的复杂度类型,选择不同的计算算式,提升了功能性和准确性;
43、考虑到边界复杂度在重叠度较大时,将失效,因此随着重叠度增加,此时数据集复杂程度更倾向于以重叠度来表征,此时应赋予重叠度较大权重,而弱化边界复杂程度在整体数据集复杂度中的表征。而当重叠度减弱时,为了突出数据集边界复杂程度对于数据集内部不同类别样本之间区分度的影响,此时数据集复杂程度应倾向于以边界复杂程度来表征,而弱化重叠度的评判指标,而本专利技术提出的权重分配方法,恰好能够实现这一目的,在未知工业机器人数据样本分布条件下,通过计算重叠度,基于重叠度计算获得权重,进而获得基于权重ω重新分配重叠度r和边界复杂度l数值,将分配后的重叠度r和边界复杂度l数值结合,计算获得工业机器人本文档来自技高网...
【技术保护点】
1.一种工业机器人数据集复杂度评估方法,其特征在于,包括:
2.根据权利要求1所述的一种工业机器人数据集复杂度评估方法,其特征在于,所述基于权重ω重新分配重叠度R和边界复杂度l数值,计算获得工业机器人数据集复杂度评估指标f包括:
3.根据权利要求1所述的一种工业机器人数据集复杂度评估方法,其特征在于,所述待评估的复杂度类型为某两类数据样本集合之间的复杂度;
4.根据权利要求1所述的一种工业机器人数据集复杂度评估方法,其特征在于,所述待评估的复杂度类型为其中一类与其余所有类数据样本集合之间的复杂度;
5.根据权利要求1所述的一种工业机器人数据集复杂度评估方法,其特征在于,所述待评估的复杂度类型为多类数据样本集合整体复杂度;
【技术特征摘要】
1.一种工业机器人数据集复杂度评估方法,其特征在于,包括:
2.根据权利要求1所述的一种工业机器人数据集复杂度评估方法,其特征在于,所述基于权重ω重新分配重叠度r和边界复杂度l数值,计算获得工业机器人数据集复杂度评估指标f包括:
3.根据权利要求1所述的一种工业机器人数据集复杂度评估方法,其特征在于,所述待评估的...
【专利技术属性】
技术研发人员:刘志博,刘梦莹,刘永明,赵转哲,鲁月林,涂志健,张桐欣,周上喆,许德伟,
申请(专利权)人:安徽工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。