System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 预测方法、装置、电子设备、存储介质及程序产品制造方法及图纸_技高网

预测方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:43532955 阅读:9 留言:0更新日期:2024-12-03 12:17
本公开提供了一种预测方法、装置、电子设备、存储介质及程序产品。预测方法包括:对当前时刻获取的多个初始样本进行预处理,得到当前时刻的样本集X<subgt;t</subgt;;基于样本集X<subgt;t</subgt;、样本集X<subgt;t</subgt;的投影矩阵W<subgt;t</subgt;、上一时刻的样本集X<subgt;t‑1</subgt;的投影矩阵W<subgt;t‑1</subgt;,计算原型对比损失函数;基于样本集X<subgt;t</subgt;和投影矩阵W<subgt;t</subgt;,计算流形正则化项;基于原型对比损失函数和流形正则化项,计算总损失函数;基于总损失函数和投影矩阵W<subgt;t‑1</subgt;,得到投影矩阵W<subgt;t</subgt;,并基于投影矩阵W<subgt;t</subgt;,从所有特征中选出特征子集;按照所述特征子集,对所述多个初始样本中的每个初始样本进行特征提取,并将提取到的特征值输入机器学习模型,得到针对所述每个初始样本的预测结果。

【技术实现步骤摘要】

本公开总体说来涉及机器学习,更具体地讲,涉及一种预测方法、装置、电子设备、存储介质及程序产品


技术介绍

1、无监督学习是一种机器学习范式,其中模型从未标记的数据中学习模式、结构或者其他有用的信息,而不需要任何明确的目标或者标签。在无监督学习中,模型通常试图发现数据中的潜在结构,比如聚类、降维或者异常检测。最常见的无监督学习算法包括聚类算法(如k均值聚类、层次聚类)、降维算法(如主成分分析、t-sne)、以及关联规则挖掘等。

2、在线学习是一种增量式的机器学习方法,其中模型能够持续地从流式数据中学习,并且在每次接收到新的数据时都进行更新。与批量学习不同,批量学习需要在整个数据集上进行训练,而在线学习则可以在数据流过程中不断地适应新的数据。在线学习对于需要实时预测或者处理大规模数据的应用非常有用,因为它能够在不中断系统运行的情况下不断地提高模型的性能。

3、特征选择是指从原始特征集合中选择出最相关或者最有用的特征子集的过程。在机器学习中,特征选择是一个重要的预处理步骤,它有助于减少模型复杂度、提高模型性能、加快训练速度、降低过拟合风险等。特征选择方法可以基于不同的准则进行,比如过滤式方法(如相关系数、方差分析)、包裹式方法(如递归特征消除)、嵌入式方法(如lasso回归、决策树)等。


技术实现思路

1、本公开的示例性实施例在于提供一种预测方法、装置、电子设备、存储介质及程序产品,其能够将原型对比学习运用在无监督在线特征选择上,同时实现抗遗忘和特征判别性识别,从而提高特征选择效果,进而提高预测准确性。

2、根据本公开实施例的第一方面,提供一种适用于无监督在线学习场景的预测方法,包括:对当前时刻获取的多个初始样本进行预处理,得到当前时刻的样本集xt;基于所述样本集xt、所述样本集xt的投影矩阵wt、上一时刻的样本集xt-1的投影矩阵wt-1,计算原型对比损失函数;基于所述样本集xt和所述投影矩阵wt,计算流形正则化项;基于所述原型对比损失函数和所述流形正则化项,计算总损失函数;基于所述总损失函数和所述投影矩阵wt-1,得到所述投影矩阵wt,并基于所述投影矩阵wt,从所有特征中选出特征子集;按照所述特征子集,对所述多个初始样本中的每个初始样本进行特征提取,并将提取到的特征值输入机器学习模型,得到针对所述每个初始样本的预测结果。

3、可选地,还包括:基于所述投影矩阵wt和所述投影矩阵wt-1,计算一致性损失函数;基于所述投影矩阵wt,计算稀疏约束项;其中,所述基于所述原型对比损失函数和所述流形正则化项,计算总损失函数的步骤包括:基于所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项,计算所述总损失函数。

4、可选地,所述基于所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项,计算所述总损失函数的步骤包括:对所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项进行加权求和,得到所述总损失函数。

5、可选地,所述对当前时刻获取的多个初始样本进行预处理,得到当前时刻的样本集xt的步骤包括:基于特征最大值矩阵和特征最小值矩阵,对所述多个初始样本进行预处理,并将预处理得到的样本构成的集合作为所述样本集xt;其中,所述特征最大值矩阵为:由所述多个初始样本的各个特征的最大值组成的矩阵;所述特征最小值矩阵为:由所述多个初始样本的各个特征的最小值组成的矩阵。

6、可选地,所述原型对比损失函数为:

7、

8、其中,vi为样本xi在子空间的投影:vi=xiwt(xi∈xt);

9、v′i为vi的正原型:v′i=xiwt-1;

10、v′j为vi的负原型:v′j=xjwt(xj∈xt且i≠j);

11、τ为超参数,nt为所述样本集xt中的样本总数,m为聚类总次数,为vi所属的类别的中心,为v′j所属的类别的中心,为vi所属的类别的浓度,为v′j所属的类别的浓度。

12、可选地,所述流形正则化项为:

13、tr((xtwt)tl(xtwt)),

14、其中,tr(.)表示矩阵的迹,l为图拉普拉斯矩阵,l=d-g,

15、其中,d为图的度矩阵,g为图的相似性矩阵。

16、可选地,所述一致性损失函数为:

17、所述稀疏约束项为:f为总列数。

18、可选地,所述基于所述投影矩阵wt,从所有特征中选出特征子集的步骤包括:按降序对所述投影矩阵wt各行的二范数进行排序;将排序结果中前预设数量个二范数所对应的特征构成的集合,作为所述特征子集。

19、根据本公开实施例的第二方面,提供一种适用于无监督在线学习场景的预测装置,包括:预处理单元,被配置为对当前时刻获取的多个初始样本进行预处理,得到当前时刻的样本集xt;原型对比损失计算单元,被配置为基于所述样本集xt、所述样本集xt的投影矩阵wt、上一时刻的样本集xt-1的投影矩阵wt-1,计算原型对比损失函数;流形正则化项计算单元,被配置为基于所述样本集xt和所述投影矩阵wt,计算流形正则化项;总损失函数计算单元,被配置为基于所述原型对比损失函数和所述流形正则化项,计算总损失函数;特征选择单元,被配置为基于所述总损失函数和所述投影矩阵wt-1,得到所述投影矩阵wt,并基于所述投影矩阵wt,从所有特征中选出特征子集;预测单元,被配置为按照所述特征子集,对所述多个初始样本中的每个初始样本进行特征提取,并将提取到的特征值输入机器学习模型,得到针对所述每个初始样本的预测结果。

20、可选地,还包括:一致性损失计算单元,被配置为基于所述投影矩阵wt和所述投影矩阵wt-1,计算一致性损失函数;稀疏约束计算单元,被配置为基于所述投影矩阵wt,计算稀疏约束项;其中,总损失函数计算单元被配置为:基于所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项,计算所述总损失函数。

21、可选地,总损失函数计算单元被配置为:对所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项进行加权求和,得到所述总损失函数。

22、可选地,预处理单元被配置为:基于特征最大值矩阵和特征最小值矩阵,对所述多个初始样本进行预处理,并将预处理得到的样本构成的集合作为所述样本集xt;其中,所述特征最大值矩阵为:由所述多个初始样本的各个特征的最大值组成的矩阵;所述特征最小值矩阵为:由所述多个初始样本的各个特征的最小值组成的矩阵。

23、可选地,所述原型对比损失函数为:

24、

25、其中,vi为样本xi在子空间的投影:vi=xiwt(xi∈xt);

26、v′i为vi的正原型:v′i=xiwt-1;

27、v′j为vi的负原型:v′j=xjwt(xj∈xt且i≠j);

28、τ为超参数,nt为所述样本集x本文档来自技高网...

【技术保护点】

1.一种适用于无监督在线学习场景的预测方法,其特征在于,包括:

2.根据权利要求1所述的预测方法,其特征在于,还包括:

3.根据权利要求2所述的预测方法,其特征在于,所述基于所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项,计算所述总损失函数的步骤包括:

4.根据权利要求1所述的预测方法,其特征在于,所述对当前时刻获取的多个初始样本进行预处理,得到当前时刻的样本集Xt的步骤包括:

5.根据权利要求1所述的预测方法,其特征在于,所述原型对比损失函数为:

6.根据权利要求1所述的预测方法,其特征在于,所述流形正则化项为:

7.根据权利要求2所述的预测方法,其特征在于,所述一致性损失函数为:

8.根据权利要求1所述的预测方法,其特征在于,所述基于所述投影矩阵Wt,从所有特征中选出特征子集的步骤包括:

9.一种适用于无监督在线学习场景的预测装置,其特征在于,包括:

10.一种存储指令的计算机可读存储介质,其特征在于,当所述指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至8中的任一权利要求所述的适用于无监督在线学习场景的预测方法。

11.一种电子设备,其特征在于,所述电子设备包括:

12.一种计算机程序产品,包括计算机可执行指令,其特征在于,所述计算机可执行指令被至少一个处理器执行时实现如权利要求1至8中的任一权利要求所述的适用于无监督在线学习场景的预测方法。

...

【技术特征摘要】

1.一种适用于无监督在线学习场景的预测方法,其特征在于,包括:

2.根据权利要求1所述的预测方法,其特征在于,还包括:

3.根据权利要求2所述的预测方法,其特征在于,所述基于所述原型对比损失函数、所述流形正则化项、所述一致性损失函数以及所述稀疏约束项,计算所述总损失函数的步骤包括:

4.根据权利要求1所述的预测方法,其特征在于,所述对当前时刻获取的多个初始样本进行预处理,得到当前时刻的样本集xt的步骤包括:

5.根据权利要求1所述的预测方法,其特征在于,所述原型对比损失函数为:

6.根据权利要求1所述的预测方法,其特征在于,所述流形正则化项为:

7.根据权利要求2所述的预测方法,其特征在于,所述...

【专利技术属性】
技术研发人员:杨芷依刘耀祖黄雅明禄家宝游琳敬黄夏渊张波乔红
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1