System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向无数据黑盒模型的替代模型获取及辨识方法技术_技高网

面向无数据黑盒模型的替代模型获取及辨识方法技术

技术编号:42569469 阅读:6 留言:0更新日期:2024-08-29 00:36
本发明专利技术公开了一种面向无数据黑盒模型的替代模型获取及辨识方法,包括以下步骤:设置生成器生成样本集;设置阈值,对样本集中的样本进行筛选,获得可用样本;将可用样本输入云端机器学习模型,由云端机器学习模型输出相应的真实标签,以获得真实标签后的可用样本作为训练样本;采用训练样本对替代模型进行训练,获得替代辨识模型;采用替代辨识模型对待识别图片或文本进行辨识,输出辨识结果。本发明专利技术公开的面向无数据黑盒模型的替代模型获取及辨识方法,能够使替代模型进一步靠近云端机器学习模型,同时可以大大减少查询云端机器学习模型的次数。

【技术实现步骤摘要】

本专利技术涉及一种面向无数据黑盒模型的替代模型获取及辨识方法,属于人工智能。


技术介绍

1、现在的部署在云端的机器学习模型(即黑盒模型)通常只向用户开放api接口,也就是说,机器学习模型的结构、内部参数以及训练数据往往是未知的。我们只能通过将数据输入进api接口,然后接受api接口返回的结果,并且查询api的次数也是有限的。

2、由于无法获得云端的机器学习模型,这导致无法知晓机器学习模型的结构和参数,导致无法在其基础上进一步改进以适应特定的识别任务。基于上述问题,现有技术中一般在本地训练一个替代模型,然后利用替代模型的结构和参数来构建对抗样本,从而训练一个和云端的机器学习模型尽可能相似的替代模型,利用替代模型进行识别任务。

3、当前在没有云端机器学习模型的训练数据的情况下训练本地替代模型的技术路线有两条,一种是通过收集相应的代理数据,然后利用云端机器学习模型返回的预测结果作为标签,以此来训练本地的替代模型。但现实中代理数据并不容易收集,甚至由于数据的专业性,获取代理数据成本过大。因此第二种方法在没有代理数据的情况下通过生成式模型生成伪造数据,然后利用云端机器学习返回的预测结果作为标签来训练本地的替代模型。

4、当前的方法往往通过指定伪标签来使得生成模型生成能够让替代模型预测为指定伪标签的伪造数据,由于不合理的损失函数,当前的方法生成的伪造数据往往被替代模型过度自信认为是伪标签,从而使得伪标签和真实标签一致。这带来的结果是即使替代模型和云端机器学习模型之间的仍然存在一定距离,但是替代模型的更新趋于停滞,同时这也造成了查询次数的浪费。

5、因此,有必要对替代模型获取及辨识方法进行更为深入的研究,以解决上述问题。


技术实现思路

1、为了克服上述问题,本专利技术人进行了深入研究,提出了一种面向无数据黑盒模型的替代模型获取及辨识方法,包括以下步骤:

2、s1、设置生成器生成样本集;

3、s2、设置阈值,对样本集中的样本进行筛选,获得可用样本;

4、s3、将可用样本输入云端机器学习模型,由云端机器学习模型输出相应的真实标签,以获得真实标签后的可用样本作为训练样本;

5、s4、采用训练样本对替代模型进行训练,获得替代辨识模型;

6、s5、采用替代辨识模型对待识别图片或文本进行辨识,输出辨识结果。

7、在一个优选的实施方式中,s1中,所述生成器的损失函数设置为:

8、lg=lcls+αlharmony+βldiversity

9、lcls=ce(g(z,θg),y)

10、lharmony=var(s(g(z,θg),θs))

11、

12、其中,lg表示生成器的总损失,lcls表示生成器的样本分类损失,lharmony表示生成器的样本离替代模型边界的距离损失,ldiversity表示生成器的样本多样性损失,ce()表示交叉熵损失,g()表示生成器,z表示随机噪声,且其值满足标准正太分布,θg表示生成器的参数,y表示伪标签,var()表示方差,s()表示替代模型,θs表示替代模型的参数,xi、xj表示生成器生成的两个样本,下标i、j表示样本的序号,cs(xi,xj)表示检测xi、xj两个样本之间的相似度,α、β为可设置系数。

13、在一个优选的实施方式中,s1中包括以下子步骤:

14、随机初始化生成器的参数并生成均匀分布的伪标签y;

15、采用损失函数进行生成器参数的更新直至收敛;

16、采用更新后的生成器生成样本集。

17、在一个优选的实施方式中,s2中,所述筛选通过将样本的熵与阈值比较进行,当样本的熵低于阈值时,将该样本删除,否则将该样本保留。

18、在一个优选的实施方式中,样本的熵表示为:

19、

20、其中,xg表示样本,h(xg)表示样本的熵,si(xg)是样本xg经过替代模型预测后输出的属于类别i的置信度。

21、在一个优选的实施方式中,s4中,替代模型的损失lce设置为:

22、lce=ce(s(xg,θs),yg)

23、其中,ce()表示交叉熵损失,θs表示替代模型的参数,xg、yg表示训练样本即对应的真实标签。

24、在一个优选的实施方式中,替代模型参数通过以下方式进行更新:

25、

26、其中,表示更新后的替代模型参数。

27、本专利技术还提供了一种电子设备,包括:

28、至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法中任一项所述的方法。

29、本专利技术还提供一种存储有计算机指令的计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述任一项所述的方法。

30、本专利技术所具有的有益效果包括:

31、(1)设置的生成器损失函数能够使得生成的样本更多的落入“争议区域”,从而大大减少了查询云端机器学习模型的次数,同时进一步降低了替代模型和云端机器学习模型之间的不相似的程度;

32、(2)使替代模型进一步靠近云端机器学习模型,同时可以大大减少查询云端机器学习模型的次数。

本文档来自技高网...

【技术保护点】

1.一种面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

3.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

4.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

5.根据权利要求4所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

6.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

7.根据权利要求6所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

8.一种电子设备,包括:

9.一种存储有计算机指令的计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

【技术特征摘要】

1.一种面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

3.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

4.根据权利要求1所述的面向无数据黑盒模型的替代模型获取及辨识方法,其特征在于,

5.根据权利要求4所述的面向无数据黑...

【专利技术属性】
技术研发人员:马坷裴高政杨品慈许倩倩孙应飞黄庆明
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1