System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种图像识别方法、装置、设备及计算机可读存储介质制造方法及图纸_技高网

一种图像识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:44856837 阅读:6 留言:0更新日期:2025-04-01 19:48
本发明专利技术公开了一种图像识别方法、装置、设备及计算机可读存储介质,包括:获取待识别图像和预设的目标问题;对待识别图像进行转码,得到图像转码后数据;对目标问题进行转码,得到问题转码后数据;将图像转码后数据与问题转码后数据进行拼接,得到拼接向量;利用通过自我对弈微调训练得到的图像识别模型对拼接向量进行识别,得到图像识别结果;其中,图像识别模型的迭代训练过程包括训练主模型区分图像样本关于目标问题对应的副模型回复和人类回复文本,并训练副模型生成与人类回复文本相似的回复;主模型为本次迭代得到的模型,副模型为上次迭代得到的模型。本发明专利技术实现了在没有额外人类标注数据的情况下,显著提升模型的图像识别能力。

【技术实现步骤摘要】

本专利技术涉及人工智能,特别是涉及一种图像识别方法、装置、设备及计算机可读存储介质


技术介绍

1、图像识别模型的训练往往依赖于人类注释数据。目前主要的图像识别模型的训练方法包括监督微调和从人类反馈中强化学习。

2、监督微调是通过使用带有标签的数据集对预训练模型进行进一步训练,通过验证集评估模型的性能,从而使其更好地进行图像识别。从人类反馈强化学习是一种结合了强化学习和人类反馈的技术,旨在通过人类提供的评价来优化图像识别模型。通常分为以下几个步骤:收集大量的人类标注数据,使用收集到的人类反馈数据图像样本识别模型,该模型能够预测人类对某个行为的评价。但是,两种方法均存在各自的缺点,对于监督微调而言,需要有高质量的带标签数据,增加了数据收集和标注的难度和成本。从人类反馈强化学习所需要收集的高质量的人类反馈数据也需要大量的时间和资源。

3、综上所述,如何有效地解决目前图像识别模型的训练数据收集和标注难度大,成本高,需要大量的时间和资源等问题,是目前本领域技术人员急需解决的问题。


技术实现思路

1、本专利技术的目的是提供一种图像识别方法,该方法实现了在没有额外人类标注数据的情况下,显著提升模型的图像识别能力;本专利技术的另一目的是提供一种图像识别装置、设备及计算机可读存储介质。

2、为解决上述技术问题,本专利技术提供如下技术方案:

3、一种图像识别方法,包括:

4、获取待识别图像和预设的目标问题;

5、对所述待识别图像进行转码,得到图像转码后数据;

6、对所述目标问题进行转码,得到问题转码后数据;

7、将所述图像转码后数据与所述问题转码后数据进行拼接,得到拼接向量;

8、利用通过自我对弈微调训练得到的图像识别模型对所述拼接向量进行识别,得到图像识别结果;其中,所述图像识别模型的迭代训练过程包括训练主模型区分图像样本关于所述目标问题对应的副模型回复和人类回复文本,并训练副模型生成与所述人类回复文本相似的回复;所述主模型为本次迭代得到的模型,所述副模型为上次迭代得到的模型。

9、在本专利技术的一种具体实施方式中,在获取待识别图像之后,对所述待识别图像进行转码之前,还包括:

10、获取预设的图像识别条件;

11、当确定所述待识别图像未满足所述图像识别条件时,对所述待识别图像进行调整。

12、在本专利技术的一种具体实施方式中,训练主模型区分图像样本关于所述目标问题对应的副模型回复和人类回复文本,并训练副模型生成与所述人类回复文本相似的回复,包括:

13、采集预训练图像数据集;

14、利用所述预训练图像数据集对预构建的初始模型进行训练,得到预训练模型;

15、采集微调数据集;其中,所述微调数据集中各微调数据均包含所述目标问题、与所述目标问题相关的图像样本和所述人类回复文本;

16、将所述微调数据集输入至所述预训练模型,得到当前模型回复文本;

17、判断所述预训练模型是否可对各人类回复文本和对应的当前模型回复文本进行区分;

18、若否,则将所述预训练模型确定为所述图像识别模型;

19、若是,则根据积分概率度量设置的目标函数对所述预训练模型进行参数调整;

20、将调整得到的迭代后模型确定为所述主模型,并将本次迭代前的模型参数对应的模型确定为所述副模型;

21、将所述微调数据集输入至所述副模型,输出当前模型回复文本;

22、判断所述主模型是否可对各人类回复文本和对应的当前模型回复文本进行区分;

23、若否,则将所述主模型确定为所述图像识别模型;

24、若是,则根据积分概率度量设置的目标函数对所述主模型进行参数调整,并重复执行所述将调整得到的迭代后模型确定为主模型的步骤。

25、在本专利技术的一种具体实施方式中,根据积分概率度量设置的目标函数对所述预训练模型进行参数调整,包括:

26、按照使得各人类回复文本和对应的当前模型回复文本之间的期望值最大化的原则,根据积分概率度量设置的目标函数对所述预训练模型进行参数调整;

27、相应的,根据积分概率度量设置的目标函数对所述主模型进行参数调整,包括:

28、按照使得各人类回复文本和对应的当前模型回复文本之间的期望值最大化的原则,根据积分概率度量设置的目标函数对所述主模型进行参数调整。

29、在本专利技术的一种具体实施方式中,根据积分概率度量设置的目标函数对所述预训练模型进行参数调整,包括:

30、根据积分概率度量设置的交叉熵损失函数对所述预训练模型进行参数调整;

31、相应的,根据积分概率度量设置的目标函数对所述主模型进行参数调整,包括:

32、根据积分概率度量设置的交叉熵损失函数对所述主模型进行参数调整。

33、在本专利技术的一种具体实施方式中,将本次迭代前的模型参数对应的模型确定为副模型,包括:

34、获取本次迭代前的模型参数对应的正则化项;

35、利用所述正则化项对本次迭代前的模型参数进行修正,得到所述副模型。

36、在本专利技术的一种具体实施方式中,根据积分概率度量设置的目标函数对所述主模型进行参数调整,包括:

37、获取当前的统计迭代轮次;

38、判断所述统计迭代轮次是否超出预设值;

39、若是,则执行所述将所述主模型确定为所述图像识别模型的步骤;

40、若否,则执行所述根据积分概率度量设置的目标函数对所述主模型进行参数调整的步骤。

41、一种图像识别装置,包括:

42、目标问题获取模块,用于获取待识别图像和预设的目标问题;

43、图像转码后数据获得模块,用于对所述待识别图像进行转码,得到图像转码后数据;

44、问题转码后数据获得模块,用于对所述目标问题进行转码,得到问题转码后数据;

45、拼接向量获得模块,用于将所述图像转码后数据与所述问题转码后数据进行拼接,得到拼接向量;

46、图像识别结果获得模块,用于利用通过自我对弈微调训练得到的图像识别模型对所述拼接后文本进行识别,得到图像识别结果;其中,所述图像识别模型的迭代训练过程包括训练主模型区分图像样本关于所述目标问题对应的副模型回复和人类回复文本,并训练副模型生成与所述人类回复文本相似的回复;所述主模型为本次迭代得到的模型,所述副模型为上次迭代得到的模型。

47、一种图像识别设备,包括:

48、存储器,用于存储计算机程序;

49、处理器,用于执行所述计算机程序时实现如前所述图像识别方法的步骤。

50、一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述图像识别方法的步骤。

51、本专利技术所提供的图像识别方法本文档来自技高网...

【技术保护点】

1.一种图像识别方法,其特征在于,包括:

2.根据权利要求1所述的图像识别方法,其特征在于,在获取待识别图像之后,对所述待识别图像进行转码之前,还包括:

3.根据权利要求1或2所述的图像识别方法,其特征在于,训练主模型区分图像样本关于所述目标问题对应的副模型回复和人类回复文本,并训练副模型生成与所述人类回复文本相似的回复,包括:

4.根据权利要求3所述的图像识别方法,其特征在于,根据积分概率度量设置的目标函数对所述预训练模型进行参数调整,包括:

5.根据权利要求3所述的图像识别方法,其特征在于,根据积分概率度量设置的目标函数对所述预训练模型进行参数调整,包括:

6.根据权利要求3所述的图像识别方法,其特征在于,将本次迭代前的模型参数对应的模型确定为副模型,包括:

7.根据权利要求3所述的图像识别方法,其特征在于,根据积分概率度量设置的目标函数对所述主模型进行参数调整,包括:

8.一种图像识别装置,其特征在于,包括:

9.一种图像识别设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述图像识别方法的步骤。

...

【技术特征摘要】

1.一种图像识别方法,其特征在于,包括:

2.根据权利要求1所述的图像识别方法,其特征在于,在获取待识别图像之后,对所述待识别图像进行转码之前,还包括:

3.根据权利要求1或2所述的图像识别方法,其特征在于,训练主模型区分图像样本关于所述目标问题对应的副模型回复和人类回复文本,并训练副模型生成与所述人类回复文本相似的回复,包括:

4.根据权利要求3所述的图像识别方法,其特征在于,根据积分概率度量设置的目标函数对所述预训练模型进行参数调整,包括:

5.根据权利要求3所述的图像识别方法,其特征在于,根据积分概率度量设置的...

【专利技术属性】
技术研发人员:崔凯
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1