System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 以合成方式生成训练数据制造技术_技高网

以合成方式生成训练数据制造技术

技术编号:44166193 阅读:4 留言:0更新日期:2025-01-29 10:39
本申请涉及图像处理。提供了一种用于生成合成训练数据的计算机实施的方法,该合成训练数据可用于训练数据驱动模型,该数据驱动模型用于分析包括至少一个对象的物理产品的表面图像,该方法包括:a)提供(210)图像数据,该图像数据包括:对象图像数据集,该对象图像数据集包括该至少一个对象的多个对象图像,至少一个对象图像与可用于注释该对象图像的内容的标签相关联;以及背景图像,该背景图像表示该物理产品的表面图像的背景;b)从该对象图像数据集中生成(220)合成对象图像数据集,其中,该合成对象图像数据集包括该至少一个对象的多个合成对象图像,至少一个合成对象图像与标签相关联;以及c)生成(230)多个第一合成训练数据样本,其中,每个第一合成训练数据样本是通过从该合成对象图像数据集中选择一个或多个对象图像并且通过在该背景图像上的一个或多个位置处绘制所选择的一个或多个对象图像来生成的。该计算机实施的方法可以用于改进用于在农业技术领域和生产环境中应用的计算机视觉技术。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术总体上涉及图像处理或计算机视觉技术。更具体地,本专利技术涉及以下各项:一种用于生成合成训练数据的计算机实施的方法和合成训练数据生成装置,该合成训练数据可用于训练数据驱动模型,该数据驱动模型用于分析包括至少一个对象的物理产品的表面图像;一种用于分析物理产品的表面图像的计算机实施的方法和图像分析装置;一种用于控制物理产品的生产过程的方法和系统;以及一种计算机程序产品。


技术介绍

1、在农业
,人们一直在努力使耕作或耕作操作更加可持续。精准耕作或精准农业被视为实现更好可持续性和减少环境影响的方式之一。这依赖于对田地中植物损害的可靠局部检测。在生产环境中,基于图像进行的生产过程监测和/或控制也依赖于对缺陷的可靠检测和缺陷的精准定位。


技术实现思路

1、因此,可能需要改进计算机视觉技术,使得足够准确地施用适量的化学产品。进一步地,可能需要针对生产环境中的应用来改进计算机视觉。

2、本专利技术的目的通过独立权利要求的主题来实现,其中,进一步的实施例包含在从属权利要求中。应当注意的是,本专利技术的以下描述的方面还适用于以下各项:用于生成合成训练数据的计算机实施的方法和合成训练数据生成装置,该合成训练数据可用于训练数据驱动模型,该数据驱动模型用于分析包括至少一个对象的物理产品的表面图像;用于分析物理产品的表面图像的计算机实施的方法和图像分析装置;用于控制物理产品的生产过程的方法和系统;以及计算机程序产品。

3、在本披露的第一方面,提供了一种用于生成合成训练数据的计算机实施的方法,该合成训练数据可用于训练数据驱动模型,该数据驱动模型用于识别包括至少一个对象的物理产品的表面图像中的各个对象,该方法包括:

4、a)提供(210)图像数据,该图像数据包括:

5、-对象图像数据集,该对象图像数据集包括该至少一个对象的多个对象图像,至少一个对象图像与能够用于注释该对象图像的内容的标签相关联,其中,该标签包括描述该至少一个对象图像中的该至少一个对象的特性以及指示该至少一个对象图像中的该至少一个对象的损害状况的特性值;以及

6、-背景图像,该背景图像表示该物理产品的表面图像的背景;

7、b)从该对象图像数据集中生成(220)合成对象图像数据集,其中,该合成对象图像数据集包括该至少一个对象的多个合成对象图像,至少一个合成对象图像与标签相关联;以及

8、c)生成(230)多个第一合成训练数据样本,其中,每个第一合成训练数据样本是通过从该合成对象图像数据集中选择一个或多个对象图像并且通过在该背景图像上的一个或多个位置处绘制所选择的一个或多个对象图像来生成的。

9、对于许多用例,需要识别某些对象并将其定位在背景对象的前面。例如识别叶子上的昆虫、培养皿中的孢子或昆虫、田地中的杂草以及生产过程中基质上的颗粒。为了使用深度学习方法来识别这种对象,需要大的训练数据集。与经典图像处理例程的开发相比,主要努力(和成本)不是软件开发成本,而是对数据进行标记的努力。实际的深度学习算法自适应于训练数据,并且所需的开发和调整工作要少得多。在一些情况下,经典算法甚至无法解决复杂的图像识别问题。深度学习方法的性能主要取决于高质量的大型训练数据集的可用性。

10、为此,提供了一种用于以合成方式生成训练数据的计算机实施的方法和合成训练数据生成装置。然后,可以使用合成训练数据来训练基于真实数据工作的模型。以合成方式产生数据可以潜在地应对两个提到的挑战——努力以及数据收集中出现缺陷的可能性。这些算法可以生成具有许多样本的分布良好的数据集,同时维持真实数据标记。

11、这种计算机实施的方法包括若干个步骤。首先,提供包括对象图像和一个或多个背景图像的图像数据。例如,用户可以提供若干个背景图像(例如,空的培养皿、叶子、土壤等)以及与其背景分离的对象图像(例如,各个孢子、昆虫或卵、颗粒)。使用规则和参数,比如图像中对象的数量、对象是否可以重叠或接触、出现的对象应当多远或多窄等,将确定生成的图像中对象的实际分布。另外,将采用图像增强技术来创建背景和各类对象图像的差异(关于大小、形状、取向等),使得它们反映真实的变化性。此外,可以使用生成深度学习模型(比如生成对抗网络gan、wasserstein gan和非对抗性图像合成)来进一步创建输入图像的新而自然的外观变体。在设置参数之后,可以开始实际数据集生成。可以以标准格式导出结果、外观自然的人工组合和自动生成的精确标签数据,这些标准格式可以用于各种图像任务,比如回归、分类、对象检测和对象分割。随后可以直接对数据驱动模型进行评估,或者可以基于生成的数据集来执行对数据驱动模型的手动微调。

12、标签数据包括描述至少一个对象图像中的至少一个对象的特性以及指示该至少一个对象图像中的该至少一个对象的损害状况的特性值。例如,特性可以包括以下各项中的一项或多项:可用于识别该至少一个对象的对象分类、该至少一个对象的坐标列表、该至少一个对象的分割掩膜等。特性值可以包括指示植物损害的特性值和/或指示与工业产品标准的偏差的特性值。特性值可以是数值(实数形式),比如百分比或绝对值,或者特性值可以是分类符(指示特定特性的存在或不存在的二元分类符,多类分类符)。例如,可以通过病害预测算法来评估田地中的各个作物,并且从0%(健康)到100%(由于病害而死亡)进行评分。

13、可以使用合成训练数据来训练各种类型的数据驱动模型。在一些示例中,数据驱动模型可以是分类符,例如用于指示产品是否满足预定义质量标准。在一些示例中,数据驱动模型可以是回归模型,例如用于确定产品图像中的缺陷数量。在一些示例中,数据驱动模型可以是用于对象检测和分类的模型,例如用于对产品图像中的缺陷进行检测和分类。在一些示例中,数据驱动模型可以是用于实例分割的模型,例如用于确定图像中的每个像素所属的类别和/或对象。

14、数据驱动模型可以是机器学习算法。机器学习算法可以是深度学习算法,比如深度神经网络、卷积深度神经网络、深度信念网络、循环神经网络等。

15、在一些示例中,数据驱动模型可以用于农业
在一些示例中,数据驱动模型可以是用于在田间试验中识别害虫(例如,瘤蚜属(myzus)、棉蚜(aphigo)、粉虱(bemisa)成虫、龄期粉虱(bemisa stadia)、龄期西花蓟马(franoc stadia))的算法。在一些示例中,数据驱动模型可以是用于分割作物(例如,番茄、胡椒、葡萄、苹果树)的主叶形状的算法。在一些示例中,数据驱动模型可以是用于识别杂草的算法。

16、在一些示例中,数据驱动模型可以是用于生产环境中的模型。在一个示例中,生成人工训练数据集以用于开发针对重叠对象(特别是阴极活性材料颗粒)的分割方法,在一些情况下,这些分割方法还可以包括对各个颗粒进行分类。基于更多数量的先前仔细分割的对象的合成和受控放置来增强训练数据对于减少需要以耗时方式标记的图像的数量可能是有用的。在一些示例中,数据驱动模型可以是用于孢子的对象检本文档来自技高网...

【技术保护点】

1.一种用于生成合成训练数据的计算机实施的方法(200),该合成训练数据能够用于训练数据驱动模型,该数据驱动模型用于识别包括至少一个对象的物理产品的表面图像中的各个对象,该方法包括:

2.根据权利要求1所述的计算机实施的方法,

3.根据权利要求1或2所述的计算机实施的方法,

4.根据权利要求3所述的计算机实施的方法,

5.根据前述权利要求中任一项所述的计算机实施的方法,

6.根据前述权利要求中任一项所述的计算机实施的方法,

7.根据权利要求6所述的计算机实施的方法,

8.根据前述权利要求中任一项所述的计算机实施的方法,

9.根据前述权利要求中任一项所述的计算机实施的方法,

10.根据权利要求9所述的计算机实施的方法,

11.根据前述权利要求中任一项所述的计算机实施的方法,进一步包括提供用户界面的步骤,该用户界面允许用户提供该图像数据。

12.根据前述权利要求中任一项所述的计算机实施的方法,

13.一种用于分析物理产品的表面图像的计算机实施的方法,该方法包括:

14.一种用于控制物理产品的生产过程的方法,该方法包括:

15.一种用于生成合成训练数据的合成训练数据生成装置(10),该合成训练数据能够用于训练数据驱动模型,该数据驱动模型用于分析包括至少一个对象的物理产品的表面图像,该合成训练数据生成装置包括一个或多个处理器,该一个或多个处理器被配置为执行权利要求1至12中任一项的方法的步骤。

16.一种用于分析物理产品的表面图像的图像分析装置(40),该合成训练数据生成装置包括一个或多个处理器,该一个或多个处理器被配置为执行权利要求13的方法的步骤。

17.一种用于控制物理产品的生产过程的系统(100),该系统包括:

18.一种包括指令的计算机程序产品,当该程序被处理单元执行时,这些指令使该处理单元执行权利要求1的方法或权利要求13的方法的步骤。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于生成合成训练数据的计算机实施的方法(200),该合成训练数据能够用于训练数据驱动模型,该数据驱动模型用于识别包括至少一个对象的物理产品的表面图像中的各个对象,该方法包括:

2.根据权利要求1所述的计算机实施的方法,

3.根据权利要求1或2所述的计算机实施的方法,

4.根据权利要求3所述的计算机实施的方法,

5.根据前述权利要求中任一项所述的计算机实施的方法,

6.根据前述权利要求中任一项所述的计算机实施的方法,

7.根据权利要求6所述的计算机实施的方法,

8.根据前述权利要求中任一项所述的计算机实施的方法,

9.根据前述权利要求中任一项所述的计算机实施的方法,

10.根据权利要求9所述的计算机实施的方法,

11.根据前述权利要求中任一项所述的计算机实施的方法,进一步包括提供用户界面的步骤,该用户界面允许用户提供该图像数据。

12.根...

【专利技术属性】
技术研发人员:T·艾格斯C·克鲁卡斯C·S·尤格尔R·纳瓦拉梅斯特
申请(专利权)人:巴斯夫欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1