System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及农业病害识别,尤其涉及一种基于主动学习的农业病害识别方法。
技术介绍
1、我国农业农村改革发展取得了明显成效,为维护经济社会大局稳定提供了坚实支撑。中国农业的稳健发展和持续增强,得益于国家不断推出的一系列促进粮食增产的政策、现代农业基础支撑的不断加强,以及农业高质量发展取得的显著成果。2022年,全国农业科技进步贡献率达到了62.4%,科技使农业综合生产能力进一步提升。农业病虫害长期以来一直是影响农作物产量与质量的关键因素之一,农业病害主要由专业人员进行现场预测上报,但该方式有人力成本高、效率低、准确率受限于工作人员能力等缺点。
2、随着互联网时代的到来和计算机技术的发展,利用机器自动化地训练农业病害预测和识别模型,能够对农作物虫害进行有效的监测,该方法一方面能够减少农药的使用量,保护农作物的质量和产量,另一方面能够降低人力成本,病虫害识别对智慧农业的发展具有重要意义。
3、农业病害识别技术受到了来自机器学习、计算机视觉、农业信息学等多个领域研究者的广泛关注。面向农业领域病害识别的著名研究机构有国外诺维萨德大学、波尔多大学、胡阿裏·布迈丁科技大学等。国内研究机构主要有中国农业科学院农业信息研究所、农业农村部农业大数据重点实验室、安徽省农业科学院农业经济与信息研究所等。目前主流的研究方法为传统机器学习方法和深度学习方法,即在特定数据集上,通过机器学习方法或深度学习方法进行训练,利用训练得到模型进行分类或预测等任务。相关研究机构在基于传统机器学习的特征抽取、向量表示、图像检测等方面都取得了较好效
4、数据的质量直接决定模型训练的性能,衡量数据集质量的维度有数据集数量、标注是否准确和完整、数据分布情况、数据是否全面等,而目前农业农业病害识别方法存在的以下问题:
5、1)目前农业数据集的农业病害数据图像标注语料规模有限的问题:
6、目前公开的农业病害数据种类及数量有限,且农业数据采集的代价和标注成本都较高。数据量少会导致模型产生过拟合的现象,过拟合是指模型在训练数据上表现很好,但在测试数据上表现较差。导致过拟合的原因是模型过于复杂地学习了训练集的细节和噪声,模型的鲁棒性和泛化能力较差。
7、2)目前农业数据集存在数据分布不均衡问题:
8、目前公开的农业病害数据多用于特定任务,数据采集及标注成本高、数据种类少、数据量小导致了农业病害数据分布不均衡等问题较为突出。数据分布不均衡表现在三个方面,类别不均衡、类间距离过小和类内距离过大。具体数据分布不均衡问题解释如下:
9、类别不均衡:当数据集中在某几个类别时,模型容易出现过拟合现象,即数据量大的类别在训练过程中训练较为充分,数据量小的类别训练不充分,导致评估模型性能时,数据量大的类别性能较好,数据量小的类别性能较差。
10、类间距离过小:指各类别之间的数据的距离,距离越小代表类间图片相似性越高。而类间数据的距离过小,表现为不同类别的农业病害和背景信息过于相似,使得模型无法准确区分不同类别数据的特征,从而降低模型的准确率,而且在训练过程中模型不容易收敛。
11、类内距离过大:指的是属于同一类别的数据之间的距离,距离越大代表类内图片相似性越低,类内距离较大可能是部分数据标注错误,这种情况需要进行数据清洗,也可能是同一类别的不同光线、不同角度、不同背景的数据,这种数据是正确的数据,能够在一定程度增强模型的鲁棒性和泛化能力。此外,由于同类数据差异较大,对类内距离过大的数据集进行训练时,模型不容易收敛。
12、3)农业数据集存在数据标注的质量差,造成农业病害识别精度低的问题:
13、农业病害数据标注需要相关领域专业背景,目前大多以人工标注为主,使得农业病害数据标注难度较大,且在不同光线、角度、背景信息下,有些不同种类的病害外观相似,同类病害却不相似的情况,进而造成农业病害识别精度降低。
技术实现思路
1、本专利技术提供一种基于主动学习的农业病害识别方法,以克服上述技术问题。
2、为了实现上述目的,本专利技术的技术方案是:
3、一种基于主动学习的农业病害识别方法,包括以下步骤:
4、s1:获取农业病害图像数据并对其进行预处理,以获取农业病害图像数据集;
5、且所述农业病害图像数据集中的样本图像包括互联网爬取的农业病害数据、plant village下载的农业病害数据以及拍摄的农业病害数据;
6、s2:获取样本图像的标注数据集、未标注数据集以及待标注数据集,且所述待标注数据集初始为空集;
7、所述标注数据集为通过创建的图像标注系统对样本图像进行处理获取的;
8、s3:构建用于图像检测/分类/分割的基于transformer的图像识别模型;
9、s4:通过所述基于transformer的图像识别模型,对所述标注数据集与未标注数据集进行评估,并根据评估结果将不满足评估指标的样本图像添加至待标注数据集中的样本图像;
10、所述评估指标包括用于对标注数据集进行图像检测时的第一评估指标,
11、与用于对未标注数据集进行图像检测时的第二评估指标;
12、s5:基于图像标注系统对待标注数据集中的样本图像进行领域专家标注,并将领域专家标注后的样本图像更新至标注数据集中,获取更新数据集;
13、s6:将更新数据集中样本图像作为输入数据,将样本图像的病害类型作为输出数据,并基于图像分类验证评价函数、图像分割评价函数以及图像检测评价函数,对基于transformer的图像识别模型进行更新训练;
14、s7:设置最大迭代轮次,并判断当前训练迭代轮次是否达到最大迭代轮次,若当前训练迭代轮次达到最大迭代轮次,则确认当前迭代训练后的基于transformer的图像识别模型为最终图像识别模型;
15、否则,自适应调整基于transformer的图像识别模型的模型参数权重,重复执行步骤s5~s6;
16、s8:根据最终图像识别模型以实现对农业病害的识别。
17、进一步的,s2中所述图像标注系统包括标注模块、审核模块以及数据增强模块;
18、所述标注模块用于对样本图像进行图像标注操作获取初始标注集,且所述图像标注操作包括图像分类标注、图像标框标注以及图像分割标注;
19、所述审核模块用于对初始标注集中的样本图像的标注质量进行评价,并对不满足标注质量评价指标的样本图像重新标注,以获取审核数据集;
20、所述数据增强模块用于对审核数据集中的样本图像进行旋转操作,并基于box-muller算法获取高斯分布随机数对旋转操作后的样本图像添加噪声,以实现图像数据的增强并获取标注数据集。
21、进一步的,所述标注质量评价指标包括标注像素精度误差指本文档来自技高网...
【技术保护点】
1.一种基于主动学习的农业病害识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于主动学习的农业病害识别方法,其特征在于,S2中所述图像标注系统包括标注模块、审核模块以及数据增强模块;
3.根据权利要求2所述的一种基于主动学习的农业病害识别方法,其特征在于,所述标注质量评价指标包括标注像素精度误差指标与标注标签正确性指标,其表达式为
4.根据权利要求3所述的一种基于主动学习的农业病害识别方法,其特征在于,S3中构建的所述基于Transformer的图像识别模型包括依次连接的输入层、线性映射层、Transformer编码层、分类层以及输出层;
5.根据权利要求4所述的一种基于主动学习的农业病害识别方法,其特征在于,所述S4包括以下步骤:
6.根据权利要求1所述的一种基于主动学习的农业病害识别方法,其特征在于,S6中所述图像分类验证评价函数的表达式为
【技术特征摘要】
1.一种基于主动学习的农业病害识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于主动学习的农业病害识别方法,其特征在于,s2中所述图像标注系统包括标注模块、审核模块以及数据增强模块;
3.根据权利要求2所述的一种基于主动学习的农业病害识别方法,其特征在于,所述标注质量评价指标包括标注像素精度误差指标与标注标签正确性指标,其表达式为
4.根据权利要求3所述的一种...
【专利技术属性】
技术研发人员:郑洁琼,孙璐,杨霞,唐家辉,孙振杰,曹浚研,
申请(专利权)人:大连东软信息学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。