当前位置: 首页 > 专利查询>青海大学专利>正文

一种用于评价草地退化程度的训练数据处理方法技术

技术编号:22168473 阅读:26 留言:0更新日期:2019-09-21 11:15
本发明专利技术涉及草地退化改良技术领域,具体地说,是一种用于评价草地退化程度的训练数据处理方法,将现有的数据作为神经网络的参数集,根据草地退化程度对该参数集进行分类,即,未退化、轻度退化、中度退化、重度退化和极度退化,然后建立神经网络模型,再将待评价草地上的可视草地植被数据采集整理作为训练集,通过神经网络模型,将训练集与参数集进行比对分析,得到该待评价草地的退化程度,该方法能够将采集到的海量数据进行科学处理,然后进行归纳总结,去除一些错误和非必要的数据,对剩余的高质量数据进行分析,协助专家对待评价草地的退化程度进行科学评价。

A Training Data Processing Method for Evaluating Degradation of Grassland

【技术实现步骤摘要】
一种用于评价草地退化程度的训练数据处理方法
本专利技术涉及草地退化改良
,具体地说,是一种用于评价草地退化程度的训练数据处理方法。
技术介绍
在大数据时代,各个领域每天会产生大量的数据,若这些数据不能服务于人类,则可能会成为无用数据,甚至是垃圾。但是,当我们很好的利用这些大数据,则可能会变废为宝。处于世界屋脊青藏高原的青海地区,是三江源腹地,是长江、黄河、澜沧江的发源之地、这里的气候会影响到长江、黄河的中下游乃至中南亚的气候。因此,三江源生态保护是国家重要的战略之一,多年来投入大量的资金,在做这项伟大而又艰巨的任务。三江源高寒草甸作为一种独特的草地类型,成为了很多研究者研究的对象。当地的草原总站、畜牧厅以及生态保护工作者、研究者每年会收集大量的工作数据,记录着多年来他们的心血。在长期的三江源生态环境保护研究中,科研工作者采集了有关生态学、地理学、地质学、环境学、社会学、经济学等各方面的大量数据,这些数据凝聚着几代科研工作者的心血和汗水,但由于科研工作者学科的关系,往往都是一些孤立的信息数据,具有本学科的特点和数据孤立性。长期以来一直依靠专家的经验并用人工的方法来进行评价草地退化情况。在长期的研究工作中,针对三江源高寒草甸,利用计算机人工智能技术开发高寒草甸草地分级决策与治理的专家系统来解决三江源地区草地退化程度判定和决策问题。一方面可以以计算机代替草地专家进行专家级别的决策,节省人力、物力、财力;另一方面,可以将专家的知识进行系统的总结,长期的存于计算机中,对专家知识的保护和传承。对于草地退化,研究方法很多,角度不同,切入点不同,结论也不同。草地退化对环境的影响尤为恶劣,现有的草原退化信息采集处理方法,过于简单,适用性较低。
技术实现思路
为了解决上述技术问题,本专利技术披露了一种用于评价草地退化程度的训练数据处理方法,该方法能够将采集到的海量数据进行科学处理,然后进行归纳总结,去除一些错误和非必要的数据,对剩余的高质量数据进行分析,协助专家对待评价草地的退化程度进行科学评价。本专利技术采用的具体技术方案如下:一种用于评价草地退化程度的训练数据处理方法,将现有的数据作为神经网络的参数集,根据草地退化程度对该参数集进行分类,即,未退化、轻度退化、中度退化、重度退化和极度退化,然后建立神经网络模型,再将待评价草地上的可视草地植被数据采集整理作为训练集,通过神经网络模型,将训练集与参数集进行比对分析,得到该待评价草地的退化程度。在上述技术方案中,将现有的数据作为神经网络的参数集,根据草地退化程度对该参数集进行分类:未退化、轻度退化、中度退化、重度退化和极度退化。每种退化类别的草类有明显的特征,按照这些特征,按照专家的观点将其总结为5个因素,即,凸斑地盖度、可食牧草比例、退化指示草种比例、土壤有机质含量、鼠害情况。每条可视草地植被信息对应的五种输入数据在分布上有个明显的特点,是每种类型的数据大致分布在不同的区域的,五种类型的数据的分布是有一定规律的,因此可以用不用颜色来标注数据的类型,只要看哪种颜色数据分布比较大即可获得待评价草地的退化程度。其中,神经网络结构采用tbdgd(凸斑地盖度)、ksmcbl(可食牧草比例)、thzsczbl(退化指示草种比例)、tryjzhl(土壤有机质含量)、shqk(鼠害情况)五个重要的影响草地退化的因素作为神经网络的5个输入结点,class1(未退化)、class2(轻度退化)、class3(中度退化)、class4(重度退化)和class5(极度退化)五个退化类别作为神经网络的5个输出结点,隐含结点的确定,通过大量的训练数据进行实验而确定的。本专利技术的进一步改进,对参数集采用公式最小最大规范化进行格式化,最小最大规范化如公式如下:其中,其中,v为参数数据,mina为训练集数据的最小值,maxa为训练集数据的最大值。最小最大规范化后,把所有数据定义在[0,1]范围之内,这样做的好处是将所有数据集体放大或集体缩小,以使得这些数据都落在一个统一的范围之内,但数据之间的关系是不会发生变化的。本专利技术的进一步改进,神经网络模型采用BP神经网络模型;训练集内的数据量小于等于参数集内的数据量。本专利技术的有益效果:本专利技术采用大数据与计算机专用程序结合,使得草地退化程度评价更加客观准确,且具有很强的通用性,可以适用于任何地区的草地退化评价。附图说明图1为隐含结点数为18的神经网络结构图;图2为隐含结点数为4的神经网络结构图;图3为五种类别的数据是基本均匀分布的数据集分布图。图4为集中分布在3,4,5类中的数据分布图。具体实施方式为了加深对本专利技术的理解,下面将结合附图和实施例对本专利技术做进一步详细描述,该实施例仅用于解释本专利技术,并不对本专利技术的保护范围构成限定。实施例:数据来源介绍:三江源高寒草甸作为一种独特的草地类型,成为了很多研究者研究的对象。具体实施方案:一种用于评价草地退化程度的训练数据处理方法,将现有的数据作为神经网络的参数集,根据草地退化程度对该参数集进行分类,即,未退化、轻度退化、中度退化、重度退化和极度退化,然后建立神经网络模型,再将待评价草地上的可视草地植被数据采集整理作为训练集,通过神经网络模型,将训练集与参数集进行比对分析,得到该待评价草地的退化程度,其中,对参数集采用公式最小最大规范化进行格式化,最小最大规范化如公式如下:其中,其中,v为参数数据,mina为训练集数据的最小值,maxa为训练集数据的最大值。最小最大规范化后,把所有数据定义在[0,1]范围之内,这样做的好处是将所有数据集体放大或集体缩小,以使得这些数据都落在一个统一的范围之内,但数据之间的关系是不会发生变化的。在本实施例中,神经网络设计:神经网络结构采用BP神经网络模型,将tbdgd(凸斑地盖度)、ksmcbl(可食牧草比例)、thzsczbl(退化指示草种比例)、tryjzhl(土壤有机质含量)、shqk(鼠害情况)五个重要的影响草地退化的因素作为神经网络的5个输入结点,class1(未退化)、class2(轻度退化)、class3(中度退化)、class4(重度退化)和class5(极度退化)五个退化类别作为神经网络的5个输出结点。在本专利技术技术方案中,收集了2万多条数据,分析并预处理后,部分作为神经网络设计、训练与测试,进行首次草地的评价;部分用于补充评价,图1和图2实验过程中随机截图的隐含结点为18和4的两种结构的神经网络结构,其中,绿色部分1为神经网络的输入,黄色部分2为神经网络的输出,中间红色部分3为隐含结点。对草地的研究是很多草地专家研究的热点问题,针对三江源地区高寒草甸草地退化的原因及影响因素,很多专家做了大量的研究,因研究的手段不同、研究地区不同、着眼点不同,研究的结果也会不同。有些专家学者从健康草甸(hm)、退化斑块(dp)、2年的Zokor土堆(zm2)三个方面进行研究草地的退化情况。本实施例以另一类专家的观点为例进行草地退化程度的决策方法的研究。此观点认为,三江源地区高寒草地的分类分为5个级别,分别为未退化、轻度退化、中度退化、重度退化、极度退化,而影响这五个级别主要影响因素有5个,分别为禿斑地盖度、可食牧草比例、退化指示种比例、0—10cm土壤有机质含量、鼠害情况。因为神经网络模型的质量本文档来自技高网
...

【技术保护点】
1.一种用于评价草地退化程度的训练数据处理方法,其特征在于,将现有的数据作为神经网络的参数集,根据草地退化程度对该参数集进行分类,即,未退化、轻度退化、中度退化、重度退化和极度退化,然后建立神经网络模型,再将待评价草地上的可视草地植被数据采集整理作为训练集,通过神经网络模型,将训练集与参数集进行比对分析,得到该待评价草地的退化程度。

【技术特征摘要】
1.一种用于评价草地退化程度的训练数据处理方法,其特征在于,将现有的数据作为神经网络的参数集,根据草地退化程度对该参数集进行分类,即,未退化、轻度退化、中度退化、重度退化和极度退化,然后建立神经网络模型,再将待评价草地上的可视草地植被数据采集整理作为训练集,通过神经网络模型,将训练集与参数集进行比对分析,得到该待评价草地的退化程度。2.根据权利要求1所述的用于评价草地退化程度的训练数据处理方法,其特征...

【专利技术属性】
技术研发人员:李春梅刘志强欧为友肖锋杨新存田芳周钧马蓉
申请(专利权)人:青海大学
类型:发明
国别省市:青海,63

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1