System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及智慧农业,特别涉及一种作物的氮肥决策方法、装置、电子设备及存储介质。
技术介绍
1、现有的农田氮肥管理依靠传统经验,在作物生长过程中,氮肥施加的时间和施用量都相对固定,在一个区域(县或乡镇)内通常采用相同的管理模式,忽略了作物生长的时间和空间差异性,无法保证施肥与作物氮需求的同步。作物的氮肥决策需要确定最优的施肥的时间和施肥量,才能使作物的产量最高或者经济效益最大。在面对作物生长这种长序列的周期和较大的施氮动作空间时,动态规划方法的计算复杂度很高,因此目前的氮肥优化管理仍然依赖固定时间表进行决策。
2、强化学习方法结合了蒙特卡罗采样和动态规划算法,采用随机游走的方法来探索环境,能够根据外界环境的状态提供不同的决策方案。深度强化学习针对传统强化学习难以处理大量状态和动作数量的问题,引入深度神经网络来感知更复杂的环境状态和建立更复杂的策略,从而提升强化学习算法的能力。
3、然而,相关技术中,深度强化学习环境体大多数都是一个单独的作物模型或其替代模型,没有充分考虑作物模拟与实际生长可能存在的偏差,这种决策状态的不确定性会直接传递到决策模型中,容易导致决策失误;另外,深度强化学习在农业决策中的奖励主要关注产量或者经济效益,对于氮肥排放导致的环境污染考虑欠缺,无法综合考虑种植收益和环境效益;最后,决策的状态变量获取成本较高,通常采用破坏性采样的方式,费时费力,无法实现低成本、快速的作物氮肥实时决策。
技术实现思路
1、本申请提供一种作物的氮肥决策方法、装置、
2、本申请第一方面实施例提供一种作物的氮肥决策方法,包括以下步骤:
3、获取待观测作物的基础信息、决策日降水量和冠层图像;
4、基于所述基础信息构建环境体模型,并利用所述环境体模型得到所述待观测作物的作物生长模拟状态,并将所述冠层图像输入至预设的估测模型得到所述待观测作物的基础生长状态;
5、基于预设的同化模型,融合所述作物生长模拟状态和所述基础生长状态得到更新后的作物生长状态,并基于预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值。
6、可选地,在一些实施例中,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之后,包括:
7、基于所述环境体模型,根据所述施肥决策时间和施肥决策数值生成智能体奖励;
8、基于所述预设的智能体模型,根据所述智能体奖励更新所述施肥决策时间和施肥决策数值。
9、可选地,在一些实施例中,所述智能体奖励为:
10、rt=w1×2.72×ytarvest-w2×5.53×nt-w3×150×labort-w4×pt;
11、其中,rt为t时刻的奖励,yharvest为产量,nt为t时刻的施氮量,labort为t时刻的人工费,pt为氮肥流失到环境中的危害成本,w1、w2、w3和w4均为奖励系数。
12、可选地,在一些实施例中,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之前,包括:
13、所述预设的智能体模型由sac值函数和sac状态函数训练得到其中,所述sac值函数为:
14、
15、所述sac状态函数为:
16、
17、其中,q(st,at)为在t时刻状态st下采取动作at的状态-动作值函数,r(st,at)为在状态st下采取动作at的奖励,γ为折扣因子,为下一个状态st+1的状态函数的期望,p为转移概率,π为策略,logπ(at|st)为策略π在状态st下选择动作at的概率的对数,πnew为新的策略,π′为一个待优化的新策略,dkl为kl散度,为归一化常数,为在旧策略πold下,从状态st开始的价值函数,为策略π对所有可能的动作at的状态-动作值函数的期望。
18、可选地,在一些实施例中,所述预设的同化模型为:
19、
20、其中,为更新后的状态矩阵,为模型运行到t时刻的状态矩阵,kt为t时刻的卡尔曼增益,dobs,t为经过扰动的观测值,ht为t时刻将状态矩阵转换为观测矩阵的算子。
21、可选地,在一些实施例中,所述作物生长状态包括:作物的生育期、叶面积指数、地上生物量、叶片氮含量和产量。
22、本申请第二方面实施例提供一种作物的氮肥决策装置,包括:
23、获取模块,用于获取待观测作物的基础信息、决策日降水量和冠层图像;
24、模拟模块,用于基于所述基础信息构建环境体模型,并利用所述环境体模型得到所述待观测作物的作物生长模拟状态,并将所述冠层图像输入至预设的估测模型得到所述待观测作物的基础生长状态;
25、决策模块,用于基于预设的同化模型,融合所述作物生长模拟状态和所述基础生长状态得到更新后的作物生长状态,并基于预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值。
26、可选地,在一些实施例中,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之后,所述决策模块,包括:
27、奖励单元,用于基于所述环境体模型,根据所述施肥决策时间和施肥决策数值生成智能体奖励;
28、更新单元,用于基于所述预设的智能体模型,根据所述智能体奖励更新所述施肥决策时间和施肥决策数值。
29、可选地,在一些实施例中,所述智能体奖励为:
30、rt=w1×2.72×yharvest-w2×5.53×nt-w3×150×labort-w4×pt;
31、其中,rt为t时刻的奖励,yharvest为产量,nt为t时刻的施氮量,labort为t时刻的人工费,pt为氮肥流失到环境中的危害成本,w1、w2、w3和w4均为奖励系数。
32、可选地,在一些实施例中,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之前,包括:
33、所述预设的智能体模型由sac值函数和sac状态函数训练得到其中,所述sac值函数为:
34、
35、所述sac状态函数为:
36、
37、其中,q(st,at)为在t时刻状态st下采取动作at的状态-动作值函数,r(st,at)为在状态st下采取动作at的奖励,γ为折扣因子,为下一个状态st+1的状态函数的期望,p为转移概率,π为策略本文档来自技高网...
【技术保护点】
1.一种作物的氮肥决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之后,包括:
3.根据权利要求2所述的方法,其特征在于,所述智能体奖励为:
4.根据权利要求1所述的方法,其特征在于,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之前,包括:
5.根据权利要求1所述的方法,其特征在于,所述预设的同化模型为:
6.根据权利要求1所述的方法,其特征在于,所述作物生长状态包括:作物的生育期、叶面积指数、地上生物量、叶片氮含量和产量。
7.一种作物的氮肥决策装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之后,所述决策模块,包括:
9.一种电子设备,其特征在于,包括:存储器、处理器
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-6任一项所述的作物的氮肥决策方法。
...【技术特征摘要】
1.一种作物的氮肥决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之后,包括:
3.根据权利要求2所述的方法,其特征在于,所述智能体奖励为:
4.根据权利要求1所述的方法,其特征在于,在基于所述预设的智能体模型,根据所述更新后的作物生长状态和所述决策日降水量生成施肥决策时间和施肥决策数值之前,包括:
5.根据权利要求1所述的方法,其特征在于,所述预设的同化模型为:
6.根据权利要求1所述的方法,其特征在于,所述作物生长状态包括:作物的生育期、...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。