【技术实现步骤摘要】
一种基于无人船和集成学习的智能广域水质监测分析系统、方法及水质分析方法
[0001]本专利技术涉及利用无人船进行水质监测的
,具体涉及一种基于低成本无人船和集成学习的智能广域水质监测分析系统、方法及水质分析方法。
技术介绍
[0002]随着经济增长,社会与个人对水资源利用的更多,对水质安全需求也精益求精。我国是水资源大国,但过去的几十年里还是发生了不少水质安全事件,因此水质监测不仅涉及居民日常用水,也是水产养殖等行业不可或缺的任务。水的溶氧值、浊度、PH值等是影响水质的重要因素,故常对它们进行数据测量并分析。
[0003]之前惯用的水质监测分析的方法主要有两种。一种是人工方法,工作人员在水域提取水源进行现场或带回实验室分析记录,此方法人工成本偏高,测量范围受限且时效性偏低;另一种是进行浮点式监测,在水域中广布浮标,这种方式一定程度上解决了前者测量范围受限和时效性偏低的问题,但是浮标多后期维护成本也高,且浮标固定意味着监测点固定,无法灵活改变测量范围。近些年,利用无人船进行水质监测的研究逐渐兴起,用无人船装载水质模块等,通过手机等手持设备或者PC机遥控无人船,理论上可行至任意水域点进行水质实时监测。
[0004]利用无人船进行水质监测既灵活且监测的范围也广。但现有的水质监测无人船大都造价偏高,且依靠人工操作的方式进行目标点监测,无法自主寻迹。另外水质测量方面,虽然实时性高,但数据还是单一,不仅是水质类别方面,同时对不同深度的水质参数也缺乏测量。因此在本专利技术的上位机程序中嵌有地图,无人船可按地图 ...
【技术保护点】
【技术特征摘要】
1.一种水质分析方法,其特征在于,采用随机森林算法实现,包括如下步骤:步骤1:提取三个特征,即PH、温度和溶解氧值,获得原始数据集;然后,将这些值与从历史数据集中获得的水质评价结果相结合,历史数据由人工采集的不同深度的水质参数和平均法得到的水质评价值组成;步骤2:通过对三个特征参数的异常值和水质评价值进行检索处理,对步骤1得到的数据进行清洗;具体方式为对水质参数及水质评价值分别进行遍历,通过预先设置的范围,对有错误的值进行删除,例如温度或水质评价值等数据明显超过正常范围的;步骤3:通过自举采样有放回的抽取(bootstrap),为每个决策树生成子训练集和测试样本,叶子节点分裂时,从M个特征中随机选取m个特征,满足m<M,采用基尼算法从m个特征中选取基尼指数最小的特征作为切分点进行裂,不进行剪枝操作使其最大限度的生长,形成单棵决策树,计算过程如下:式中,p
i
为类别C
i
在样本集N中出现的概率;步骤4:步骤2和3重复T次,构造T个决策树,生成随机森林;步骤5:汇总各决策树对测试样本的分类结果,得票最多的类为最终结果:式中,h
k
(x)为单棵决策树分类结果;argmax为求函数最大值自变量点集;T为决策树的数目;Y为目标分类;I()为示性函数。采用泛化误差衡量模型迁移能力,使用训练数据训练出来的模型oob(out of bag)数据或者测试数据上的表现可以用泛化误差来体现,泛化误差低,模型迁移能力好,反之则不好,定义余量函数,泛化误差如下:m
g
(X,Y)=av
k
I(h
k
(x)=Y)
‑
max
j≠k
av
k
I(h
k
(x)=j)
ꢀꢀꢀꢀ
(3)式中,j为误分向量;P
X,Y
为X,Y空间下的泛化误差;av
k
()为取平均,根据余量函数和泛化误差定义、强大数定律及决策树的结构可推导随机森林泛化误差总收敛于:同理,P
β
为β空间下的泛化误差,式5也表明了随机森林并不会因为决策树数量的增加而产生过拟合的不良效果,再定义随机森林的余量函数为:产生过拟合的不良效果,再定义随机森林的余量函数为:余量函数反映了模型正确分类的得票数超过误分类的最大得票数的程度,该值越大,则模型置信度越高,E
β
为β空间下的期望;根据切比雪夫不等式,可得:式中,E
X,Y
m
r
(X,Y)为训练的模型对分类结果的期望,再定义决策树的分类强度以及相关
性,分别用s,表示:s=E
X,Y
m
r
(X,Y)>=0
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)式中,d(β)、d(β
‘
)均为方差;独立同分布的随机变量遵循E
β
f(β)2=E
β,β
‘
f(β)f(β
‘
),再结合s,可得到:综上,可得随机森林的泛化误差收敛,其界限为:决策树分类强度s及决策树之间的相关程度决定随机森林的泛化误差范围,增大s或减小是提高训练模型分类精度的关键。上述oob数据为抽取样本过程中未被抽中的样本,即为带外数据,大约为37%,是由随机森林自身特性所决定的:该部分oob数据未参与模型的训练,可用于验证随机森林的泛化能力,具体:统计每棵决策树对袋外数据的误分率,取其平均值作为模型泛化误差的估计,称为包外估计,包外估计为随机森林泛化误差的一个无偏估计,结果近似于大量交叉验证的结果。2.一种基于无人船和集成学习的智能广域水质监测分析系统,其特征在于,包括低成本无人船系统、水质监测系统、水质分析算法三部分;第一部分,所述低成本无人船系统包括双体船,MCU,动力系统,导航模块,通信模块,电源模块;所述双体船的浮体为可充气气囊;所述MCU作为下位机,通过通信模块与上位机通讯;所述动力系统包括船体两侧的直流电机和无刷电调;所述直流电机驱动螺旋桨用于双体无人船的航行;所述无刷电调通过PWM方式对电机调速;所述导航模块包括北斗定位模块及航向角模块;所述北斗定位模块用于记录无人船的经纬...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。