数据预测方法及系统技术方案

技术编号:6393237 阅读:751 留言:1更新日期:2012-04-11 18:40
本发明专利技术公开了一种数据预测方法,包括:获取各个观测点的趋势值和残差值;确定数据预测的主方向;逐个计算每个观测点与其他观测点之间的距离,以及每个观测点与其他观测点之间的连接线与主方向之间的夹角;将观测点分类;依据所述残差值,分别计算每类观测点的平均残差平方和;分别计算目标点与各个观测点的距离,以及目标点与各个观测点之间的连接线与主方向之间的夹角,选取与该距离和夹角相对应的平均残差平方和,预测目标点的观测值。应用上述技术方案,数据预测过程中,综合考虑了距离相关性和方向相关性,相对于只考虑距离相关性的克里金插值法而言,提高了平均残差平方和的准确度,进而提高了目标点观测值预测的准确度。

【技术实现步骤摘要】

本专利技术涉及数据挖掘
,更具体地,特别是涉及一种数据测试方法及系统。
技术介绍
随着近年来空间数据分析的需求与日俱增,空间统计在很多不同的领域的应用越 来越广泛。流行病学研究中,空间统计根据目标地区的流行病发生数据,指定疾病空间分布 图,找出疾病特异性规律,发现高发区和分布细致特征,为疾病病因的研究提供线索,也为 控制和预防流行病的策略提供重要依据。地质探索方面,空间统计主要用于研究空间结构 和进行空间估值。探矿过程中,考虑到矿藏在开采之前在时间上结构是不变的,因此通常是 在空间上布点进行钻探,对采样得到的样品进行分析,使用空间统计估计矿藏的分布和储 量。对环境污染进行研究时,运用空间统计对污染的传播方式进行研究,有助于人们对环境 污染进行控制。空间统计对房地产的价值进行评估时,在考虑外界影响因素的基础上,充分 考虑地区之间的相互关系,将对正确评估房地产的价值有很大帮助。而在交通领域中,可以 利用空间统计对人员、货物在空间上的流动方式进行研究,同时对通道上的不同区段进行 研究。其他在生物学、农业、水文、古气候、古地理、气象学、遥感地质、林业等许多方面空间 统计都有成功应用的实例。目前数据预测是空间统计的主要方法之一,所谓数据预测是通过对于已知地理位 置的空间属性值的规律和性质进行分析,建立空间模型来预测未知地理位置的空间属性 值。例如采矿过程中,基于已有的矿藏地点分布和储量的情况,结合地形的分布,得到其他 未知地点的矿藏储量情况,从而为将来的钻探和开采提供决策参考。在流行病传染趋势的 研究中,可以根据已有的不同地区的流行病发病人数,探索疾病的传染规律,对疾病的发展 趋势和地区间的影响进行分析判断,获取未发病地区的发病趋势,从而可以有效地加以预 防和控制。数据预测最常用的方法是趋势面分析和克里金插值法。趋势面分析实质上是通过 回归分析原理,运用最小二乘法拟合一个二维非线性函数,模拟地理要素在空间上的分部 规律,展示地理要素在地域空间上的变化趋势。其只考虑目标点的空间地理位置,并未考 虑目标点处各个邻近点与目标点邻近的距离以及邻近点观测值空间分布,导致预测准确度 低。为了解决趋势面分析方法的上述问题,研究人员提出了克里金插值法。克里金插 值法不仅考虑目标点的空间地理位置,还充分考虑与目标点相邻的各个已知观测点与目标 点的距离,而且综合已知观测点观测值的空间分布情况,对目标点的观测值进行预测,与趋 势面分析相比,提高了预测准确度。克里金插值法包括以下步骤步骤A 计算每个观测点的趋势值和该观测点的残差值;步骤B:分别计算每个观测点与其他各个观测点的距离,选取观测点之间的最大 距离和最小距离,根据最大距离和最小距离将所述观测点划分为至少两类;步骤C 分别计算每类观测点的平均残差平方和,记为C(i),i = 1,2,...,m,其中c(i)的计算公式为 )=¥ 。—"^7)^7,‘)为观测点的残差值。步骤D 分别计算每个观测点和预设的目标点的距离,根据距离选取与之相对应 的平均残差平方和,并计算所述目标点的残差估计值;步骤E 基于所述残差估计值,预测所述目标点的观测值。克里金插值法相比趋势面分析来说,在目标点的观测值预测时,综合了已知观测 点观测值的空间分布情况以及各个观测点与目标点的距离,提高了预测准确度。但是克里 金插值法的不足之处在于将其与不同观测点空间上的相关性简化为距离上的相关性,但在 实际中,目标点与不同观测点空间上的相关性不仅与距离有关,还存在方向相关性,比如 森林中某种树木的生长情况由于受地形和光照等因素影响,往往沿某一特定方向集中生 长。农业病虫害领域中,很多迁飞性害虫的迁飞轨迹受大气环流和风向影响,具有特定的方 向轨迹。因此,目标点与不同观测点方向上的相关性导致克里金插值法在数据预测时,预测 准确度降低。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种数据预测方法及系统,以实现数据预测时 同时运用目标点与各个观测点的距离相关性以及方向相关性,提高目标点观测值预测的准确度。为实现上述目的,本专利技术提供的一种数据预测方法的技术方案如下一种数据预测方法,包括获取各个观测点的趋势值和残差值;确定数据预测的主方向;逐个计算每个观测点与其他观测点之间的距离,以及每个观测点与其他观测点之 间的连接线与主方向之间的夹角;选取最大距离值hmax、最小距离值hmin、最大夹角值θ max和最小夹角值θ min,根据距 离区间和夹角区间和夹角区间[emin, QfflaJ将所述各个观测点划分为至少四类;与观测点分类单元和数值获取单元相连的平均残差平方和计算单元,用于依据所 述残差值,分别计算每类观测点的平均残差平方和;与平均残差平方和计算单元相连的观测值预测单元,用于分别计算目标点与各个 观测点的距离,以及目标点与各个观测点之间的连接线与主方向之间的夹角,选取与该距 离和夹角相对应的平均残差平方和,预测目标点的观测值。应用上述技术方案,数据预测过程中,首先计算数据预测的主方向,按照观测点之 间的距离,以及观测点之间连接线与主方向的夹角对观测点进行分类,获取每类观测点的 平均残差平方和。将目标点再按照与各个观测点的距离和连接线与主方向之间的夹角,选 取平均残差平方和,预测目标点的观测值。由于对观测点的分类以及对目标点观测值的预 测综合考虑了距离相关性和方向相关性,相对于只考虑距离相关性的克里金插值法而言, 提高了平均残差平方和的准确度,进而提高了目标点观测值预测的准确度。附图说明为了更清楚地说明本专利技术实施例,下面将对实施例中所需要使用的附图做简单的 介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人 员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的数据预测方法的流程图;图2为图1所示流程图中步骤S102中主方向的示意图;图3为图1所示流程图中步骤S104的流程图;图4为图1所示流程图中步骤S106的流程图;图5为本专利技术实施例中所选用的具体实例中稻飞虱的虫量数目分布图;图6为本专利技术实施例提供的数据预测系统的结构示意图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部实施例。基于本 专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他 实施例,都属于本专利技术保护范围。申请人:经研究发现,克里金插值法在进行数据预测过程中,对观测点分类时只考 虑观测点之间的距离,因此所得到的每类观测点的平均残差平方和只与距离相关性有关, 而未考虑实际情况中各个观测点之间的方向相关性,导致平均残差平方和的准确的降低, 进而导致目标点观测值预测的准确度降低。为了解决上述问题,本专利技术实施例提供一种数据预测方法,其对观测点分类时,综 合考虑了距离相关性和方向相关性,提高了每类观测点的平均残差平方和的准确度,进而 提高了目标点观测值预测的准确度。数据预测方法的流程图如图1所示,包括SlOl 获取各个观测点的趋势值和残差值;其中各个观测点的趋势值是根据趋 势面分析方法计算得到的。趋势面分析方法中常用的趋势面模型函数包括一次趋势面模 型本文档来自技高网
...

【技术保护点】
一种数据预测方法,其特征在于,包括:获取各个观测点的趋势值和残差值;确定数据预测的主方向;逐个计算每个观测点与其他观测点之间的距离,以及每个观测点与其他观测点之间的连接线与主方向之间的夹角;选取最大距离值h↓[max]、最小距离值h↓[min]、最大夹角值θ↓[max]和最小夹角值θ↓[min],根据距离区间[h↓[min],h↓[max]]和夹角区间[θ↓[min],θ↓[max]]将所述各个观测点划分为至少四类;依据所述残差值,分别计算每类观测点的平均残差平方和;分别计算目标点与各个观测点的距离,以及目标点与各个观测点之间的连接线与主方向之间的夹角,选取与该距离和夹角相对应的平均残差平方和,预测目标点的观测值。

【技术特征摘要】

【专利技术属性】
技术研发人员:瞿辉
申请(专利权)人:合肥兆尹信息科技有限责任公司
类型:发明
国别省市:34[中国|安徽]

网友询问留言 已有1条评论
  • 来自[未知地区] 2014年12月06日 10:39
    HRDHumanResourceDevelopment)人力资源发展简称HRD是80年代兴起的旨在提升组织人力资源质量的管理战略和活动也是正在不断发展的一个职业领域和科学一般而言HRD比较重视个人的发展是从个人内在配合组织外在发展而HRM人力资源管理HumanResourceManagement比较强调外在组织的需要配合人力的提升与运用更进一步地说组织的成长是配合个人能力的发展使人适其所尽其才物畅其流尽其用就是人力资源发展的要义
    0
1