一种用于更新反映物理区域中的时空现象的数据结构的计算机实现的方法(200)、计算机程序产品、以及计算机系统,其中通过高斯过程采用平均值函数和协方差函数在该物理区域的任意位置处对该时空现象进行估测,该方法(200)包括:存储(210)适于表示该物理区域的固定位置的数据集,其中根据该高斯过程,该数据集具有平均向量和协方差矩阵,且其中数据结构包括该平均向量和该协方差矩阵;从位于该物理区域的特定任意位置处的多个传感器节点中的至少一个传感器节点接收(222,224)该时空现象的传感器测量数据;并通过使用准确递归贝叶斯回归将特定任意位置和所接收的测量数据合并(230,232,234,236,238)至数据结构中。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术通常涉及电子数据处理,特别是用于处理传感器测量数据的系统和方法。
技术介绍
对诸如气体、温度、或风的时空现象的测量、估测、以及预测与各种用例有关。例 如,城市环境中的诸如大气污染的时空现象如果超过一定阈值,则这种时空现象可能对当 地居民的身体产生危害。例如,一氧化碳(CO)和二氧化碳(C02)就是这样的气体。因此, 在特定时间特定地区准确估测和预测大气污染有助于预防有害情况的发生。也可在其他情 况下观察这样的时空现象,例如在天体物理学、医学、机器人学、人机交互、以及地质物理学 领域。 空间分布型传感器网络一般包括大量传感器节点,传感器节点可提供关于其周围 区域时空现象的测量数据。传感器节点可在该区域均匀分布或不规则分布。该区域的大小 可范围小至例如一个小湖泊到一个超大城市甚至夜空。传感器节点可以以精确或粗糙模式 覆盖该区域。此外,通常而言,这样的传感器网络测量大量数据用于分析。除此之外,因为 数据带有噪声,所以分析更为复杂。但是在如此大量的传感器测量的数据集上执行估测和 预测的时空回归分析,对计算能力有很高要求,甚至可以说是棘手的。 通常假设时空现象呈高斯分布,因此,可应用高斯过程(GP)回归估测时空现象的 未知分布。GP允许根据带有噪声的数据实现对回归函数的非参数学习;这也被称为训练。 GP可被认为是取决于该数据的函数上的高斯分布。因此,GP提供回归函数,用于根据数据 的噪声和变异性的估测和预测以及不确定性估测,例如,误差条形图。但是,由于GP的非参 数性的本质,因此借助〇(n3)调整训练GP的计算,其中n是数据点的数量,例如测量数据的 完整集合。所谓的大〇符号是函数的限定行为的指示符(当其自变量倾向于具体值时,典 型地是极大的数值或无限大)。因此,大0符号描述处理器上的计算负荷。由于对时空现象 的测量通常生成大量数据,即自变量n,立方行为〇(n3)是禁止的(针对在采用标准处理器 的计算机上处理)。另外,借助新的测量数据更新GP的要求会更高,因为每个新的训练期都 需要批量处理时间内所获取的所有测量数据。另外,由于所有测量数据必须随时可用,因此 必须提供足够的存储器容量,例如随机存取存储器(RAM)和大容量存储设备。对于GP,另 请参阅:CarlE.Rasmussen和ChristopherWilliams.GaussianProcessesforMachine Learning。MIT出版社,2006。 为了减少计算负荷,现有技术中的当前方法提出近似法,其对大小为s的训练数 据的子集进行操作,其中该数据集的大小s明显小于测量数据n的完整集合。这将GP的回 归函数的训练的计算负荷减少至〇 (s2n)。但是,这些方法假定在训练之前,整个数据集是可 用的,因此,训练是在一次批量运行中执行的。当有新的训练数据可用时,由这些方法进行 的更新就需要在时间内取得的所有测量数据在〇(s2n)中被处理,其中由于n又纳入了新的 测量数据,因此n现在增加了。这也需要相应的存储器容量,存储所有历史测量数据。尽管 这些方法能够在一定程度上降低计算负荷,取决于对于数据集的大小s的整体降低,但其 却不适用于连续到来的训练数据。另外,为了明显降低计算复杂程度,与n相比,数据集的 大小s必须降低到显著更小的数量。因此,为了接收准确结果,所述方法需要彻底且恰当地 选择数据集s;否则,因为基于数据子集s的预测通常以例如启发式的方式执行,因此训练 结果的准确性将显著降低。 在典型的时空现象的估测和预测的用例中,训练数据依次到达,例如按照时间序 列。因此,批量处理并不可行,而是需要GP的连续训练。现有技术的连续训练方法是已知 的。例如,通过采用传感器测量来实现连续训练,以更新先验已知固定传感器位置的状态估 测,所述传感器位置甚至可能均匀地分布于整个区域。因此,移动传感器节点的测量数据, 例如车辆或智能手机中集成的传感器,就不被纳入考虑之列,但是,诸如城市化地区的复杂 环境可能不允许均匀分布的传感器网络。此外,这些方法中的一些是严重应用特定的,或者 只适用于单维度输入,例如一氧化碳(CO)的测量数据。
技术实现思路
因此,需要改进GP回归,使其在计算和存储器方面效率更高。 本专利技术的实施例提供GP的精确连续训练的系统和方法,用于带有多维测量数据 的复杂环境下的时空现象。此外,GP回归训练可独立于特定的应用场景,并可用于包括固 定传感器节点和移动传感器节点的先验未知的传感器网络。 通过本专利技术的一个方面,计算机递归处理从相应区域中任意传感器位置连续接收 的传感器节点测量数据,用于更新数据结构。因此,得到的计算复杂度为〇(n)。该数据结构 包含用于相应时空现象的GP估测和预测的全部信息。该数据结构只需有限的存储器容量, 因为在该方法中,传感器节点的历史测量数据被并入数据结构中,而不存储原始测量数据。 换句话说,一旦以接收的测量数据更新该数据结构,即可丢弃原始数据。 数据结构反映了物理区域中的一种时空现象,其中高斯过程采用平均值函数和协 方差函数,在该物理区域中的任意位置对该时空现象进行估测。换言之,该平均值函数以任 意位置的通用函数的形式描述该时空现象的趋势,而该协方差函数描述任意两个位置的相 互关系。该时空现象的实际函数是未知的。但是GP被用于估测该时空现象的值。 根据本专利技术的一实施例,一种更新该数据结构的计算机实现的方法包括:存储适 于代表该物理区域的固定位置的数据集,其中根据高斯过程,该数据集具有平均向量和协 方差矩阵,且其中该数据结构包括该平均向量和该协方差矩阵;从位于该物理区域的特定 任意位置的多个传感器节点中的至少一个传感器节点接收该时空现象的传感器测量数据; 且通过采用所谓的准确递归贝叶斯回归,将所述特定任意位置和所接收的测量数据合并归 入所述数据结构中。 "适于代表固定位置的数据集"也指"适于代表固定位置的所述数据集"以及"固定 位置的数据集",或仅仅"数据集"(当上下文明确定义它时)。 该计算机实现的方法的优势在于允许不需为随后的GP学习而存储接收的传感器 测量数据,这是因为合并步骤已将所接收的测量数据并入该数据结构中。换言之,传感器节 点所提供的该测量数据被并入该平均向量中,且所述传感器节点的位置数据被并入该协方 差矩阵中。因此只需有限的存储器容量;与现有技术相比,需要更少的存储器。 此外,传感器节点的固定位置和特定任意位置不必相同。该固定位置可均匀分布 于该区域中来选择;而随机分布或任何其他适当的分布形式也是可行的。而且当连续接收 传感器测量数据时,所述固定位置的数量可显著少于特定任意位置的数量,或相应特定任 意位置的数量总和。只要固定位置的数量不变,则该计算机实现的方法就能以〇(n)来计 当前第1页1 2 3 4 本文档来自技高网...
【技术保护点】
一种用于更新反映物理区域(102)中的时空现象的数据结构(117,127)的计算机实现的方法(200),其中通过高斯过程采用平均值函数和协方差函数在所述物理区域(102)的任何位置处对所述时空现象进行估测,所述方法包括:存储(210)适于表示所述物理区域(102)的固定位置(114)的数据集(115),其中根据所述高斯过程,所述数据集(115)具有平均向量和协方差矩阵,且其中所述数据结构(117,127)包括所述平均向量和所述协方差矩阵;从位于所述物理区域(102)的特定任意位置(104,106)处的多个传感器节点中的至少一个传感器节点接收(222,224)时空现象的传感器测量数据(109);以及通过使用准确递归贝叶斯回归将所述特定任意位置(104,106)和所接收到的测量数据(109)合并(230)至所述数据结构(117,127)。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:M·休伯,C·迪贝斯,
申请(专利权)人:AGT国际有限公司,
类型:发明
国别省市:瑞士;CH
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。