【技术实现步骤摘要】
神经过程的贝叶斯上下文聚合
[0001]本公开涉及用于为技术设备产生计算机实现的机器学习系统的计算机实现的方法。
技术介绍
[0002]用于从测量数据中推导出变量之间的定量关系的强大的计算机实现的模型的开发在工程的所有分支中都至关重要。就此而言,基于高斯过程的计算机实现的神经网络和方法越来越多地被用在各种技术环境中。神经网络可以很好地胜任大量训练数据组,并且在训练时在计算上是高效的。缺点是,所述神经网络不提供关于其预测的不确定性的估计,并且此外在小的数据组时可能倾向于过度拟合。此外,可能得出以下问题,神经网络应该为了其成功的应用强烈地被结构化,并且所述神经网络的大小可能自应用的一定复杂性起快速地增加。这可能对为了应用神经网络所需要的硬件提出过高要求。高斯过程可以被看作与神经网络互补,因为所述高斯过程可以提供不确定性的可靠估计,但是所述高斯过程的例如二次或三次缩放在训练时间期间随着上下文数据的数量可能在具有大量数据的任务方面或在典型硬件上的高维问题方面强烈限制应用。
[0003]为了解决上面提及的问题,已经开发了与所谓的神经过程相关的方法。这些神经过程可以组合神经网络和高斯过程的优点。最后,所述神经过程提供在复数个函数(而不是单个函数)上的分布并且表示多任务学习(“multi
‑
task learning”)方法(即该方法同时在多个任务上被训练)。此外,这些方法通常基于条件潜在变量模型(“conditional latent variable(CLV)models),其中使用潜在变量来考虑全局 ...
【技术保护点】
【技术特征摘要】
1.一种用于产生计算机实现的机器学习系统的计算机实现的方法,其中所述方法包括以下步骤:接收反映设备的动态行为的训练数据组(x
c
,y
c
);在使用贝叶斯推理的情况下并且在考虑所述训练数据组(x
c
,y
c
)的情况下计算所述机器学习系统的至少一个潜在变量()的聚合,其中在所述训练数据组中包含的信息直接被转移到多个潜在变量()的统计描述中;产生后验预测分布()来在使用所计算的聚合的情况下并且在所述训练数据组(x
c
,y
c
)发生了的条件下预测所述设备的动态行为。2.根据权利要求1所述的计算机实现的方法,此外包括使用所产生的后验预测分布来关于所述设备的动态行为根据输入参量预测相对应的输出参量。3.根据权利要求1或2所述的计算机实现的方法,其中所述训练数据组(x
c
,y
c
)包括第一多个数据点(x
c
)和第二多个数据点(y
c
),其中所述方法包括在使用来自一般给定函数族的给定函数子集(F)的情况下计算所述第二多个数据点(y
c
),其中所述给定函数子集在所述第一多个数据点上被计算;并且其中计算聚合包括以下步骤:通过第一神经网络将来自所述训练数据组(x
c
,y
c
)的第一(x
c
)多个数据点和第二(y
c
)多个数据点的每一对映射到相对应的潜在观测()上并且通过第二神经网络映射到相对应的潜在观测()的不确定性()上;在所述多个潜在观测()发生了的条件下,聚合所述多个潜在变量()的贝叶斯后验分布(),其中在使用贝叶斯推理的情况下执行所述聚合,由此在所述训练数据组(x
c
,y
c
)中包含的信息被直接转移到所述多个潜在变量的统计描述中;计算所述多个潜在观测()和多个其不确定性()。4.根据权利要求3所述的计算机实现的方法,其中聚合贝叶斯后验分布()包括实现多个因式分解高斯分布,并且其中所述不确定性()是相对应高斯分布的方差。5.根据权利要求4所述的计算机实现的方法,其中产生后验预测分布()包括以下其他步骤:在所述训练数据组(x
c
,y
c
)发生了的条件下,为多个潜在变量()产生第二近似后验分布(),其中所述第二近似后验分布此外通过参数组()描述,所述参数组经由对于所述训练数据组(x
c
,y
c
)共同的参数()被参数化;基于所计算的多个潜在观测()和所计算的多个其不确定性()迭代地计算所述参数组。6.根据权利要求5所述的计算机实现的方法,其中迭代地计算所述参数组包括关于所述潜在变量()实现另一多个因式分解高斯分布,并且其中所述参数组包括所述高斯分布的多个平均值()和方差()对应于高斯分布。7.根据权利要求5或6所述的计算机实现的方法,此外包含接...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。