确定用于控制环境的因果模型制造技术

技术编号:30531243 阅读:28 留言:0更新日期:2021-10-30 12:32
本发明专利技术提供了用于确定用于控制环境的因果模型的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。这些方法中的一者包括识别程序实例;为程序实例选择控制设置,包括针对可控元件中的特定一个可控元件:根据特定可控元件的一组聚类参数的当前值,将程序实例分配给特定可控元件的集群;以及基于特定于集群的因果模型来选择用于程序实例的特定可控元件的设置;获取对所选择的控制设置的环境响应,该环境响应限定程序实例的性能度量的值;以及针对特定可控元件,基于性能度量的值更新程序实例被分配给的可控元件的集群的因果模型。果模型。果模型。

【技术实现步骤摘要】
【国外来华专利技术】确定用于控制环境的因果模型

技术介绍

[0001]本说明书涉及控制环境,并且涉及确定用于控制环境的控制设置和从环境接收的环境响应之间的因果关系。
[0002]用于确定应使用哪些控制设置来控制环境的现有技术通常采用基于建模的技术或依靠系统的主动控制。
[0003]在基于建模的技术中,系统被动地观察数据,即,控制设置到环境响应的历史映射,并且尝试发现数据中的模式以学习可用于控制环境的模型。基于建模的技术的示例包括决策森林、逻辑回归、支持向量机、神经网络、内核机和贝叶斯分类器。
[0004]在主动控制技术中,系统依靠对环境的主动控制来进行知识生成和应用。主动控制技术的示例包括随机化受控实验,例如班迪特实验。

技术实现思路

[0005]本说明书描述了用于控制环境的方法和系统。在一个方面,方法包括识别程序实例,其中程序实例是要向其应用控制设置的环境的区段;为所述程序实例选择控制设置,包括针对所述可控元件中的特定一个可控元件:根据所述特定可控元件的一组聚类参数的当前值,将所述程序实例分配给所述特定可控元件的集群;以及基于特定于所述集群的因果模型来选择用于所述程序实例的所述特定可控元件的设置,其中所述因果模型识别用于所述集群中的程序实例的所述特定可控元件的可能设置与测量所述控制系统在控制所述环境中的性能的性能度量之间的因果关系;获取对所选择的控制设置的环境响应,所述环境响应限定所述程序实例的所述性能度量的值;以及针对特定可控元件,基于性能度量的值更新程序实例被分配给的可控元件的集群的因果模型。
[0006]本说明书中所述的主题的具体实施例可被实施为实现下述优点中的一者或多者。
[0007]本说明书中所述的控制系统能够以解决常规方法的许多当前限制的方式自动生成具有受控实验精度的因果知识(以因果模型的形式),特别是当应用于动态系统时。所述技术实现了对因果的实时了解和量化,同时提供了全自动操作控制和无缝集成的多目标优化。这种架构的突现行为是合理的、稳健的和可扩展的,并且提供适用于复杂且关键的现实世界系统的速度惊人的学习和优化,即使那些系统受到变量之间关系的快速变化的方向、量值和空间

时间范围的影响也是如此,无论那些变量是否处于系统控制下。因此,与常规技术相比,所述系统可更有效地控制环境,即,根据性能度量实现更好的系统性能,同时使用更少的计算资源和更少的数据。此外,系统可更快地对变量之间关系的变化作出响应,从而减少环境受到次优控制的时间量,进而减轻与选择次优设置相关的负面后果。此外,系统可在选择在可接受范围或历史范围内的控制设置的同时实现这一点,从而确保系统不偏离控制设置的安全范围。
[0008]特别地,所述技术将系统的一些或所有内部参数置于递归实验控制下,即,在系统操作期间调整内部参数的值,从而不断调整程序实例的特性以自校正任何错误的假设或先验偏差,并且相对于性能度量、约束和因果知识的精度与粒度动态优化控制决策。这产生了
以下技术,这些技术对统计分布的所有特性具有稳健性并且在探索和利用搜索空间(包括空间

时间效应)方面在认知上有效,从而基于无偏差测量结果自动调整所获取数据的采样和使用以进行实时决策支持,这些无偏差测量结果是对变量之间关系跨空间和时间变化的程度并因此对该数据表示世界的当前状态的程度的测量结果。作为特定示例,系统可通过监测当前系统性能和基线系统性能(即,当使用可能控制设置上的基线概率分布来控制环境时系统的性能)之间的差异来重复调整内部参数中的一个或多个内部参数的值。系统可使用这种差异的变化和内部参数的不同可能值之间对这种差异的相对影响来确保内部参数具有确保整个操作过程中的有效系统性能的值,即使在环境变化和先前收集的数据的特性变得不太相关时也是如此。如又一个具体示例,系统可重复且自动地调整当前用于测试不同聚类分配的聚类方案,以便识别最有可能导致最佳系统性能的那些方案。
[0009]换句话讲,与常规系统不同,所述控制系统可非常快速地调整以适应不同控制设置之间的相对因果效应的变化。另外,所述系统不需要任何特定控制设置的有效性的先验知识,并且事实上,可调整作为基线提供给系统的不正确的先验知识。即,当环境的特性变化时,系统可检测到变化并调整内部参数以使变化对系统对环境的控制的有效性的影响最小化。
[0010]在附图和下文的说明中将示出本说明书中所述的主题的一个或多个实施例的细节。本专利技术主题的其它特征、方面、和优点将从说明、附图、和权利要求中变得显而易见。
附图说明
[0011]图1A示出了选择应用于环境的控制设置的控制系统。
[0012]图1B示出了来自示例性因果模型的数据。
[0013]图2是用于控制环境的示例性过程的流程图。
[0014]图3是用于执行环境控制的迭代的示例性过程的流程图。
[0015]图4A是用于确定程序实例的示例性过程的流程图。
[0016]图4B示出了包括各自与空间范围相关联的多个物理实体的环境的示例。
[0017]图5是用于针对一组当前实例选择控制设置的示例性过程的流程图。
[0018]图6是用于针对给定可控元件和给定类型的环境响应更新因果模型的示例性过程的流程图。
[0019]图7是用于针对给定可控元件对一组程序实例进行聚类的示例性过程的流程图。
[0020]图8是用于使用随机变化更新一组内部参数的示例性过程的流程图。
[0021]图9是用于基于启发法针对给定可控元件更新数据包含值的值的示例性过程的流程图。
[0022]图10是用于对环境的一个或多个特性的变化作出响应的示例性过程的流程图。
[0023]图11示出了当限定数据包含的一组内部参数随机变化时环境的给定可控元件的数据包含窗口的表示。
[0024]图12示出了所述系统在控制环境时的性能相对于使用现有控制方案控制相同环境的系统的性能。
[0025]图13示出了所述系统的性能相对于多个其它系统在控制多个不同环境时的性能。
[0026]图14示出了所述系统的性能相对于多个其它系统在控制具有不同时间效应的多
个不同环境时的性能。
[0027]图15示出了所述系统在聚类和不聚类情况下的性能。
[0028]图16示出了所述系统有能力改变数据包含的性能相对于所述系统在保持数据包含窗口参数固定的同时控制相同环境的性能。
[0029]图17示出了所述系统在进行和不进行时间分析(即,有能力和没有能力改变时间范围)的情况下的性能。
[0030]图18示出了所述系统在控制环境时的性能相对于使用现有控制方案控制相同环境的系统的性能。
[0031]在各个图中,类似的参考标号和名称表示类似的元件。
具体实施方式
[0032]本说明书大体描述了一种随着环境改变状态而控制环境的控制系统。特别地,系统控制环境以便确定环境的控制设置和对控制设置的环境响应之间的因果关系。
[0033]例如,正在针对其确定因果关系的环本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种通过选择控制设置来控制环境的方法,所述控制设置包括用于所述环境的多个可控元件中的每个可控元件的相应设置,所述方法包括重复执行以下操作:识别程序实例,其中所述程序实例是要向其应用控制设置的环境的区段;为所述程序实例选择控制设置,包括针对所述可控元件中的特定一个可控元件:根据所述特定可控元件的一组聚类参数的当前值,将所述程序实例分配给所述特定可控元件的集群;以及基于特定于所述集群的因果模型来选择用于所述程序实例的所述特定可控元件的设置,其中所述因果模型识别用于所述集群中的程序实例的所述特定可控元件的可能设置与测量所述控制系统在控制所述环境中的性能的性能度量之间的因果关系;获取对所选择的控制设置的环境响应,所述环境响应限定所述程序实例的所述性能度量的值;以及针对所述特定可控元件,基于所述性能度量的值更新所述程序实例被分配给的所述可控元件的所述集群的所述因果模型。2.根据任一前述权利要求所述的方法,其中所述聚类参数限定用于将所述程序实例分配给集群的聚类技术的一个或多个超参数。3.根据权利要求2所述的方法,其中所述特定可控元件与数据包含窗口相关联,所述数据包含窗口限定所述聚类技术考虑了多少个先前的程序实例,并且其中所述方法还包括:基于所述一组聚类参数的当前值,确定所述一个或多个超参数中的每个超参数的当前值;基于所述一个或多个超参数中的每个超参数的当前值,将所述数据包含窗口内的所述先前程序实例聚类成多个集群,以及针对所述多个集群中的每个集群,从被集群成所述集群的所述先前程序实例和所述先前程序实例的所述环境响应生成特定于所述集群的因果模型。4.根据权利要求3所述的方法,其中所述聚类技术基于所述程序实...

【专利技术属性】
技术研发人员:海曼舒
申请(专利权)人:三M创新有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1