【技术实现步骤摘要】
对象的熵聚类
实施例一般地涉及无监督机器学习。更具体地,实施例涉及对象的熵聚类(clustering)。
技术介绍
无监督机器学习可以指标识未标记数据中的结构的机器学习任务。一种类型的无监督学习可以包括聚类分析或聚类。聚类可以指至少部分地基于一个或多个度量以这样的方式对对象集进行分组的任务:相比于其他组/集群中的对象,相同组/集群中的对象彼此更加相似。在数据挖掘领域中,k-均值技术可指用于将数据分组至k个集群的过程。标准k-均值技术可基于数据点之间的欧几里德距离来对数据分组。球面k-均值技术可基于数据点之间的余弦相似度来对数据分组。附图说明通过阅读以下说明书和所附权利要求并通过参考以下附图,实施例的各种优点对于本领域技术人员将变得显而易见,其中:图1是根据实施例的电子处理系统的示例的框图;图2是根据实施例的半导体封装装置的示例的框图;图3A至3B是根据实施例的无监督机器学习的方法的示例的流程图;图4是根据实施例的数据集合的示例的说明图;图5A和5B是根据实施例的对应于图4中的数据集合的相应数据集群的示例的说明性图表示;图6是根据实施例的对应于图5A和5B中的数据集群的经合并的数据集群的示例的说明性图表示。图7是根据实施例的费米-狄拉克(Fermi-Dirac)分布的示例的曲线图;图8是根据实施例的数据对象的熵聚类的方法的示例的流程图;图9A和9B是根据实施例的熵聚类设备的示例的框图;图10是根据实施例的处理 ...
【技术保护点】
1.一种电子处理系统,包括:/n处理器;/n存储器,通信地耦合至所述处理器;以及/n逻辑,通信地耦合至所述处理器,用于:/n基于可配置规则集将来自数据集合的相应属性集映射到对应特性的两个或多个图表示中,以及/n基于图熵信息将所述两个或更多个图表示组织成两个或更多个数据集群。/n
【技术特征摘要】
20180626 US 16/018,1361.一种电子处理系统,包括:
处理器;
存储器,通信地耦合至所述处理器;以及
逻辑,通信地耦合至所述处理器,用于:
基于可配置规则集将来自数据集合的相应属性集映射到对应特性的两个或多个图表示中,以及
基于图熵信息将所述两个或更多个图表示组织成两个或更多个数据集群。
2.如权利要求1所述的系统,其特征在于,所述逻辑进一步用于:
基于所述可配置规则集将所述相应属性集变换为所述两个或更多个图表示,所述图表示具有所述相应属性集的每个数据属性的节点表示以及属于同一属性集的节点之间的连接表示;
随机地选择两个或更多个图表示作为新集群候选;
确定所述新集群候选的每个节点的经合并图熵信息;
确定所述新集群候选的转移概率信息;以及
基于所确定的经合并图熵信息和所确定的转移概率信息来进行保持所述新集群候选或丢弃所述新集群候选中的一者。
3.如权利要求2所述的系统,其特征在于,所述逻辑进一步用于:
确定与所述经合并图熵信息及所述新集群候选的每节点平均图熵信息相对应的差值信息;以及
基于所确定的经合并图熵信息、所确定的转移概率以及所述差值信息来进行保持所述新集群候选或丢弃所述新集群候选中的一者。
4.如权利要求2所述的系统,其特征在于,所述逻辑进一步用于确定是否满足结束条件,并且如果不满足所述结束条件,则用于:
调整一个或多个参数;
随机地选择新的一组两个或更多个图表示作为所述新集群候选;
基于经调整的一个或多个参数来确定所述新集群候选的每个节点的经合并图熵;
基于所述经调整的一个或多个参数来确定所述新集群候选的转移概率;以及
基于所确定的经合并图熵信息和所确定的转移概率来进行保持所述新集群候选或丢弃所述新集群候选中的一者。
5.如权利要求1所述的系统,其特征在于,所述逻辑进一步用于:
将新的可配置规则集应用于所述数据集合;
将来自所述数据集合的所述相应属性集映射到对应特性的新的一组两个或多个图表示中;
将所述新的一组两个或更多个图表示组织成新的一组两个或更多个数据集群;以及
将来自所述两个或更多个数据集群以及来自所述新的一组两个或更多个数据集群的结果进行聚合。
6.如权利要求1至5中任一项所述的系统,其特征在于,所述逻辑进一步用于:
确定新数据集合与所述两个或更多个数据集群中的每一个数据集群之间的每节点经合并图熵。
7.一种半导体封装设备,包括:
一个或多个衬底;以及
逻辑,耦合到所述一个或多个衬底,其中所述逻辑至少部分地在可配置逻辑和固定功能硬件逻辑中的一个或多个中实现,耦合到所述一个或多个衬底的所述逻辑用于:
基于可配置规则集将来自数据集合的相应属性集映射到对应特性的两个或更多个图表示中,以及
基于图熵信息将所述两个或更多个图表示组织成两个或更多个数据集群。
8.如权利要求7所述的设备,其特征在于,所述逻辑进一步用于:
基于所述可配置规则集将所述相应属性集变换为所述两个或更多个图表示,所述图表示具有所述相应属性集的每个数据属性的节点表示以及属于同一属性集的节点之间的连接表示;
随机地选择两个或更多个图表示作为新集群候选;
确定所述新集群候选的每个节点的经合并图熵信息;
确定所述新集群候选的转移概率信息;以及
基于所确定的经合并图熵信息和所确定的转移概率信息来进行保持所述新集群候选或丢弃所述新集群候选中的一者。
9.如权利要求8所述的设备,其特征在于,所述逻辑进一步用于:
确定与所述经合并图熵信息以及所述新集群候选的每节点平均图熵信息相对应的差值信息;以及
基于所确定的经合并图熵信息、所确定的转移概率以及所述差值信息来进行保持所述新集群候选或丢弃所述新集群候选中的一者。
10.如权利要求8所述的设备,其特征在于,所述逻辑进一步用于确定是否满足结束条件,并且如果不满足所述结束条件,则用于:
调整一个或多个参数;
随机地选择新的一组两个或更多个图表示作为所述新集群候选;
基于经调整的一个或多个参数来确定所述新集群候选的每个节点的经合并图熵;
基于所述经调整的一个或多个参数来确定所述新集群候选的转移概率;以及
基于所确定的经合并图熵信息和所确定的转移概率来进行保持所述新集群候选或丢弃所述新集群候选中的一者。
11.如权利要求7所述的设备,其特征在于,所述逻辑进一步用于:
将新的可配置规则集应用于所述数据集合;
将来自所述数据集合的所述相应属性集映射到对应特性的新的一组两个或多个图表示中;
将所述新的一组两个或更多个图表示组织成新的一组两个或更多个数据集群;以及
将来自所述两个或更多个数据集群以及来自所述新的一组两个或更多个数据集群的结果进行聚合。
12.如权利要求7至11中任一项所述的设备,其特征在于,所述逻辑进一步用于:
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。