用于形式概念分析(FCA)的PARZEN窗特征选择算法制造技术

技术编号:17310193 阅读:29 留言:0更新日期:2018-02-19 10:05
描述了一种用于针对形式概念分析(FCA)的特征选择的系统。将具有特征的一组数据点分成对象类。针对每个对象类,利用高斯函数对所述数据点进行卷积,从而获得针对每个已知对象类的类分布曲线。针对每个类分布曲线,生成二元阵列,二元阵列在所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间上具有一,而其它区间上具有零。针对每个对象类,生成二元类曲线,该二元类曲线指示对于哪个区间,所述已知对象类的性能超过所有其它已知对象类。所述区间关于预定置信度阈值被排序。所述区间的排序被用于在FCA点阵构造中选择从一组数据点中提取哪些特征。

PARZEN window feature selection algorithm for formal concept analysis (FCA)

A system for feature selection for formal concept analysis (FCA) is described. A group of data points with features are divided into object classes. For each object class, the Gauss function is used to convolution the data points to obtain the class distribution curves for each known object class. For each class distribution curve, the two element array is generated. The two element array has one on the interval of the class distribution curve relative to all other class distribution curves, and the other one has zero. For each class, two of the two generation of metaclass curve, which indicates the metaclass curve interval, properties of the known object class more than all other known object class. The interval on the predetermined confidence threshold is sorted. The sorting of the described interval is used to select which features from a set of data points in the FCA lattice construction.

【技术实现步骤摘要】
【国外来华专利技术】用于形式概念分析(FCA)的PARZEN窗特征选择算法政府许可权本专利技术在美国政府合同编号FA8650-13-C7356下由政府支持作出。该政府在本专利技术中具有特定权利。相关申请的交叉引用这是2015年7月23日在美国提交的名为“AGeneralFormalConceptAnalysis(FCA)FrameworkforClassification”的美国非临时申请No.14/807,083的部分继续申请,其全部内容通过引用而并入于此。这也是2015年7月23日在美国提交的名为“AParzenWindowFeatureSelectionAlgorithmforFormalConceptAnalysis(FCA)”的美国临时申请No.62/195,876的非临时专利申请,其全部内容通过引用而并入于此。
本专利技术涉及用于针对形式概念分析(FCA)的特征提取的系统,并且更特别地,涉及用于使用Parzen窗针对FCA的特征提取的系统。
技术介绍
许多形式的信息可以被描述为一组对象,每个对象具有一组属性和/或值。在这些情况下,任何分层结构仍然是隐含的。通常来说,这组对象可以与两个或更多个完全不同的属性域和/或值域相关。形式概念分析(FCA)是推导关于一组对象的偏序的原则性方法,每个对象由一组属性定义。这是数据和知识处理方面的技术,其在数据可视化、数据挖掘、信息检索、以及知识管理方面具有应用(参见并入的参考文献列表,参考文献No.2)。组织数据的原理是由对象属性之间的包含关系引起的偏序。另外,FCA容许从结构化数据的规则挖掘。FCA被广泛应用于数据分析。FCA依靠二元特征,以便构建点阵。存在用于将标量数据转换为二元化格式的技术,但是它们往往导致产生要在点阵构造中有效地使用太多属性。关于标量数据的特征选择通常通过缩放或创建统一箱(bin)来完成。从FCA中的标量数据中选择特征的现有方法存在盲选策略,其产生太多并且通常没有用的特征。由于基于特征的点阵构造所需的指数增加计算时间,这是有问题的。因此,仍然需要将FCA中的特征数量减少到最有用,以允许在不削弱FCA的能力的情况下构建更小点阵。
技术实现思路
本专利技术涉及用于针对形式概念分析(FCA)的特征提取的系统,并且更特别地,涉及用于利用Parzen窗针对FCA的特征提取的系统。所述系统包括一个或更多个处理器和其上编码有可执行指令的非暂时性计算机可读介质,使得当执行该可执行指令时,所述一个或更多个处理器执行多个操作。所述系统将具有特征的一组数据点分成一组已知对象类。针对每个已知对象类,利用高斯函数对所述数据点进行卷积,从而获得针对每个已知对象类的类分布曲线。针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间。所述区间关于预定置信度阈值被排序。所述区间的排序被用于在FCA点阵构造中选择从所述一组数据点中提取哪些特征,并且从所述一组数据点中提取所选特征。在另一方面,所选特征被用于解释神经数据。在另一方面,所选特征被应用至功能性磁共振成像(fMRI)反应,以对人的思维过程分类。在另一方面,所述系统生成包括一和零的二元阵列,所述二元阵列在所述类分布曲线最大的数据的区间上具有一,而在其它区间上具有零。在另一方面,针对每个已知对象类,生成二元类曲线,该二元类曲线指示对于哪个区间,已知对象类的性能超过所有其它已知对象类。在另一方面,所述一组数据点包括来自神经传感器的数据。在另一方面,所述预定置信度阈值被用于消除具有低置信度值的区间。在另一方面,通过取得在沿着每个区间的每个类分布曲线下面的面积与沿着每个区间的所有其它类分布曲线下面的面积的总和的比率来确定所述区间的排序。在另一方面,本专利技术还包括一种用于使处理器执行本文所述操作的方法。最后,在又一方面,本专利技术还包括一种计算机程序产品,该计算机程序产品包括:存储在非暂时性计算机可读介质上的计算机可读指令,该计算机可读指令可通过具有处理器的计算机执行,以使所述处理器执行本文所述操作。附图说明本专利的文件或专利申请公开出版物包含所执行的至少一个彩色附图。具有彩色附图的该专利的副本或专利申请公开出版物在请求并支付必需费用时由专利局提供。根据下面结合参照附图对本专利技术的各个方面的详细描述,本专利技术的目的、特征以及优点将更清楚,其中:图1是示出根据本专利技术的实施方式的用于针对形式概念分析(FCA)的特征提取的系统的组件的框图;图2是根据本专利技术的实施方式的计算机程序产品的示图;图3是根据本专利技术的实施方式的第一背景(context)表的示图:图4A是根据本专利技术的实施方式的第二背景表的示图:图4B是根据本专利技术的实施方式的由第二背景表中的数据得到的点阵的示图;图5是根据本专利技术的实施方式的针对FCA的特征提取的处理流程的示图:图6是根据本专利技术的实施方式的与Parzen窗相比使用统一箱的高分类标准所需的点阵节点数的增长的示图;图7是根据本专利技术的实施方式的与Parzen窗相比使用统一箱的高分类标准所需的点阵边缘数的增长的示图;图8是根据本专利技术的实施方式的作为阈值和Parzen窗尺寸σ的函数的分类准确度的示图;图9是根据本专利技术的实施方式的作为阈值和Parzen窗尺寸σ的函数构建的点阵节点数的示图;图10A是根据本专利技术的实施方式的类分布曲线的示图;图10B是根据本专利技术的实施方式的针对每个对象类的单独二元类曲线的示图;图11是根据本专利技术的实施方式的类分布曲线的置信度值的示图;以及图12是根据本专利技术的实施方式的记录神经反应和神经反应的FCA分类的示图。具体实施方式本专利技术涉及用于针对形式概念分析(FCA)的特征提取的系统,并且更特别地,涉及用于利用Parzen窗针对FCA的特征提取的系统。呈现以下描述以使本领域普通技术人员能够制造和使用本专利技术并将其并入特定应用的背景中。所讨论的应用是用于通过利用本专利技术中的特征提取方法构建点阵来使用FCA分析响应于不同刺激的大脑活动。各种修改例以及不同应用方面的多种用途对于本领域技术人员来说是显而易见的,并且本文定义的一般原理可以被应用于广泛方面。因此,本专利技术不旨在限于所呈现的方面,而是符合与本文所公开原理和新颖特征相一致的最广泛范围。在下面的详细描述中,阐述了许多具体细节,以便提供对本专利技术的更彻底理解。然而,本领域技术人员应当明白,本专利技术可以在不必受限于这些具体细节的情况下来实践。在其它情况下,公知结构和设备以框图形式而不是详细地被示出,以避免模糊本专利技术。读者的注意力放在与本说明书同时提交的所有文件和文档,并且该文件和文档可以通过本说明书开放以供公众查阅,所有这些文件和文档的内容通过引用并入于此。本说明书中公开的所有功能(包括任何所附权利要求、摘要、以及附图)可以用服务于相同、等同或相似目的的另选特征来代替,除非另外加以明确规定。因此,除非另外加以明确规定,所公开的每个特征仅是通用系列的等同或相似特征中的一个示例。而且,权利要求书中没有明确陈述用于执行指定功能的“装置”或用于执行特定功能的“步骤”的任何元素不被解释为如在35U.S.C.第112章第6段中指定的“装置”或“步骤”条款。特别地,在本文的权利要求中使用“……的步骤”或“……的动作”不旨在援引35U.S.C.112第6段的规定。请注意,若使用的话,标记左、本文档来自技高网
...
用于形式概念分析(FCA)的PARZEN窗特征选择算法

【技术保护点】
一种用于针对形式概念分析FCA的特征选择的系统,所述系统包括:一个或更多个处理器,所述一个或更多个处理器具有其上编码有可执行指令的关联存储器,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:将具有特征的一组数据点分成一组已知对象类;针对每个已知对象类,利用高斯函数对所述数据点进行卷积,得到针对每个已知对象类的类分布曲线;针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间;关于预定置信度阈值对所述区间排序;利用所述区间的所述排序,在FCA点阵构造中选择从所述一组数据点提取哪些特征;以及从所述一组数据点提取所选特征。

【技术特征摘要】
【国外来华专利技术】2015.07.23 US 14/807,083;2015.07.23 US 62/195,8761.一种用于针对形式概念分析FCA的特征选择的系统,所述系统包括:一个或更多个处理器,所述一个或更多个处理器具有其上编码有可执行指令的关联存储器,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:将具有特征的一组数据点分成一组已知对象类;针对每个已知对象类,利用高斯函数对所述数据点进行卷积,得到针对每个已知对象类的类分布曲线;针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间;关于预定置信度阈值对所述区间排序;利用所述区间的所述排序,在FCA点阵构造中选择从所述一组数据点提取哪些特征;以及从所述一组数据点提取所选特征。2.根据权利要求1所述的系统,其中,所选特征被用于解释神经数据。3.根据权利要求2所述的系统,其中,所选特征被应用至功能性磁共振成像fMRI反应,以对人的思维过程进行分类。4.根据权利要求1所述的系统,其中,所述一个或更多个处理器还执行生成包括一和零的二元阵列的操作,所述二元阵列在所述类分布曲线最大的数据的区间上具有一,而在其它区间上具有零。5.根据权利要求4所述的系统,其中,针对每个已知对象类,生成二元类曲线,所述二元类曲线指示对于哪个区间,所述已知对象类的性能超过所有其它已知对象类。6.根据权利要求1所述的系统,其中,所述一组数据点包括来自神经传感器的数据。7.根据权利要求1所述的系统,其中,所述预定置信度阈值被用于消除具有低置信度值的区间。8.根据权利要求1所述的系统,其中,通过取得沿着每个区间的每个类分布曲线下面的面积与沿着每个区间的所有其它类分布曲线下面的面积的总和的比率来确定所述区间的所述排序。9.一种用于针对形式概念分析FCA的特征选择的计算机实现方法,所述方法包括以下步骤:使一个或更多个处理器执行存储在非暂时性存储器上的指令的动作,使得在执行时,所述一个或更多个处理器执行以下操作:将具有特征的一组数据点分成一组已知对象类;针对每个已知对象类,利用高斯函数对所述数据点进行卷积,得到针对每个已知对象类的类分布曲线;针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间;...

【专利技术属性】
技术研发人员:M·J·奥布莱恩倪康宇J·本韦努托R·巴特查里亚
申请(专利权)人:赫尔实验室有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1