A system for feature selection for formal concept analysis (FCA) is described. A group of data points with features are divided into object classes. For each object class, the Gauss function is used to convolution the data points to obtain the class distribution curves for each known object class. For each class distribution curve, the two element array is generated. The two element array has one on the interval of the class distribution curve relative to all other class distribution curves, and the other one has zero. For each class, two of the two generation of metaclass curve, which indicates the metaclass curve interval, properties of the known object class more than all other known object class. The interval on the predetermined confidence threshold is sorted. The sorting of the described interval is used to select which features from a set of data points in the FCA lattice construction.
【技术实现步骤摘要】
【国外来华专利技术】用于形式概念分析(FCA)的PARZEN窗特征选择算法政府许可权本专利技术在美国政府合同编号FA8650-13-C7356下由政府支持作出。该政府在本专利技术中具有特定权利。相关申请的交叉引用这是2015年7月23日在美国提交的名为“AGeneralFormalConceptAnalysis(FCA)FrameworkforClassification”的美国非临时申请No.14/807,083的部分继续申请,其全部内容通过引用而并入于此。这也是2015年7月23日在美国提交的名为“AParzenWindowFeatureSelectionAlgorithmforFormalConceptAnalysis(FCA)”的美国临时申请No.62/195,876的非临时专利申请,其全部内容通过引用而并入于此。
本专利技术涉及用于针对形式概念分析(FCA)的特征提取的系统,并且更特别地,涉及用于使用Parzen窗针对FCA的特征提取的系统。
技术介绍
许多形式的信息可以被描述为一组对象,每个对象具有一组属性和/或值。在这些情况下,任何分层结构仍然是隐含的。通常来说,这组对象可以与两个或更多个完全不同的属性域和/或值域相关。形式概念分析(FCA)是推导关于一组对象的偏序的原则性方法,每个对象由一组属性定义。这是数据和知识处理方面的技术,其在数据可视化、数据挖掘、信息检索、以及知识管理方面具有应用(参见并入的参考文献列表,参考文献No.2)。组织数据的原理是由对象属性之间的包含关系引起的偏序。另外,FCA容许从结构化数据的规则挖掘。FCA被广泛应用于数据分析。FCA依 ...
【技术保护点】
一种用于针对形式概念分析FCA的特征选择的系统,所述系统包括:一个或更多个处理器,所述一个或更多个处理器具有其上编码有可执行指令的关联存储器,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:将具有特征的一组数据点分成一组已知对象类;针对每个已知对象类,利用高斯函数对所述数据点进行卷积,得到针对每个已知对象类的类分布曲线;针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间;关于预定置信度阈值对所述区间排序;利用所述区间的所述排序,在FCA点阵构造中选择从所述一组数据点提取哪些特征;以及从所述一组数据点提取所选特征。
【技术特征摘要】
【国外来华专利技术】2015.07.23 US 14/807,083;2015.07.23 US 62/195,8761.一种用于针对形式概念分析FCA的特征选择的系统,所述系统包括:一个或更多个处理器,所述一个或更多个处理器具有其上编码有可执行指令的关联存储器,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:将具有特征的一组数据点分成一组已知对象类;针对每个已知对象类,利用高斯函数对所述数据点进行卷积,得到针对每个已知对象类的类分布曲线;针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间;关于预定置信度阈值对所述区间排序;利用所述区间的所述排序,在FCA点阵构造中选择从所述一组数据点提取哪些特征;以及从所述一组数据点提取所选特征。2.根据权利要求1所述的系统,其中,所选特征被用于解释神经数据。3.根据权利要求2所述的系统,其中,所选特征被应用至功能性磁共振成像fMRI反应,以对人的思维过程进行分类。4.根据权利要求1所述的系统,其中,所述一个或更多个处理器还执行生成包括一和零的二元阵列的操作,所述二元阵列在所述类分布曲线最大的数据的区间上具有一,而在其它区间上具有零。5.根据权利要求4所述的系统,其中,针对每个已知对象类,生成二元类曲线,所述二元类曲线指示对于哪个区间,所述已知对象类的性能超过所有其它已知对象类。6.根据权利要求1所述的系统,其中,所述一组数据点包括来自神经传感器的数据。7.根据权利要求1所述的系统,其中,所述预定置信度阈值被用于消除具有低置信度值的区间。8.根据权利要求1所述的系统,其中,通过取得沿着每个区间的每个类分布曲线下面的面积与沿着每个区间的所有其它类分布曲线下面的面积的总和的比率来确定所述区间的所述排序。9.一种用于针对形式概念分析FCA的特征选择的计算机实现方法,所述方法包括以下步骤:使一个或更多个处理器执行存储在非暂时性存储器上的指令的动作,使得在执行时,所述一个或更多个处理器执行以下操作:将具有特征的一组数据点分成一组已知对象类;针对每个已知对象类,利用高斯函数对所述数据点进行卷积,得到针对每个已知对象类的类分布曲线;针对每个类分布曲线,识别所述类分布曲线相对于所有其它类分布曲线最大的数据值的区间;...
【专利技术属性】
技术研发人员:M·J·奥布莱恩,倪康宇,J·本韦努托,R·巴特查里亚,
申请(专利权)人:赫尔实验室有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。