数据特征选择的评价方法及装置制造方法及图纸

技术编号:14412449 阅读:146 留言:0更新日期:2017-01-12 00:25
本发明专利技术公开了一种数据特征选择的评价方法及装置,涉及数据挖掘技术领域,主要目的在于解决在进行网络安全信息数据挖掘时,无法确保特征选择是否正确及最优的问题,包括:获取待评价特征选择的数据矩阵;根据不同属性特征类型对所述数据矩阵进行分类;为数据矩阵中的数值配置与所述类型对应的权值系数;通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。主要用于数据特征选取的评价。

【技术实现步骤摘要】

本专利技术涉及一种数据挖掘
,特别是涉及一种数据特征选择的评价方法及装置
技术介绍
网络信息安全是指网络系统的硬件、软件及其系统中的数据能够得到保护,不受偶然的或者恶意的原因而遭到破坏、更改、泄露,使得网络能够系统连续地、可靠地、正常地运行。为了分析网络信息是否安全,可以通过对网络中产生的大数据进行数据挖掘,从而提取出用户需求的数据信息,然而,特征选择是数据挖掘重要的预处理步骤。目前,现有的特征选择是从高维属性矩阵中选取少量的属性,作为数据挖掘的输入属性,但是,将计算得到的数据的特征直接作为数据挖掘的输入进行处理,无法确保特征选择是否正确及最优,从而导致数据挖掘的效率较低。
技术实现思路
有鉴于此,本专利技术提供一种数据特征选择的评价方法及装置,主要目的在于解决在进行网络安全信息数据挖掘时,无法确保特征选择是否正确及最优的问题。依据本专利技术一个方面,提供了一种数据特征选择的评价方法,包括:获取待评价特征选择的数据矩阵;根据不同属性特征类型对所述数据矩阵进行分类;为数据矩阵中的数值配置与所述类型对应的权值系数;通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。依据本专利技术一个方面,提供了一种数据特征选择的评价装置,包括:获取单元,用于获取待评价特征选择的数据矩阵;分类单元,用于根据不同属性特征类型对所述数据矩阵进行分类;配置单元,用于为数据矩阵中的数值配置与所述类型对应的权值系数;计算单元,用于通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术施例提供一种数据特征选择的评价方法及装置,首先获取待评价特征选择的数据矩阵,然后根据不同属性特征类型对所述数据矩阵进行分类,再为数据矩阵中的数值配置与所述类型对应的权值系数,最后通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。本专利技术实施例通过对特征选择得到数据进行数据处理后得到特征选择的评价值,实现对特征选择结果的评价,便于对特征选择结果做出处理,从而提高数据特征选择的评价效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例一提供的一种数据特征选择的评价方法的示意图;图2示出了本专利技术实施例二提供的另一种数据特征选择的评价方法的示意图;图3示出了本专利技术实施例三提供的一种数据特征选择的评价装置的结构示意图;图4示出了本专利技术实施例四提供的一种数据特征选择的评价装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供一种数据特征选择的评价方法,如图1所示,所述方法包括:101、获取待评价特征选择的数据矩阵。其中,所述数据矩阵为包含属性特征的数据矩阵,且每个数据矩阵的行数和列数均相同。需要说明的是,数据矩阵可以存储在一个预置位置中,在需要计算时,利用不同执行计算的软件的程序获取到多个数据矩阵。例如,当使用matlab软件进行计算时,若数据存储在excel文件中,则在matlab平台中输入调用excel文件的程序,获取矩阵a。102、根据不同属性特征类型对所述数据矩阵进行分类。其中,所述不同属性特征类型可以包括网络安全信息中的所有数据属性类型,本专利技术实施例不做具体限定。例如,属性特征类型包括安全类型和危险类型,分类后得到安全类型包含矩阵a,或者危险类型包括矩阵b。103、为数据矩阵中的数值配置与所述类型对应的权值系数。其中,所述对应的权值系数为不同类型矩阵的权值系数不同,所述权值系数可以为不同数列的排列组合,也可以为不同的概率分布,还可以为利用模型训练出的最优权值,本专利技术实施例不做具体限定。例如,安全类型的矩阵A,矩阵中数值配置的权值系数可以为RL模型训练后的权值系数。104、通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。其中,所述评价值为一个数值,一般为正值,数值越大,代表特征选择的效率越好,评价值用于分析特征选择的优劣,以便用户进行进一步的数据挖掘。本专利技术施例提供一种数据特征选择的评价方法,首先获取待评价特征选择的数据矩阵,然后根据不同属性特征类型对所述数据矩阵进行分类,再为数据矩阵中的数值配置与所述类型对应的权值系数,最后通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。本专利技术实施例通过对特征选择得到数据进行数据处理后得到特征选择的评价值,实现对特征选择结果的评价,便于对特征选择结果做出处理,从而提高数据特征选择的评价效率。本专利技术实施例提供另一种数据特征选择的评价方法,如图2所示,所述方法包括:201、将待评价特征选择的数据矩阵配置为行列数量相同的数据矩阵。其中,所述行列数量相同为相同个数的行和相同个数的列,通过将待评价特征选择的数据矩阵配置为行列数量相同的数据矩阵,以便进行矩阵中行与列的乘积,从而提高数据特征选择的评价效率。202、获取待评价特征选择的数据矩阵。本步骤与图1所述步骤101所述的方法相同,这里不再赘述。203、根据不同属性特征类型对所述数据矩阵进行分类。其中,所述属性特征类型包括用户类型、安全类型、危险类型。204a、若属性特征类型为用户类型,则为所述数据矩阵中的数值配置的权值系数符合二项分布。其中,所述二项分布为概率意义上的二项分布,具体为0-1分布,所述用户类型为用户进行标注过的属性,可以包括用户的需求属性,本专利技术实施例不做具体限定。例如,为用户类型,则将矩阵中的数据配置为1*a1,0*a2,1*a3等。对于本专利技术实施例,与步骤204a并列的步骤204b、若属性特征类型为安全类型,则为所述数据矩阵中的数值配置的权值系数符合正态分布。其中,所述正态分布为概率意义上的正态分布,具体的数值可以选取矩阵中数值最大的最为正太分布中的最大值,以此向两边递减。对于本专利技术实施例,与步骤204a并列的步骤204c、若属性特征类型为危险类型,则为所述数据矩阵中的数值配置的权值系数符合指数分布。其中,所述指数分布为概率意义上的指数分布,当危险类型矩阵中的数值越大是说明危险系数越大,配置的指数权值越大。205、通过预置的行与列的乘积算法计算得到多个计算结果。其中,所述预置的行与列的乘积算法为线性代数中矩阵的点积运算,例如,矩阵{a11,a12,a13;a21,a22,a23;a31,a32,a33本文档来自技高网...
数据特征选择的评价方法及装置

【技术保护点】
一种数据特征选择的评价方法,其特征在于,包括:获取待评价特征选择的数据矩阵;根据不同属性特征类型对所述数据矩阵进行分类;为数据矩阵中的数值配置与所述类型对应的权值系数;通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。

【技术特征摘要】
1.一种数据特征选择的评价方法,其特征在于,包括:获取待评价特征选择的数据矩阵;根据不同属性特征类型对所述数据矩阵进行分类;为数据矩阵中的数值配置与所述类型对应的权值系数;通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值。2.根据权利要求1所述的数据特征选择的评价方法,其特征在于,所述获取待评价特征选择的数据矩阵之前,所述方法包括:将待评价特征选择的数据矩阵配置为行列数量相同的数据矩阵。3.根据权利要求2所述的数据特征选择的评价方法,其特征在于,所述属性特征类型包括用户类型、安全类型、危险类型,所述为数据矩阵中的数值配置与所述类型对应的权值系数包括:若属性特征类型为用户类型,则为所述数据矩阵中的数值配置的权值系数符合二项分布;若属性特征类型为安全类型,则为所述数据矩阵中的数值配置的权值系数符合正态分布;若属性特征类型为危险类型,则为所述数据矩阵中的数值配置的权值系数符合指数分布。4.根据权利要求3所述的数据特征选择的评价方法,其特征在于,所述通过预置乘积算法及预置求和算法,计算配置权值系数后的数据矩阵的评价值包括:通过预置的行与列的乘积算法计算得到多个计算结果;将所述多个计算结果进行求和统计得到评价值。5.根据权利要求4所述的数据特征选择的评价方法,其特征在于,所述方法还包括:根据不同的用户需求及不同的数据挖掘算法判断是否进行数据挖掘;若否,则发出告警信息。6.一种数据特征选择的评价...

【专利技术属性】
技术研发人员:傅涛冯凌
申请(专利权)人:江苏博智软件科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1