一种特征模型的生成、应用方法及装置制造方法及图纸

技术编号:16885874 阅读:25 留言:0更新日期:2017-12-27 03:40
本发明专利技术涉及计算机领域,特别涉及一种特征模型的生成、应用方法及装置,用以提高目标特征模型的精准度。该方法为:将特征数据输入目标特征模型,获得相应的描述信息,其中,所述目标特征模型用于描述一应用场景且是基于多个子特征模型生成的,所述多个特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,显然,不同的子特征模型在描述目标特征模型对应的应用场景时的侧重点不同,使得最终生成的目标特征模型可以从不同角度更全面地描述上述待分析的应用场景,从而增加了目标特征模型的精准度,进而提高了特征数据分析的准确度。

A method and device for the generation, application and application of a feature model

The invention relates to the field of computer, especially the generation, application and device of a feature model to improve the precision of the target feature model. The method is as follows: the characteristics of data input target feature model, obtain the corresponding description information, among them, the target feature model is used to describe a scenario and is generated based on the sub model, the plurality of feature model is based on the application of the corresponding scene feature set generation, feature model different characteristics of the same, and the characteristics of different sub feature model is contained in the adjustment of the feature set features get important after, apparently, emphasis on the different model in sub scenarios describe the target feature model corresponding to the different application scenarios that target feature model generated from different angle a comprehensive description of the analysis, thus increasing the accuracy of the target feature model, and improves the accuracy of feature data analysis.

【技术实现步骤摘要】
一种特征模型的生成、应用方法及装置
本专利技术涉及计算机领域,特别涉及一种特征模型的生成、应用方法及装置。
技术介绍
在数据分析过程中,为了更好地确定待分析对象的特点,一个重要的步骤便是特征的选取,特征的选取结果在很大程度上将会影响后期建模的效果,进而影响数据分析的结果。现有技术下,在进行建模时,特征的选取一般采用两种方式:第一种方式为:选中提取出的所有特征,删除一些区分度不强的特征,通过训练样本对剩下的所有特征进行统一训练,从而建立统一的模型(如,采用决策树方式进行建模。然而,采用第一种方式,通常只会选取出区分度最强的特征以及特征组合,因此,建立的模型也会着重描述这些特征及特征组合的特点,而一些次强的特征及特征组合可能被忽略,从而影响建模结果的精准度。第二种方式为:先对提取出的特征进行分组。然后,每一组特征分别采用相应的训练样本进行训练,分别生成相应的子模型,最后,再将所有子模型统一组成一个模型(如,采用随机森林方式进行建模,或者,采用boosting方式进行建模)。然而,采用第二种方式,可能会在特征随机分组过程中,拆散区分度很强的特征组合,从而影响建模结果的精准度。并且由于特征分组是随机的,建模型结果是否理想只能靠统计学保证,这同样会影响建模结果的准确性。
技术实现思路
本专利技术实施例提供一种特征模型的生成、应用方法及装置,用以提高建模结果的精准度。本专利技术实施例提供的具体技术方案如下:一种特征模型的应用方法,包括:获取特征数据,所述特征数据中包含有至少一个特征;获取目标特征模型,所述目标特征模型用于描述一应用场景,是基于多个子特征模型生成的,其中,所述多个特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,一个特征的重要度表征所述一个特征对建模准确度的影响程度;将特征数据输入目标特征模型,获得所述特征数据在所述应用场景下的描述信息。可选的,获取所述目标特征模型之前,进一步包括:生成所述目标特征模型,具体包括:针对待分析的应用场景进行特征提取,获得特征集合;基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。可选的,基于获得的特征集合,生成多个子特征模型,包括:循环执行以下操作,直到确定满足预设的停止执行条件:基于当前的特征集合包含的所有特征建立相应的子特征模型;计算获得的子特征模型中每一个特征当前的重要度;在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征;判断是否满足预设的停止条件。一种特征模型的生成方法,针对待分析的应用场景进行特征提取,获得特征集合;基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。可选的,基于获得的特征集合,生成多个子特征模型,包括:循环执行以下操作,直到确定满足预设的停止执行条件:基于当前的特征集合包含的所有特征建立相应的子特征模型;计算获得的子特征模型中每一个特征当前的重要度;在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征;判断是否满足预设的停止条件。可选的,确定满足预设的停止执行条件,包括:判定所述当前的特征集合包含的所有特征中,不存在重要度的取值大于第二设定阈值的特征时,确定满足预设的停止执行条件。可选的,确定满足预设的停止执行条件,包括:判定已获得的子特征模型的数目达到第三设定阈值时,确定满足预设的停止执行条件。可选的,在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征,包括:在所述当前的特征集合中,提取出当前的重要度大于第二设定阈值的所有特征,组成第一特征组;在所述第一特征组中,删除至少一个特征。可选的,在所述第一特征组中,删除至少一个特征,包括:判断第一特征组中包含的特征总数目是否小于第三设定阈值,若是,则提取出第一特征组中包含的所有特征作为第二特征组;否则,在第一特征组中按照所述第三设定阈值提取出相应数目的特征,组成第二特征组;在所述当前的特征集合中,删除所述第二特征组包含的所有特征。可选的,在第一特征组中按照所述第三设定阈值提取出相应数目的特征,组成第二特征组,包括:从第一特征组中选取当前的重要度的取值最大的N个特征组成第二特征组;或者,从第一特征组中随机选取N个特征组成第二特征组;或者,从第一特征组中选取指定的N个特征组成第二特征组;其中,N为所述第三设定阈值的取值。可选的,基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型,包括:基于获得的所有子特征模型,采用加权方式生成所述目标特征模型,其中,每一个子特征模型对应的权值与相应子特征模型包含的特征的重要度正相关。一种特征模型的应用装置,包括:获取单元,用于获取特征数据,所述特征数据中包含有至少一个特征;模型处理单元,用于获取目标特征模型,所述目标特征模型用于描述一应用场景,是基于多个子特征模型生成的,其中,所述多个特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,一个特征的重要度表征所述一个特征对建模准确度的影响程度;输出单元,用于将特征数据输入目标特征模型,获得所述特征数据在所述应用场景下的描述信息。可选的,获取所述目标特征模型之前,所述模型处理单元进一步用于:生成所述目标特征模型,具体用于:针对待分析的应用场景进行特征提取,获得特征集合;基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。可选的,基于获得的特征集合,生成多个子特征模型时,所述模型处理单元用于:循环执行以下操作,直到确定满足预设的停止执行条件:基于当前的特征集合包含的所有特征建立相应的子特征模型;计算获得的子特征模型中每一个特征当前的重要度;在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征;判断是否满足预设的停止条件。一种特征模型的生成装置,包括:提取单元,用于针对待分析的应用场景进行特征提取,获得特征集合;第一生成单元,用于基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;第二生成单元,用于基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。可选的,针对待分析的应用场景进行特征提取,获得特征集合之后,开始建模之前,所述第一生成单元进一步用于:删除所述特征集合中的无效特征,其中,所述无效特征为重要度的取值低于第一设定阈值的特征。可选的,基于获得的特征集合,生成多个子特征模型时,所述第一生成单元用于:循环执行以下操作,直到确定满足预设的停止执行条件:基于当本文档来自技高网...
一种特征模型的生成、应用方法及装置

【技术保护点】
一种特征模型的应用方法,其特征在于,包括:获取特征数据,所述特征数据中包含有至少一个特征;获取目标特征模型,所述目标特征模型用于描述一应用场景,是基于多个子特征模型生成的,其中,所述多个子特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,一个特征的重要度表征所述一个特征对建模准确度的影响程度;将特征数据输入目标特征模型,获得所述特征数据在所述应用场景下的描述信息。

【技术特征摘要】
1.一种特征模型的应用方法,其特征在于,包括:获取特征数据,所述特征数据中包含有至少一个特征;获取目标特征模型,所述目标特征模型用于描述一应用场景,是基于多个子特征模型生成的,其中,所述多个子特征模型是基于所述应用场景对应的特征集合生成的,不同子特征模型包含的特征部分相同,且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的,一个特征的重要度表征所述一个特征对建模准确度的影响程度;将特征数据输入目标特征模型,获得所述特征数据在所述应用场景下的描述信息。2.如权利要求1所述的方法,其特征在于,获取所述目标特征模型之前,进一步包括:生成所述目标特征模型,具体包括:针对待分析的应用场景进行特征提取,获得特征集合;基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。3.如权利要求2所述的方法,其特征在于,基于获得的特征集合,生成多个子特征模型,包括:循环执行以下操作,直到确定满足预设的停止执行条件:基于当前的特征集合包含的所有特征建立相应的子特征模型;计算获得的子特征模型中每一个特征当前的重要度;在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征;判断是否满足预设的停止条件。4.一种特征模型的生成方法,其特征在于,包括:针对待分析的应用场景进行特征提取,获得特征集合;基于获得的特征集合,生成多个子特征模型,其中,不同子特征模型包含的特征部分相同,并且不同子特征模型包含的特征是调整所述特征集合中特征的重要度后得到的;基于获得的所有子特征模型,生成对应所述待分析的应用场景的目标特征模型。5.如权利要求4所述的方法,其特征在于,针对待分析的应用场景进行特征提取,获得特征集合之后,开始建模之前,进一步包括:删除所述特征集合中的无效特征,其中,所述无效特征为重要度的取值低于第一设定阈值的特征。6.如权利要求4所述的方法,其特征在于,基于获得的特征集合,生成多个子特征模型,包括:循环执行以下操作,直到确定满足预设的停止执行条件:基于当前的特征集合包含的所有特征建立相应的子特征模型;计算获得的子特征模型中每一个特征当前的重要度;在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征;判断是否满足预设的停止条件。7.如权利要求6所述的方法,其特征在于,确定满足预设的停止执行条件,包括:判定所述当前的特征集合包含的所有特征中,不存在重要度的取值大于第二设定阈值的特征时,确定满足预设的停止执行条件。8.如权利要求6述的方法,其特征在于,确定满足预设的停止执行条件,包括:判定已获得的子特征模型的数目达到第三设定阈值时,确定满足预设的停止执行条件。9.如权利要求6、7或8所述的方法,其特征在于,在所述当前的特征集合中,删除当前的重要度符合预设筛选条件的特征,包括:在所述当前的特征集合中,提取出当前的重要度大于第二设定阈值的所有特征,组成第一特征组;在所述第一特征组中,删除至少一个特征。10.如权利要求9所述的方法,其特征在于,在所述第一特征组中,删除至少一个特征,包括:判断第一特征组中包含的特征总数目是否小于第三设定阈值,若是,则提...

【专利技术属性】
技术研发人员:陈钰雯
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1