本发明专利技术公开了一种二分类模型构建方法、装置、设备及计算机可读存储介质,所述方法包括:获取训练样本的各特征属性与预设二分类目标之间的单调性关系;采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝;根据剪枝后的梯度提升树得到目标二分类模型。本发明专利技术实现了在梯度提升树训练过程中融合业务知识,以使得模型的分类结果具备较高的可信度。
【技术实现步骤摘要】
二分类模型构建方法、装置、设备及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种二分类模型构建方法、装置、设备及计算机可读存储介质。
技术介绍
梯度提升树(GradientBoostingDecisionTree,GBDT)作为一种集成学习方法,在许多领域已有成熟应用。通过梯度提升树训练方法训练得到的模型也称为梯度提升树,梯度提升树是由许多互补的决策树组合起来生成一个效果更好的模型。在将梯度提升树应用于具体应用场景解决具体的业务问题时,往往需要训练得到的梯度提升树符合该具体应用场景的业务认知,才能使得该梯度提升树的分类结果具备可信度。例如,客户风险信贷评估场景下,一个常规业务认知是客户的历史逾期次数越多该客户是高风险客户的可能性就越大。但是目前的梯度提升树训练方法仅依据训练样本进行训练,训练得到的梯度提升树中可能包含不符合具体应用场景业务认知的分裂节点,使得模型的分类结果可信度低。
技术实现思路
本专利技术的主要目的在于提供一种二分类模型构建方法、装置、设备及计算机可读存储介质,旨在解决目前依靠人工进行奶茶出杯质量查验,查验效率低下的技术问题。为实现上述目的,本专利技术提供一种二分类模型构建方法,所述方法包括以下步骤:获取训练样本的各特征属性与预设二分类目标之间的单调性关系;采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝;根据剪枝后的梯度提升树得到目标二分类模型。可选地,所述采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝的步骤包括:采用所述训练样本训练梯度提升树,并计算所述梯度提升树的各决策树中各节点对应的预设指标值,其中,预设指标为与所述预设二分类目标具备单调性的指标;对于所述各节点中的分裂节点,根据所述分裂节点的两个孩子节点对应的所述预设指标值,确定所述分裂节点是否符合自身对应的所述单调性关系;若确定所述分裂节点不符合自身对应的所述单调性关系,则对所述分裂节点进行剪枝。可选地,所述对于所述各节点中的分裂节点,根据所述分裂节点的两个孩子节点对应的所述预设指标值,确定所述分裂节点是否符合自身对应的所述单调性关系的步骤包括:对于所述各节点中的分裂节点,确定所述分裂节点的两个孩子节点对应的所述预设指标值之间的真实大小关系;根据所述分裂节点的拆分规则和所述拆分规则中特征属性对应的所述单调性关系,确定所述两个孩子节点对应的所述预设指标值之间应当具备的目标大小关系;检测所述真实大小关系与所述目标大小关系是否相同;若不相同,则确定所述分裂节点不符合自身对应的所述单调性关系;若相同,则确定所述分裂节点符合自身对应的所述单调性关系。可选地,所述对于所述各节点中的分裂节点,确定所述分裂节点的两个孩子节点对应的所述预设指标值之间的真实大小关系的步骤之前,还包括:检测所述分裂节点的拆分规则中特征属性对应的所述单调性关系是否为单调关系;若是,则执行所述对于所述各节点中的分裂节点,确定所述分裂节点的两个孩子节点对应的所述预设指标值之间的真实大小关系的步骤;若否,则输出预设提示信息,并接收基于所述预设提示信息触发的反馈信息,其中,所述反馈信息用于指示所述分裂节点是否符合自身对应的所述单调性关系。可选地,所述若确定所述分裂节点不符合自身对应的所述单调性关系,则对所述分裂节点进行剪枝的步骤包括:若确定所述分裂节点不符合自身对应的所述单调性关系,则将所述分裂节点下的各个叶片值均设置为所述分裂节点对应的所述预设指标值,以对所述分裂节点进行后剪枝。可选地,所述根据剪枝后的梯度提升树得到目标二分类模型的步骤包括:将剪枝后的梯度提升树中各决策树的叶子节点的预测值转换为所述叶子节点对应的预设指标值得到决策树集合,其中,预设指标为与所述预设二分类目标具备单调性的指标;将所述决策树集合中的各个决策树作为待拟合二分类模型的变量生成器,采用所述训练样本对所述待拟合二分类模型进行拟合得到目标二分类模型。可选地,所述训练样本包括各个客户的信贷数据,所述根据剪枝后的梯度提升树得到目标二分类模型的步骤之后,还包括:将待评估客户的信贷数据输入所述目标二分类模型进行处理得到分类结果,以根据所述分类结果确定是否对所述待评估客户进行贷款。为实现上述目的,本专利技术还提供一种二分类模型构建装置,所述装置包括:获取模块,用于获取训练样本的各特征属性与预设二分类目标之间的单调性关系;剪枝模块,用于采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝;确定模块,用于根据剪枝后的梯度提升树得到目标二分类模型。为实现上述目的,本专利技术还提供一种二分类模型构建设备,所述二分类模型构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的二分类模型构建程序,所述二分类模型构建程序被所述处理器执行时实现如上所述的二分类模型构建方法的步骤。此外,为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有二分类模型构建程序,所述二分类模型构建程序被处理器执行时实现如上所述的二分类模型构建方法的步骤。由于现有的梯度提升树训练方法仅依据训练样本进行训练,没有融合具体应用场景的业务知识,所以可能导致训练出的梯度提升树中某些分裂节点违背了业务认知,梯度提升树的分类结果可信度低。相比于现有训练方法,在本专利技术中,通过获取特征属性与二分类目标之间符合业务认知的单调性关系,并将梯度提升树中不符合自身对应的单调性关系的分裂节点进行剪枝,根据剪枝后的梯度提升树得到目标二分类模型,使得最终得到的二分类模型是符合具体应用场景的业务认知的,也即实现了在梯度提升树训练过程中融合业务知识,以使得模型的分类结果具备较高的可信度。附图说明图1为本专利技术实施例方案涉及的硬件运行环境的结构示意图;图2为本专利技术二分类模型构建方法第一实施例的流程示意图;图3为本专利技术二分类模型构建装置较佳实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的设备结构示意图。需要说明的是,本专利技术实施例二分类模型构建设备可以是智能手机、个人计算机和服务器等设备,在此不做具体限制。如图1所示,该二分类模型构建设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keybo本文档来自技高网...
【技术保护点】
1.一种二分类模型构建方法,其特征在于,所述方法包括以下步骤:/n获取训练样本的各特征属性与预设二分类目标之间的单调性关系;/n采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝;/n根据剪枝后的梯度提升树得到目标二分类模型。/n
【技术特征摘要】
1.一种二分类模型构建方法,其特征在于,所述方法包括以下步骤:
获取训练样本的各特征属性与预设二分类目标之间的单调性关系;
采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝;
根据剪枝后的梯度提升树得到目标二分类模型。
2.如权利要求1所述的二分类模型构建方法,其特征在于,所述采用所述训练样本训练梯度提升树,并对所述梯度提升树的各决策树中不符合自身对应的所述单调性关系的分裂节点进行剪枝的步骤包括:
采用所述训练样本训练梯度提升树,并计算所述梯度提升树的各决策树中各节点对应的预设指标值,其中,预设指标为与所述预设二分类目标具备单调性的指标;
对于所述各节点中的分裂节点,根据所述分裂节点的两个孩子节点对应的所述预设指标值,确定所述分裂节点是否符合自身对应的所述单调性关系;
若确定所述分裂节点不符合自身对应的所述单调性关系,则对所述分裂节点进行剪枝。
3.如权利要求2所述的二分类模型构建方法,其特征在于,所述对于所述各节点中的分裂节点,根据所述分裂节点的两个孩子节点对应的所述预设指标值,确定所述分裂节点是否符合自身对应的所述单调性关系的步骤包括:
对于所述各节点中的分裂节点,确定所述分裂节点的两个孩子节点对应的所述预设指标值之间的真实大小关系;
根据所述分裂节点的拆分规则和所述拆分规则中特征属性对应的所述单调性关系,确定所述两个孩子节点对应的所述预设指标值之间应当具备的目标大小关系;
检测所述真实大小关系与所述目标大小关系是否相同;
若不相同,则确定所述分裂节点不符合自身对应的所述单调性关系;
若相同,则确定所述分裂节点符合自身对应的所述单调性关系。
4.如权利要求3所述的二分类模型构建方法,其特征在于,所述对于所述各节点中的分裂节点,确定所述分裂节点的两个孩子节点对应的所述预设指标值之间的真实大小关系的步骤之前,还包括:
检测所述分裂节点的拆分规则中特征属性对应的所述单调性关系是否为单调关系;
若是,则执行所述对于所述各节点中的分裂节点,确定所述分裂节点的两个孩子节点对应的所述预设指标值之间的真实大小关系的步骤;
若否,则输出预设提示信息,并接收基于所述预设提示...
【专利技术属性】
技术研发人员:吴轶凡,陈婷,吴三平,庄伟亮,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。