一种逻辑回归模型建立方法及装置制造方法及图纸

技术编号:38381695 阅读:18 留言:0更新日期:2023-08-05 17:39
本发明专利技术提供了一种逻辑回归模型建立方法及装置,该方法包括:构建训练集;基于量子计算,通过二次无约束二值优化QUBO模型对该训练集进行特征筛选,得到特征子集;根据该特征子集建立逻辑回归模型,可以解决相关技术中在多次建模之后进行特征的选择,无法在建模之前完成特征选择,增加模型的负担与计算的复杂度的问题,根据分位数与最小支持度设置的反欺诈规则,通过准确高效的反欺诈规则,提高了风险客户识别的准确性,通过QUBO模型对该训练集进行特征筛选,效率更高而且减少人工的干扰,提升了建立的模型的整体效果。了建立的模型的整体效果。了建立的模型的整体效果。

【技术实现步骤摘要】
一种逻辑回归模型建立方法及装置


[0001]本专利技术涉及数据处理领域,具体而言,涉及一种逻辑回归模型建立方法及装置。

技术介绍

[0002]传统特征筛选通常需要人工的定义一些特征重要性指标的阈值,并且不断调整,容易受到人的主观因素影响,增加人为操作风险。需要在多次建模之后进行特征的选择,无法在建模之前完成特征选择,增加模型的负担与计算的复杂度。
[0003]针对相关技术中在多次建模之后进行特征的选择,无法在建模之前完成特征选择,增加模型的负担与计算的复杂度的问题,尚未提出解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种逻辑回归模型建立方法及装置,以至少解决相关技术中在多次建模之后进行特征的选择,无法在建模之前完成特征选择,增加模型的负担与计算的复杂度的问题。
[0005]根据本专利技术的一个实施例,提供了一种逻辑回归模型建立方法,所述方法包括:
[0006]构建训练集;
[0007]基于量子计算,通过二次无约束二值优化(Quadratic Unbounded Binary Optimization,简称为QUBO)模型对所述训练集进行特征筛选,得到特征子集;
[0008]根据所述特征子集建立逻辑回归模型。
[0009]可选地,基于量子计算,通过二次无约束二值优化QUBO模型对所述训练集进行特征筛选,得到特征子集包括:
[0010]根据所述训练集构建所述QUBO模型;
[0011]通过量子计算对所述QUBO模型进行求解,得到求解结果;
[0012]根据所述求解结果确定所述特征子集。
[0013]可选地,根据所述训练集构建所述QUBO模型包括:
[0014]所述训练集包括M个客户的数据,对所述M个客户的数据进行预处理,得到相关性矩阵;
[0015]根据所述相关性矩阵构建所述QUBO模型。
[0016]可选地,所述方法还包括:
[0017]通过以下方式,根据所述相关性矩阵构建所述QUBO模型:
[0018]f(x)=

X
T
QX;
[0019]f(x)为所述QUBO模型,Q为所述相关性矩阵,X为向量。
[0020]可选地,对所述M个客户的数据进行预处理,得到相关性矩阵包括:
[0021]对所述M个客户的数据进行证据权重(We ight Of Evidence,简称为WOE)编码,得到M*N的特征向量矩阵;
[0022]确定所述M*N的特征向量矩阵中每个客户的特征之间的相关性,形成N*N的所述相
关性矩阵。
[0023][0024]α为权重,x
j
为特征j的筛选结果,所述筛选结果为0或1,0表示未被筛选,1表示被筛选;ρV
j
为所述特征向量矩阵的第j个特征和第k个特征的相关性;ρ
jk
为所述特征向量矩阵的第j个特征的iv值。
[0025]可选地,通过量子计算对所述QUBO模型进行求解,得到所述求解结果包括:
[0026]将QUBO模型通过相干伊辛机,利用伊辛模型进行求解,得到所述求解结果。
[0027]根据本专利技术的另一个实施例,还提供了一种逻辑回归模型建立装置,所述装置包括:
[0028]构建模块,用于构建训练集;
[0029]筛选模块,用于基于量子计算,通过二次无约束二值优化QUBO模型对所述训练集进行特征筛选,得到特征子集;
[0030]建立模块,用于根据所述特征子集建立逻辑回归模型。
[0031]可选地,所述筛选模块包括:
[0032]构建子模块,用于根据所述训练集构建所述QUBO模型;
[0033]求解子模块,用于通过量子计算对所述QUBO模型进行求解,得到求解结果;
[0034]确定子模块,用于根据所述求解结果确定所述特征子集。
[0035]可选地,所述构建子模块包括:
[0036]预处理单元,用于所述训练集包括M个客户的数据,对所述M个客户的数据进行预处理,得到相关性矩阵;
[0037]构建单元,用于根据所述相关性矩阵构建所述QUBO模型。
[0038]可选地,所述构建单元,还用于通过以下方式,根据所述相关性矩阵构建所述QUBO模型:
[0039]f(x)=

X
T
QX;
[0040]f(x)为所述QUBO模型,Q为所述相关性矩阵,X为向量。
[0041]可选地,所述预处理单元,还用于对所述M个客户的数据进行WOE编码,得到M*N的特征向量矩阵;确定所述M*N的特征向量矩阵中每个客户的特征之间的相关性,形成N*N的所述相关性矩阵。
[0042]可选地,
[0043]α为权重,x
j
为特征j的筛选结果,所述筛选结果为0或1,0表示未被筛选,1表示被筛选;ρV
j
为所述特征向量矩阵的第j个特征和第k个特征的相关性;ρ
jk
为所述特征向量矩阵的第j个特征的iv值。
[0044]可选地,所述求解子模块,还用于将QUBO模型通过相干伊辛机,利用伊辛模型进行求解,得到所述求解结果。
[0045]根据本专利技术的又一个实施例,还提供了一种计算机可读的存储介质,所述存储介
质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
[0046]根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
[0047]通过本专利技术,构建训练集;基于量子计算,通过二次无约束二值优化QUBO模型对所述训练集进行特征筛选,得到特征子集;根据所述特征子集建立逻辑回归模型,可以解决相关技术中在多次建模之后进行特征的选择,无法在建模之前完成特征选择,增加模型的负担与计算的复杂度的问题,根据分位数与最小支持度设置的反欺诈规则,通过准确高效的反欺诈规则,提高了风险客户识别的准确性,通过QUBO模型对所述训练集进行特征筛选,效率更高而且减少人工的干扰,提升了建立的模型的整体效果。
附图说明
[0048]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0049]图1是本专利技术实施例的逻辑回归模型建立方法的移动终端的硬件结构框图;
[0050]图2是根据本专利技术实施例的逻辑回归模型建立方法的流程图;
[0051]图3是根据本专利技术实施例的集群学习的训练的示意图;
[0052]图4是根据本专利技术实施例的逻辑回归模型建立装置的框图;
[0053]图5是根据本专利技术可选实施例的逻辑回归模型建立装置的框图。
具体实施方式
[0054]下文中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种逻辑回归模型建立方法,其特征在于,所述方法包括:构建训练集;基于量子计算,通过二次无约束二值优化QUBO模型对所述训练集进行特征筛选,得到特征子集;根据所述特征子集建立逻辑回归模型。2.根据权利要求1所述的方法,其特征在于,基于量子计算,通过二次无约束二值优化QUBO模型对所述训练集进行特征筛选,得到特征子集包括:根据所述训练集构建所述QUBO模型;通过量子计算对所述QUBO模型进行求解,得到求解结果;根据所述求解结果确定所述特征子集。3.根据权利要求2所述的方法,其特征在于,根据所述训练集构建所述QUBO模型包括:所述训练集包括M个客户的数据,对所述M个客户的数据进行预处理,得到相关性矩阵;根据所述相关性矩阵构建所述QUBO模型。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:通过以下方式,根据所述相关性矩阵构建所述QUBO模型:f(x)=

X
T
QX;f(x)为所述QUBO模型,Q为所述相关性矩阵,X为向量。5.根据权利要求4所述的方法,其特征在于,对所述M个客户的数据进行预处理,得到相关性矩阵包括:对所述M个客户的数据进行证据权重WOE编码,得到M*N的特征向量矩阵;确定所述M*N的特征向量矩阵中每个客户的特征之间的...

【专利技术属性】
技术研发人员:朱德立王雪菲王鹏田江向小佳文凯巨江伟郦易贝王勇仲邵林
申请(专利权)人:北京玻色量子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1