标签质量智能分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38769241 阅读:8 留言:0更新日期:2023-09-10 10:42
本发明专利技术涉及金融领域的智能决策技术,揭露一种标签质量智能分析方法,可用于对金融产品的用户标签进行质量评估,包括:根据业务场景,提取待评估的标签系统的类标签对应的样本数据;选取样本数据中具有区分度的初始特征数据集,计算初始特征数据集与类标签之间的信息增益,以从初始特征数据集中选取类标签的目标特征数据集;构建目标特征数据集的标签测试数据,识别标签测试数据的预测标签;查询标签系统的标签质量分析指标,根据预测标签、标签测试数据,计算标签质量分析指标的指标得分;根据指标得分,计算标签系统中每个标签的质量评分,生成所述标签系统的标签质量分析报告。本发明专利技术可以提高金融产品的标签质量分析的准确性。性。性。

【技术实现步骤摘要】
标签质量智能分析方法、装置、电子设备及存储介质


[0001]本专利技术涉及智能决策领域,尤其涉及一种标签质量智能分析方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,随着信息技术的进步与迅速发展,我们进入了大数据信息时代,大数据潜移默化的影响着我们的日常生活,并成为一种宝贵又丰富的资产。对于企业,尤其是金融公司,要如何利用大数据更好的服务用户,就需要对用户有足够全面的了解,建立一个完整可用的用户标签体系以帮助金融公司从不同维度对用户进行描述与刻画,从而更好的执行金融产品推荐,如推荐保险产品或者理财产品。标签是指标志目标的分类或内容。标签质量是用来度量所述标签体系解决用户需求的优劣程度。
[0003]目前业界的标签质量评估,大多通过饱和度、标签使用度两个指标进行衡量,对于部分标签的取值分段是否合理,反应用户标签的准确程度,数据波动的衡量等,都没有明确的衡量指标,对于具有较多客户分类维度的金融产品来说,更没有从多指标综合评价用户标签系统的标签质量,从而会影响标签质量分析的准确性。

技术实现思路

[0004]本专利技术提供一种标签质量智能分析方法、装置、电子设备及存储介质,其主要目的在于提高金融产品的用户标签的标签质量分析准确性。
[0005]为实现上述目的,本专利技术提供的一种标签质量智能分析方法,包括:
[0006]识别待评估的标签系统的业务场景及其对应的类标签,根据所述业务场景,提取所述类标签对应的样本数据;
[0007]选取所述样本数据中具有区分度的数据集作为初始特征数据集,计算所述初始特征数据集与所述类标签之间的信息增益,根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集;
[0008]构建所述目标特征数据集的标签测试数据,利用训练好的标签分析模型中的标签分类器识别所述标签测试数据的预测标签;
[0009]查询所述标签系统的标签质量分析指标,根据所述预测标签、所述标签测试数据,利用所述训练好的标签分析模型中的标签质量分析函数计算所述标签质量分析指标的指标得分;
[0010]根据所述指标得分,计算所述标签系统中每个标签的质量评分,根据所述质量评分,生成所述标签系统的标签质量分析报告。
[0011]可选地,所述计算所述初始特征数据集与所述类标签之间的信息增益包括:
[0012]利用下述公式计算所述初始特征数据集与所述类标签之间的信息增益:
[0013]IG(f
i
;T)=H(f
i
)+H(T)

H(f
i
,T)
[0014]其中,IG(f
i
;T)表示初始特征数据集中的第i个特征f
i
与类标签集合T之间的信息
增益,H(f
i
)表示第i个特征f
i
的信息熵,H(T)表示类标签集合T的信息熵,H(f
i
,T)表示第i个特征f
i
与类标签集合T的联合信息熵。
[0015]可选地,所述根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集,包括:
[0016]对所述信息增益进行归一化处理,得到归一化增益;
[0017]计算所述归一化增益的均值,以所述均值作为阈值,选取不小于所述阈值对应的初始特征数据集中的特征,生成目标特征数据集。
[0018]可选地,所所述对所述信息增益进行归一化处理,得到归一化增益,包括:
[0019]利用下述公式对信息增益的归一化处理如下述公式:
[0020][0021]其中,SU(f
i
,T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的归一化信息增益,IG(f
i
;T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的信息增益,H(f
i
)表示第i个特征f
i
的信息熵,H(T)表示类标签集合T的信息熵。
[0022]可选地,所述标签分类器的构建,包括:
[0023][0024]其中,γ
t
表示标签分类器的第t次训练迭代权重向量,t表示标签分类器的训练迭代次数,γ
t
‑1表示标签分类器的第t

1次训练迭代权重向量,x
i
表示第i个训练样本数据向量,ρ表示标签权重学习率,T表示向量的转置运算符号。
[0025]可选地,所述签质量分析函数包括:
[0026][0027]其中,Acc表示标签预测的准确率得分,R
j
表示第j个标签测试数据的真实标签,Z
j
表示第j个标签测试数据对应的预测标签,|R
j
∩Z
j
|表示预测正确的标签个数,|R
j
∪Z
j
|表示真实标签与预测标签出现的总个数,∩表示交集符号,∪表示合集符号,n表示标签测试数据的个数。
[0028]可选地,所述根据所述指标得分,计算所述标签系统中每个标签的质量评分,包括:
[0029]对所述指标得分对应的指标做一致化处理,得到指标一致化得分,对所述指标一致化得分进行数据标准化处理,得到指标标准化得分;
[0030]分析所述指标在所述标签系统的业务场景中的重要程度,根据所述重要程度,为所述指标分配权重系数;
[0031]根据所述权重系数和所述指标标准化得分,计算所述权重系数和所述指标得分的乘积和,得到所述标签系统中每个标签的质量评分。
[0032]为了解决上述问题,本专利技术还提供一种标签质量智能分析装置,所述装置包括:
[0033]类标签识别模块,用于识别待评估的标签系统的业务场景及其对应的类标签,根据所述业务场景,提取所述类标签对应的样本数据;
[0034]目标特征数据集生成模块,用于选取所述样本数据中具有区分度的数据集作为初始特征数据集,计算所述初始特征数据集与所述类标签之间的信息增益,根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集;
[0035]预测标签识别模块,用于构建所述目标特征数据集的标签测试数据,利用训练好的标签分析模型中的标签分类器识别所述标签测试数据的预测标签;
[0036]指标得分计算模块,用于查询所述标签系统的标签质量分析指标,根据所述预测标签、所述标签测试数据,利用所述训练好的标签分析模型中的标签质量分析函数计算所述标签质量分析指标的指标得分;
[0037]标签质量分析报告生成模块,用于根据所述指标得分,计算所述标签系统中每个标签的质量评分,根据所述质量评分,生成所述标签系统的标签质量分析报告。
[0038]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0039]至少一个处理器;以及,
[0040]与所述至少一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签质量智能分析方法,其特征在于,所述方法包括:识别待评估的标签系统的业务场景及其对应的类标签,根据所述业务场景,提取所述类标签对应的样本数据;选取所述样本数据中具有区分度的数据集作为初始特征数据集,计算所述初始特征数据集与所述类标签之间的信息增益,根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集;构建所述目标特征数据集的标签测试数据,利用训练好的标签分析模型中的标签分类器识别所述标签测试数据的预测标签;查询所述标签系统的标签质量分析指标,根据所述预测标签、所述标签测试数据,利用所述训练好的标签分析模型中的标签质量分析函数计算所述标签质量分析指标的指标得分;根据所述指标得分,计算所述标签系统中每个标签的质量评分,根据所述质量评分,生成所述标签系统的标签质量分析报告。2.如权利要求1所述的标签质量智能分析方法,其特征在于,所述计算所述初始特征数据集与所述类标签之间的信息增益包括:利用下述公式计算所述初始特征数据集与所述类标签之间的信息增益:IG(f
i
;T)=H(f
i
)+H(T)

H(f
i
,T)其中,IG(f
i
;T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的信息增益,H(f
i
)表示第i个特征f
i
的信息熵,H(T)表示类标签集合T的信息熵,H(f
i
,T)表示第i个特征f
i
与类标签集合T的联合信息熵。3.如权利要求1所述的标签质量智能分析方法,其特征在于,所述根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集,包括:对所述信息增益进行归一化处理,得到归一化增益;计算所述归一化增益的均值,以所述均值作为阈值,选取不小于所述阈值对应的初始特征数据集中的特征,生成目标特征数据集。4.如权利要求1所述的标签质量智能分析方法,其特征在于,所述对所述信息增益进行归一化处理,得到归一化增益,包括:利用下述公式对信息增益的归一化处理如下述公式:其中,SU(f
i
,T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的归一化增益,IG(f
i
;T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的信息增益,H(f
i
)表示第i个特征f
i
的信息熵,H(T)表示类标签集合T的信息熵。5.如权利要求1所述的标签质量智能分析方法,其特征在于,所述标签分类器的构建,包括:其中,γ
t
表示标签分类器的第t次训练迭代权重向量,t表示标签分类器的训练...

【专利技术属性】
技术研发人员:胡立波陈又新孔祥成
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1