【技术实现步骤摘要】
标签质量智能分析方法、装置、电子设备及存储介质
[0001]本专利技术涉及智能决策领域,尤其涉及一种标签质量智能分析方法、装置、电子设备及存储介质。
技术介绍
[0002]近年来,随着信息技术的进步与迅速发展,我们进入了大数据信息时代,大数据潜移默化的影响着我们的日常生活,并成为一种宝贵又丰富的资产。对于企业,尤其是金融公司,要如何利用大数据更好的服务用户,就需要对用户有足够全面的了解,建立一个完整可用的用户标签体系以帮助金融公司从不同维度对用户进行描述与刻画,从而更好的执行金融产品推荐,如推荐保险产品或者理财产品。标签是指标志目标的分类或内容。标签质量是用来度量所述标签体系解决用户需求的优劣程度。
[0003]目前业界的标签质量评估,大多通过饱和度、标签使用度两个指标进行衡量,对于部分标签的取值分段是否合理,反应用户标签的准确程度,数据波动的衡量等,都没有明确的衡量指标,对于具有较多客户分类维度的金融产品来说,更没有从多指标综合评价用户标签系统的标签质量,从而会影响标签质量分析的准确性。
技术实现思路
[0004]本专利技术提供一种标签质量智能分析方法、装置、电子设备及存储介质,其主要目的在于提高金融产品的用户标签的标签质量分析准确性。
[0005]为实现上述目的,本专利技术提供的一种标签质量智能分析方法,包括:
[0006]识别待评估的标签系统的业务场景及其对应的类标签,根据所述业务场景,提取所述类标签对应的样本数据;
[0007]选取所述样本数据中具有区分度的数据 ...
【技术保护点】
【技术特征摘要】
1.一种标签质量智能分析方法,其特征在于,所述方法包括:识别待评估的标签系统的业务场景及其对应的类标签,根据所述业务场景,提取所述类标签对应的样本数据;选取所述样本数据中具有区分度的数据集作为初始特征数据集,计算所述初始特征数据集与所述类标签之间的信息增益,根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集;构建所述目标特征数据集的标签测试数据,利用训练好的标签分析模型中的标签分类器识别所述标签测试数据的预测标签;查询所述标签系统的标签质量分析指标,根据所述预测标签、所述标签测试数据,利用所述训练好的标签分析模型中的标签质量分析函数计算所述标签质量分析指标的指标得分;根据所述指标得分,计算所述标签系统中每个标签的质量评分,根据所述质量评分,生成所述标签系统的标签质量分析报告。2.如权利要求1所述的标签质量智能分析方法,其特征在于,所述计算所述初始特征数据集与所述类标签之间的信息增益包括:利用下述公式计算所述初始特征数据集与所述类标签之间的信息增益:IG(f
i
;T)=H(f
i
)+H(T)
‑
H(f
i
,T)其中,IG(f
i
;T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的信息增益,H(f
i
)表示第i个特征f
i
的信息熵,H(T)表示类标签集合T的信息熵,H(f
i
,T)表示第i个特征f
i
与类标签集合T的联合信息熵。3.如权利要求1所述的标签质量智能分析方法,其特征在于,所述根据所述信息增益,从所述初始特征数据集中选取所述类标签的目标特征数据集,包括:对所述信息增益进行归一化处理,得到归一化增益;计算所述归一化增益的均值,以所述均值作为阈值,选取不小于所述阈值对应的初始特征数据集中的特征,生成目标特征数据集。4.如权利要求1所述的标签质量智能分析方法,其特征在于,所述对所述信息增益进行归一化处理,得到归一化增益,包括:利用下述公式对信息增益的归一化处理如下述公式:其中,SU(f
i
,T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的归一化增益,IG(f
i
;T)表示初始特征数据集中第i个特征f
i
与类标签集合T之间的信息增益,H(f
i
)表示第i个特征f
i
的信息熵,H(T)表示类标签集合T的信息熵。5.如权利要求1所述的标签质量智能分析方法,其特征在于,所述标签分类器的构建,包括:其中,γ
t
表示标签分类器的第t次训练迭代权重向量,t表示标签分类器的训练...
【专利技术属性】
技术研发人员:胡立波,陈又新,孔祥成,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。