System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 标签生成方法、标签生成系统、存储介质及程序产品技术方案_技高网

标签生成方法、标签生成系统、存储介质及程序产品技术方案

技术编号:44264490 阅读:2 留言:0更新日期:2025-02-14 22:08
本公开提供一种标签生成方法、标签生成系统、存储介质及计算机程序产品。该方法包括:获取无标签数据集,无标签数据集包括多个特定特征和每个特定特征各自对应的无标签特征值;根据无标签数据集中包含的多个特定特征匹配无标签对象对应的标签生成决策树,标签生成决策树包括第1个至第n个特定特征的标签生成阈值,第1个至第n个特定特征对应的最大加权信息增益率递减;采用第i个特定特征的标签生成阈值对第i个特定特征对应的无标签特征值进行标签匹配,生成第i标签或第i传递指令,i=1,2,……n‑2;以及响应于第i传递指令,采用第i+1个特定特征的标签生成阈值对第i+1个特定特征对应的无标签特征值进行标签匹配,生成第i+1标签或第i+1传递指令。

【技术实现步骤摘要】

本公开涉及计算机,本公开尤其涉及一种标签生成方法、标签生成系统、存储介质及计算机程序产品。


技术介绍

1、在与商家交易的业务场景中,业务人员会收集商家的诸如经营数据、交易记录、财务数据等数据信息,通过分析商家的数据信息得到该商家的评价作为该商家的标签。如此,一方面可以通过商家的标签直观地得到商家的特点,另一方面可以便于筛选具有相同标签的商家。

2、然而,人工分析数据信息得到商家的标签的方式效率较为低下,需要消耗大量的人力资源。且每个人的评价标准不同,得到标签的评价依据具有主观性,缺乏统一且客观的评价标准。


技术实现思路

1、为了解决上述技术问题之一,本公开提供了一种标签生成方法、标签生成系统、存储介质及计算机程序产品。

2、本公开第一方面提供了一种标签生成方法,包括:获取无标签对象的无标签数据集,所述无标签数据集包括多个特定特征和每个所述特定特征各自对应的无标签特征值;根据所述无标签数据集中包含的多个所述特定特征匹配所述无标签对象对应的标签生成决策树,所述无标签对象对应的标签生成决策树包括第1个至第n个所述特定特征的标签生成阈值,第1个至第n个所述特定特征对应的所述最大加权信息增益率递减;采用第i个所述特定特征的标签生成阈值对第i个所述特定特征对应的无标签特征值进行标签匹配,生成第i标签或第i传递指令,i=1,2,……n-2;以及响应于所述第i传递指令,采用第i+1个所述特定特征的标签生成阈值对第i+1个所述特定特征对应的无标签特征值进行标签匹配,生成第i+1标签或第i+1传递指令;其中,所述特定特征的所述最大加权信息增益率,是有标签数据集中的所述特定特征的权重值与有标签数据集中的所述特定特征的信息增益率之积的最大值;所述特定特征的信息增益率被配置为:计算有标签信息增益与有标签分裂信息之间的比值得到;所述有标签信息增益是有标签数据集中的所述特定特征的信息增益,所述已评估分裂是有标签数据集中的所述特定特征的分裂信息。

3、至少一种可选的实施方式中,获取无标签对象的无标签数据集,包括:获取所述无标签对象的初始数据集,所述无标签数据集包括多个特定特征和每个所述特定特征各自对应的初始特征值;以及分别对各个所述初始特征值进行数据归一化处理,将归一化后的所述初始特征值设置为对应的所述特定特征的所述无标签特征值。

4、至少一种可选的实施方式中,所述特定特征的权重值被配置为:计算单项有标签差异系数与有标签差异系数总和之间的比值得到;其中,所述单项有标签差异系数为1-ej,ej是所述有标签数据集中的第j项所述特定特征的信息熵,j=1,2,……n,所述有标签差异系数总和是所述有标签数据集中的各项所述特定特征对应的所述单项有标签差异系数的总和。

5、至少一种可选的实施方式中,所述有标签数据集包括多个有标签对象各自对应的参考标签、和各个所述有标签对象在多个所述特定特征各自对应的有标签特征值;第i个所述特定特征的标签生成阈值被配置为:分别计算有标签数据集中的各个所述有标签对象在第i个所述特定特征的所述有标签特征值的加权信息增益率,并将最大加权信息增益率对应的所述有标签特征值设置为第i个所述特定特征的标签生成阈值;第i标签被配置为:在多个所述有标签对象中获取第i参照对象,并将所述第i参照对象对应的参考标签作为第i标签;其中,所述第i参照对象是第i个所述特定特征的所述有标签特征值大于第i个所述特定特征的标签生成阈值,且第i-1个所述特定特征的所述有标签特征值小于或等于第i-1个所述特定特征的标签生成阈值的所述有标签对象。

6、至少一种可选的实施方式中,采用第i个所述特定特征的标签生成阈值对第i个所述特定特征对应的无标签特征值进行标签匹配,生成第i标签或第i传递指令,包括:比较第i个所述特定特征的标签生成阈值与第i个所述特定特征对应的无标签特征值之间的大小;响应于第i个所述特定特征对应的无标签特征值大于第i个所述特定特征的标签生成阈值,生成所述第i标签;以及响应于第i个所述特定特征对应的无标签特征值小于或等于第i个所述特定特征的标签生成阈值,生成所述第i传递指令。

7、至少一种可选的实施方式中,标签生成方法还包括:响应于所述第n-1传递指令,比较第n个所述特定特征的标签生成阈值与第n个所述特定特征对应的无标签特征值之间的大小;响应于第n个所述特定特征对应的无标签特征值大于第n个所述特定特征的标签生成阈值,生成所述第n标签;以及响应于第n个所述特定特征对应的无标签特征值小于或等于第n个所述特定特征的标签生成阈值,生成所述第n+1标签;其中,第n标签被配置为:在多个所述有标签对象中获取第n参照对象,并将所述第n参照对象对应的参考标签作为第n标签;所述第n参照对象是第n个所述特定特征的所述有标签特征值大于第n个所述特定特征的标签生成阈值,且第n-1个所述特定特征的所述有标签特征值小于或等于第n-1个所述特定特征的标签生成阈值的所述有标签对象;第n+1标签被配置为:在多个所述有标签对象中获取第n+1参照对象,并将所述第n+1参照对象对应的参考标签作为第n+1标签;所述第n+1参照对象是第n个所述特定特征的所述有标签特征值小于第n个所述特定特征的标签生成阈值的标签生成阈值的所述有标签对象。

8、至少一种可选的实施方式中,所述无标签对象的无标签数据集,包括所述无标签对象在多个特定时间节点分别对应的所述无标签数据集;所述标签,包括所述无标签对象在多个所述特定时间节点分别对应的所述无标签数据集的所述标签;所述标签生成方法还包括:输出所述无标签对象的标签变化视图,所述标签变化视图表征所述无标签对象的多个所述标签在多个所述特定时间节点的变化趋势。

9、本公开第二方面提供了一种标签生成系统,包括处理器和存储器,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,所述处理器执行以下过程:获取无标签对象的无标签数据集,所述无标签数据集包括多个特定特征和每个所述特定特征各自对应的无标签特征值;根据所述无标签数据集中包含的多个所述特定特征匹配所述无标签对象对应的标签生成决策树,所述无标签对象对应的标签生成决策树包括第1个至第n个所述特定特征的标签生成阈值,第1个至第n个所述特定特征对应的所述最大加权信息增益率递减;采用第i个所述特定特征的标签生成阈值对第i个所述特定特征对应的无标签特征值进行标签匹配,生成第i标签或第i传递指令,i=1,2,……n-2;以及响应于所述第i传递指令,采用第i+1个所述特定特征的标签生成阈值对第i+1个所述特定特征对应的无标签特征值进行标签匹配,生成第i+1标签或第i+1传递指令;其中,所述特定特征的所述最大加权信息增益率,是有标签数据集中的所述特定特征的权重值与有标签数据集中的所述特定特征的信息增益率之积的最大值;所述特定特征的信息增益率被配置为:计算有标签信息增益与有标签分裂信息之间的比值得到;所述有标签信息增益是有标签数据集中的所述特定特征的信息增益,所述已评估分裂是有标签数据集中的所述特定特征的分裂信息。

...

【技术保护点】

1.一种标签生成方法,其特征在于,包括:

2.根据权利要求1所述的标签生成方法,其特征在于,获取无标签对象的无标签数据集,包括:

3.根据权利要求1所述的标签生成方法,其特征在于,所述特定特征的权重值被配置为:计算单项有标签差异系数与有标签差异系数总和之间的比值得到;

4.根据权利要求1所述的标签生成方法,其特征在于,所述有标签数据集包括多个有标签对象各自对应的参考标签、和各个所述有标签对象在多个所述特定特征各自对应的有标签特征值;

5.根据权利要求1所述的标签生成方法,其特征在于,采用第i个所述特定特征的标签生成阈值对第i个所述特定特征对应的无标签特征值进行标签匹配,生成第i标签或第i传递指令,包括:

6.根据权利要求1所述的标签生成方法,其特征在于,还包括:

7.根据权利要求1所述的标签生成方法,其特征在于,所述无标签对象的无标签数据集,包括所述无标签对象在多个特定时间节点分别对应的所述无标签数据集;所述标签,包括所述无标签对象在多个所述特定时间节点分别对应的所述无标签数据集的所述标签;所述标签生成方法还包括:

8.一种标签生成系统,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,所述处理器执行如权利要求1至7任一项所述的标签生成方法。

9.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现如权利要求1至7任一项所述的标签生成方法。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时至少用于实现如权利要求1至7任一项述的标签生成方法。

...

【技术特征摘要】

1.一种标签生成方法,其特征在于,包括:

2.根据权利要求1所述的标签生成方法,其特征在于,获取无标签对象的无标签数据集,包括:

3.根据权利要求1所述的标签生成方法,其特征在于,所述特定特征的权重值被配置为:计算单项有标签差异系数与有标签差异系数总和之间的比值得到;

4.根据权利要求1所述的标签生成方法,其特征在于,所述有标签数据集包括多个有标签对象各自对应的参考标签、和各个所述有标签对象在多个所述特定特征各自对应的有标签特征值;

5.根据权利要求1所述的标签生成方法,其特征在于,采用第i个所述特定特征的标签生成阈值对第i个所述特定特征对应的无标签特征值进行标签匹配,生成第i标签或第i传递指令,包括:

6.根据权利要求1所述的标签生成方法,其特征在于,还包括:

7.根据权利要...

【专利技术属性】
技术研发人员:杨佳文
申请(专利权)人:贝壳找房北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1