System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 行业特征构建方法、装置、存储介质及电子设备制造方法及图纸_技高网

行业特征构建方法、装置、存储介质及电子设备制造方法及图纸

技术编号:41789133 阅读:1 留言:0更新日期:2024-06-24 20:16
本申请公开了一种行业特征构建方法、装置、存储介质及电子设备,涉及信息技术领域。其中方法包括:获取针对不同用户的多条文本信息,以及目标行业的正样本用户;对所述多条文本信息进行聚类,得到不同类型的文本信息;确定每种类型的文本信息对应的模板特征;根据所述模板特征和所述正样本用户,确定所述模板特征对应的重要度;基于所述重要度,从多个所述模板特征中筛选出所述目标行业对应的行业特征。本申请能够提高行业特征构建的效率和准确性。

【技术实现步骤摘要】

本申请涉及信息,尤其是涉及到一种行业特征构建方法、装置、存储介质及电子设备


技术介绍

1、在新用户挖掘或存量用户激活这个业务领域,涉及到的行业十分广泛,常见的有贷款、信用卡、保险、教育、电商、理财等行业,每个行业下还会有很多细分的子行业。每个子行业所关注的意向客群之间,有很大的差异。

2、目前,为了得到精准的意向客群,通常需要基于行业认知加工行业特征,之后使用正负样本训练机器学习模型。然而,这种方式过于依赖操作人员的行业认知,难以高效、准确地构建行业特征,而一旦构建的特征和具体行业不相关,则难以取得预期效果。


技术实现思路

1、有鉴于此,本申请提供了一种行业特征构建方法、装置、存储介质及电子设备,主要目的在于能够提高行业特征构建的效率和准确性。

2、依据本申请的第一方面,提供了一种行业特征构建方法,该方法包括:

3、获取针对不同用户的多条文本信息,以及目标行业的正样本用户;

4、对所述多条文本信息进行聚类,得到不同类型的文本信息;

5、确定每种类型的文本信息对应的模板特征;

6、根据所述模板特征和所述正样本用户,确定所述模板特征对应的重要度;

7、基于所述重要度,从多个所述模板特征中筛选出所述目标行业对应的行业特征。

8、依据本申请的第二方面,提供了一种行业特征构建装置,该装置包括:

9、获取单元,用于获取针对不同用户的多条文本信息,以及目标行业的正样本用户;

10、聚类单元,用于对所述多条文本信息进行聚类,得到不同类型的文本信息;

11、第一确定单元,用于确定每种类型的文本信息对应的模板特征;

12、第二确定单元,用于根据所述模板特征和所述正样本用户,确定所述模板特征对应的重要度;

13、筛选单元,用于基于所述重要度,从多个所述模板特征中筛选出所述目标行业对应的行业特征。

14、依据本申请的第三方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述行业特征构建方法。

15、依据本申请的第四方面,提供了一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述行业特征构建方法。

16、借由上述技术方案,本申请提供的一种行业特征构建方法、装置、存储介质及电子设备,与目前现有技术相比,本申请通过确定每种类型的文本信息对应的模板特征,并评估每个模板特征对于正样本用户的重要度,能够筛选出高重要度的模板特征作为行业特征,从而能够完全不依赖于行业认知构建行业特征,进而能够提高行业特征构建的效率和准确性。

17、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种行业特征构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述多条文本信息进行聚类,得到不同类型的文本信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述处理后的多条文本信息进行聚类,得到所述不同类型的文本信息,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述模板特征和所述正样本用户,确定所述模板特征对应的重要度,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述模板特征和所述正样本用户的标识信息,确定所述模板特征所覆盖的正样本用户数量,包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述基于所述重要度,从多个所述模板特征中筛选出所述目标行业对应的行业特征,包括:

8.一种行业特征构建装置,其特征在于,包括:

9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。

10.一种电子设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。

...

【技术特征摘要】

1.一种行业特征构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述多条文本信息进行聚类,得到不同类型的文本信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述处理后的多条文本信息进行聚类,得到所述不同类型的文本信息,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述模板特征和所述正样本用户,确定所述模板特征对应的重要度,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述模板特征和所述正样本...

【专利技术属性】
技术研发人员:林连升
申请(专利权)人:大箴杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1