样本生成方法、装置、终端设备及计算机可读存储介质制造方法及图纸

技术编号:35266015 阅读:18 留言:0更新日期:2022-10-19 10:28
本申请提供一种样本生成方法、装置、终端设备及计算机可读存储介质,该方法包括:获取初始样本集,初始样本集中每个样本具有属性标签;根据每个样本的属性标签,从初始样本集中确定具有目标属性标签的目标样本;根据预设的关联关系,获取目标样本的第一生成样本;对目标属性标签进行相关分析,确定与目标属性标签的相关属性标签以及与相关属性标签对应的第二生成样本;根据目标样本、第一生成样本和第二生成样本,生成实际关联样本。本申请提供的样本生成方法,可以将样本自身的关联样本以及样本标签的关联标签所对应的额外的关联样本进行结合,提高了样本数据的关联分类的效果,从侧面提高了管理的效率。从侧面提高了管理的效率。从侧面提高了管理的效率。

【技术实现步骤摘要】
样本生成方法、装置、终端设备及计算机可读存储介质


[0001]本申请涉及金融领域,具体涉及一种样本生成方法、装置、终端设备及计算机可读存储介质。

技术介绍

[0002]目前,随着银行产品和服务的差异性越来越小,银行业务已由传统的粗放式经营模式发展为以科技、数据驱动的精细化管理模式。现有的管理体系依赖信息库中记录的客户基础信息、行为数据、交易数据等各种数据。然而,现有技术中,对数据样本进行管理时,会对相应的数据进行简单的标签化,通过标签进行简单的条件组合分类,以生成用于管理的样本数据。
[0003]然而,在银行系统中需要管理众多且复杂的数据,仅靠单一的标签化生成的样本数据缺乏精确度。因此,在各类数据日益增多的情况下,对样本数据简单的标签化无法满足各个复杂业务场景下的差异化的管理需求。因此,现有的、单一的、标签化的样本数据的生成方式不能满足具体的管理需求。

技术实现思路

[0004]本申请提供了一种样本生成方法,在标签化的基础之上,再进行关联生成,提高了分类效果。
[0005]第一方面,本申请提供了一种样本生成方法,所述方法包括:
[0006]获取初始样本集,所述初始样本集中每个样本具有属性标签;
[0007]根据每个样本的属性标签,从所述初始样本集中确定具有目标属性标签的目标样本;
[0008]根据预设的关联关系,获取所述目标样本的第一生成样本;
[0009]对所述目标属性标签进行相关分析,确定与所述目标属性标签的相关属性标签以及与所述相关属性标签对应的第二生成样本;
[0010]根据所述目标样本、所述第一生成样本和所述第二生成样本,生成实际关联样本。
[0011]在本申请一些实施例中,所述对所述目标属性标签进行相关分析,确定与所述目标属性标签的相关属性标签以及与所述相关属性标签对应的第二生成样本,包括:
[0012]对所述目标属性标签进行拆解分析,得到所述目标属性标签的子属性标签,所述目标属性标签包括所述子属性标签;
[0013]对所述目标属性标签进行近似分析,得到所述目标属性标签的近似属性标签,所述相关属性标签包括子属性标签以及近似属性标签;
[0014]根据所述子属性标签,从所述初始样本集得到所述子属性标签对应的相关样本;
[0015]根据所述近似属性标签,从所述初始样本集得到所述近似属性标签对应的近似样本,所述相关样本和所述近似样本为所述第二生成样本。
[0016]在本申请一些实施例中,所述根据所述子属性标签,从所述初始样本集得到所述
子属性标签对应的相关样本,包括:
[0017]根据所述子属性标签,从所述初始样本集得到初始相关样本;
[0018]计算所述初始相关样本与所述目标属性标签的相似度,一个初始相关样本对应一个相似度;
[0019]根据所述相似度,对初始相关样本进行排序,得到排序后的初始相关样本;
[0020]根据预设的排序阈值,从排序后的初始相关样本中,确定得到相关样本。
[0021]在本申请一些实施例中,所述根据所述相似度,对初始相关样本进行排序,得到排序后的初始相关样本,包括:
[0022]根据所述相似度的数值,进行递减排序,得到递减排序的初始相关样本。
[0023]在本申请一些实施例中,所述对所述目标属性标签进行近似分析,得到所述目标属性标签的近似属性标签,包括:
[0024]将所述目标属性标签转化为目标词向量;
[0025]计算所述目标词向量相似的相似词向量;
[0026]从所述初始样本集中确定所述相似词向量对应的近似属性标签。
[0027]在本申请一些实施例中,所述根据所述近似属性标签,从所述初始样本集得到所述近似属性标签对应的近似样本,包括:
[0028]若所述近似属性标签为多个,对所述近似属性标签进行聚类分析,得到与所述目标属性标签的匹配近似属性标签;
[0029]从所述初始样本集中确定所述匹配近似属性标签对应的近似样本。
[0030]在本申请一些实施例中,所述根据所述目标样本、所述第一生成样本和所述第二生成样本,生成实际关联样本,包括:
[0031]合并所述目标样本、所述第一生成样本、所述相关样本和所述近似样本,得到合并样本;
[0032]过滤所述合并样本中的重复样本,生成所述实际关联样本。
[0033]第二方面,本申请还提供了一种样本生成装置,所述装置包括:
[0034]第一获取模块,用于获取初始样本集,所述初始样本集中每个样本具有属性标签;
[0035]第一确定模块,用于根据每个样本的属性标签,从所述初始样本集中确定具有目标属性标签的目标样本;
[0036]第二获取模块,用于根据预设的关联关系,获取所述目标样本的第一生成样本;
[0037]第二确定模块,用于对所述目标属性标签进行相关分析,确定与所述目标属性标签的相关属性标签以及与所述相关属性标签对应的第二生成样本;
[0038]生成模块,用于根据所述目标样本、所述第一生成样本和所述第二生成样本,生成实际关联样本。
[0039]在本申请一些实施例中,所述第二确定模块具体用于:
[0040]对所述目标属性标签进行拆解分析,得到所述目标属性标签的子属性标签,所述目标属性标签包括所述子属性标签;
[0041]对所述目标属性标签进行近似分析,得到所述目标属性标签的近似属性标签,所述相关属性标签包括子属性标签以及近似属性标签;
[0042]根据所述子属性标签,从所述初始样本集得到所述子属性标签对应的相关样本;
[0043]根据所述近似属性标签,从所述初始样本集得到所述近似属性标签对应的近似样本,所述相关样本和所述近似样本为所述第二生成样本。
[0044]在本申请一些实施例中,所述第二确定模块具体还用于:
[0045]根据所述子属性标签,从所述初始样本集得到初始相关样本;
[0046]计算所述初始相关样本与所述目标属性标签的相似度,一个初始相关样本对应一个相似度;
[0047]根据所述相似度,对初始相关样本进行排序,得到排序后的初始相关样本;
[0048]根据预设的排序阈值,从排序后的初始相关样本中,确定得到相关样本。
[0049]在本申请一些实施例中,所述第二确定模块具体还用于:
[0050]根据所述相似度的数值,进行递减排序,得到递减排序的初始相关样本。
[0051]在本申请一些实施例中,所述第二确定模块具体还用于:
[0052]将所述目标属性标签转化为目标词向量;
[0053]计算所述目标词向量相似的相似词向量;
[0054]从所述初始样本集中确定所述相似词向量对应的近似属性标签。
[0055]在本申请一些实施例中,所述第二确定模块具体还用于:
[0056]若所述近似属性标签为多个,对所述近似属性标签进行聚类分析,得到与所述目标属本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本生成方法,其特征在于,所述方法包括:获取初始样本集,所述初始样本集中每个样本具有属性标签;根据每个样本的属性标签,从所述初始样本集中确定具有目标属性标签的目标样本;根据预设的关联关系,获取所述目标样本的第一生成样本;对所述目标属性标签进行相关分析,确定与所述目标属性标签的相关属性标签以及与所述相关属性标签对应的第二生成样本;根据所述目标样本、所述第一生成样本和所述第二生成样本,生成实际关联样本。2.根据权利要求1所述的样本生成方法,其特征在于,所述对所述目标属性标签进行相关分析,确定与所述目标属性标签的相关属性标签以及与所述相关属性标签对应的第二生成样本,包括:对所述目标属性标签进行拆解分析,得到所述目标属性标签的子属性标签,所述目标属性标签包括所述子属性标签;对所述目标属性标签进行近似分析,得到所述目标属性标签的近似属性标签,所述相关属性标签包括子属性标签以及近似属性标签;根据所述子属性标签,从所述初始样本集得到所述子属性标签对应的相关样本;根据所述近似属性标签,从所述初始样本集得到所述近似属性标签对应的近似样本,所述相关样本和所述近似样本为所述第二生成样本。3.根据权利要求2所述的样本生成方法,其特征在于,所述根据所述子属性标签,从所述初始样本集得到所述子属性标签对应的相关样本,包括:根据所述子属性标签,从所述初始样本集得到初始相关样本;计算所述初始相关样本与所述目标属性标签的相似度,一个初始相关样本对应一个相似度;根据所述相似度,对初始相关样本进行排序,得到排序后的初始相关样本;根据预设的排序阈值,从排序后的初始相关样本中,确定得到相关样本。4.根据权利要求3所述的样本生成方法,其特征在于,所述根据所述相似度,对初始相关样本进行排序,得到排序后的初始相关样本,包括:根据所述相似度的数值,进行递减排序,得到递减排序的初始相关样本。5.根据权利要求2所述的样本生成方法,其特征在于,所述对所述目...

【专利技术属性】
技术研发人员:刘文渊
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1