一种训练样本的生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27511766 阅读:23 留言:0更新日期:2021-03-02 18:42
本发明专利技术实施例提供了一种训练样本的生成方法、装置、计算机设备和存储介质。本发明专利技术实施例提供的技术方案中,获取噪声数据;通过指定训练模型的生成网络,根据噪声数据,生成训练样本,可以增加训练样本的数量且保证多个训练样本在多个标签之间均匀分布,从而提高训练模型的正确率。型的正确率。型的正确率。

【技术实现步骤摘要】
一种训练样本的生成方法、装置、计算机设备和存储介质


[0001]本专利技术涉及通信
,尤其涉及一种训练样本的生成方法、装置、计算机设备和存储介质。

技术介绍

[0002]目前,对于智能手机出现的问题,传统的解决方法是软件工程师凭借开发经验进行人工调试,从而解决智能手机的问题,为提高调试效率,可以采用人工智能训练出训练模型的方式调试智能手机问题。智能手机的一种重要的系统稳定性问题是应用无响应(Application Not Response,简称:ANR)问题,训练模型在解决ANR问题时,要求样本数量足够多且在多个产生原因之间均匀分布,但对于ANR问题的实际样本,多个产生原因之间的样本分布不均,目前只能对数量多的样本进行裁剪,但会导致整体样本数量偏低,从而导致训练出的训练模型的正确率较低。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种训练样本的生成方法、装置、计算机设备和存储介质,可以增加训练样本的数量且保证多个训练样本在多个标签之间均匀分布,从而提高训练模型的正确率。
[0004]一方面,本专利技术实施例提供了一种训练样本的生成方法,所述方法包括:
[0005]获取噪声数据;
[0006]通过指定训练模型的生成网络,根据噪声数据,生成训练样本。
[0007]可选地,在通过指定训练模型的生成网络,根据噪声数据,生成训练样本之后,还包括:
[0008]获取实际样本;
[0009]通过指定训练模型的判别网络,根据实际样本和训练样本,生成样本判别结果和样本标签。
[0010]可选地,生成网络包括全连接层、张量恢复层和反卷积层;
[0011]通过指定训练模型的生成网络,根据噪声数据,生成训练样本,包括:
[0012]将噪声数据输入全连接层,生成第一张量数据;
[0013]将第一张量数据输入张量恢复层进行张量恢复,得到恢复数据;
[0014]将恢复数据输入反卷积层,生成训练样本。
[0015]可选地,全连接层包括第一全连接层、激活函数和第二全连接层;
[0016]将噪声数据输入全连接层,生成第一张量数据,包括:
[0017]将噪声数据输入第一全连接层,生成第一加权特征;
[0018]根据激活函数,对第一加权特征进行计算,生成第一非线性数据;
[0019]将第一非线性数据输入第二全连接层,生成第二加权特征;
[0020]根据激活函数,对第二加权特征进行计算,生成第一张量数据。
[0021]可选地,判别网络包括激活函数、第三全连接层和第四全连接层;
[0022]通过指定训练模型的判别网络,根据实际样本和训练样本,生成样本判别结果和样本标签,包括:
[0023]根据训练样本和实际样本,生成非线性卷积函数;
[0024]将非线性卷积数据输入第三全连接层,生成第三加权特征;
[0025]根据激活函数,对第三加权特征进行计算,生成样本判别结果和第二非线性数据;
[0026]将第二非线性数据输入第四全连接层,生成第四加权特征;
[0027]根据激活函数,对第四加权特征进行计算,生成样本标签。
[0028]可选地,判别网络还包括样本转换层和卷积层;
[0029]根据训练样本和实际样本,生成非线性卷积函数,包括:
[0030]通过样本转换层,将训练样本和实际样本转换为第二张量数据;
[0031]将第二张量数据输入卷积层,生成卷积数据;
[0032]根据激活函数,对卷积数据进行计算,生成非线性卷积数据。
[0033]可选地,在通过指定训练模型的生成网络,根据噪声数据,生成训练样本之后,还包括:
[0034]获取测试样本;
[0035]根据测试样本对指定训练模型进行测试,生成测试正确率
[0036]另一方面,本专利技术实施例提供了一种训练样本的生成装置,包括:
[0037]第一获取单元,用于获取噪声数据;
[0038]第一生成单元,用于通过指定训练模型的生成网络,根据噪声数据,生成训练样本。
[0039]另一方面,本专利技术实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述训练样本的生成方法。
[0040]另一方面,本专利技术实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现上述训练样本的生成方法。
[0041]本专利技术实施例的方案中,获取噪声数据;通过指定训练模型的生成网络,根据噪声数据,生成训练样本,可以增加训练样本的数量且保证多个训练样本在多个标签之间均匀分布,从而提高训练模型的正确率。
【附图说明】
[0042]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0043]图1为本专利技术实施例提供的一种训练样本的生成方法的流程图;
[0044]图2为本专利技术实施例提供的又一种训练样本的生成方法的流程图;
[0045]图3为本专利技术实施例提供的一种训练样本的生成装置的结构示意图;
[0046]图4为本专利技术实施例提供的一种计算机设备的示意图。
【具体实施方式】
[0047]为了更好的理解本专利技术的技术方案,下面结合附图对本专利技术实施例进行详细描述。
[0048]应当明确,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0049]在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0050]应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0051]应当理解,尽管在本专利技术实施例中可能采用术语第一、第二等来描述设定阈值,但这些设定阈值不应限于这些术语。这些术语仅用来将设定阈值彼此区分开。例如,在不脱离本专利技术实施例范围的情况下,第一设定阈值也可以被称为第二设定阈值,类似地,第二设定阈值也可以被称为第一设定阈值。
[0052]图1为本专利技术实施例提供的一种训练样本的生成方法的流程图,如图1所示,该方法包括:
[0053]步骤101、获取噪声数据。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本的生成方法,其特征在于,所述方法包括:获取噪声数据;通过指定训练模型的生成网络,根据所述噪声数据,生成训练样本。2.根据权利要求1所述的方法,其特征在于,在所述通过指定训练模型的生成网络,根据所述噪声数据,生成训练样本之后,还包括:获取实际样本;通过指定训练模型的判别网络,根据所述实际样本和所述训练样本,生成样本判别结果和样本标签。3.根据权利要求1所述的方法,其特征在于,所述生成网络包括全连接层、张量恢复层和反卷积层;所述通过指定训练模型的生成网络,根据所述噪声数据,生成训练样本,包括:将所述噪声数据输入所述全连接层,生成第一张量数据;将所述第一张量数据输入所述张量恢复层进行张量恢复,得到恢复数据;将所述恢复数据输入所述反卷积层,生成所述训练样本。4.根据权利要求3所述的方法,其特征在于,所述全连接层包括第一全连接层、激活函数和第二全连接层;所述将所述噪声数据输入所述全连接层,生成第一张量数据,包括:将所述噪声数据输入所述第一全连接层,生成第一加权特征;根据所述激活函数,对所述第一加权特征进行计算,生成第一非线性数据;将所述第一非线性数据输入所述第二全连接层,生成第二加权特征;根据所述激活函数,对所述第二加权特征进行计算,生成第一张量数据。5.根据权利要求2所述的方法,其特征在于,所述判别网络包括激活函数、第三全连接层和第四全连接层;所述通过指定训练模型的判别网络,根据所述实际样本和所述训练样本,生成样本判别结果和样本标签,包括:根据所述训练样本和所述实际样本,生成非线性卷积函数;将所述非...

【专利技术属性】
技术研发人员:郭为
申请(专利权)人:北京紫光展锐通信技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1