一种语音分类方法、系统、电子设备以及存储介质技术方案

技术编号:38584788 阅读:9 留言:0更新日期:2023-08-26 23:27
本申请提供了一种语音分类方法、系统、电子设备以及存储介质,所述方法包括:获取已标注语音数据和未标注语音数据;将已标注语音数据和未标注语音数据转换为各自对应的特征向量;根据通过转换得到的各个特征向量,生成全局特征表示集合和局部特征表示集合;将全局特征表示集合和局部特征表示集合,输入预先经过半监督训练的语音分类模型,根据语音分类模型输出的语音分类结果,对未标注语音数据进行标注。本申请通过将已标注语音数据的标签信息传递至未标注语音数据,进而可以获得大量的已标注语音数据,无需通过人工标注来获得大量已标注语音数据,不仅降低了人工标注的成本,而且未标注语音数据得到利用,提高了未标记语音数据资源的利用率。据资源的利用率。据资源的利用率。

【技术实现步骤摘要】
一种语音分类方法、系统、电子设备以及存储介质


[0001]本申请涉及语音分类
,特别是一种语音分类方法、系统、电子设备以及存储介质。

技术介绍

[0002]目前,在机器学习和数据挖掘中,要训练一个良好的语音分类模型,通常需要大量的语音标注数据。但是,获取这些语音标注数据往往需要专业人士的标注,不仅耗时而且成本较高。仅依靠昂贵的语音标注数据而不充分利用大量廉价的未标注的语音数据,不仅造成了数据资源的浪费,而且训练成本高。
[0003]针对上述问题,本申请提出了一种语音分类方法。

技术实现思路

[0004]鉴于上述问题,本申请实施例提供了一种语音分类方法、系统、电子设备以及存储介质,以解决现有技术中,在进行语音分类模型训练时,仅依靠昂贵的语音标注数据而不充分利用大量廉价的未标注的语音数据,造成的数据资源的浪费以及训练成本高的问题。
[0005]本申请实施例第一方面,提供了一种语音分类方法,所述方法包括:
[0006]获取已标注语音数据和未标注语音数据;
[0007]将所述已标注语音数据和所述未标注语音数据转换为各自对应的特征向量;
[0008]根据通过转换得到的各个特征向量,生成全局特征表示集合和局部特征表示集合,所述全局特征表示集合中的元素用于表征任两个所述特征向量之间的相似度,所述局部特征表示集合中的元素用于表征每个所述特征向量与其他多个所述特征向量之间的相似度;
[0009]将所述全局特征表示集合和所述局部特征表示集合,输入预先经过半监督训练的语音分类模型,根据所述语音分类模型输出的语音分类结果,对所述未标注语音数据进行标注。
[0010]可选地,所述根据通过转换得到的各个特征向量,生成全局特征表示集合,包括:
[0011]计算每两个所述特征向量之间的相似度;
[0012]将每两个所述特征向量之间的相似度确定为所述全局特征表示集合中的一个元素,得到全局特征表示集合。
[0013]可选地,所述根据通过转换得到的各个特征向量,生成全局特征表示集合,包括:
[0014]按照L1范数方式,计算每两个所述特征向量之间的相似度;
[0015]以每个所述特征向量为节点,以每两个所述特征向量之间的相似度为边权重,构建L1范数图。
[0016]可选地,所述根据通过转换得到的各个特征向量,生成局部特征表示集合,包括:
[0017]针对每个所述特征向量,按照相似度从大到小的顺序,将与该特征向量之间的相似度排前K的K个特征向量,确定为该所述特征向量的K个近邻特征向量,K为大于1的整数;
[0018]将每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度确定为所述局部特征表示集合中的一个元素,得到局部特征表示集合。
[0019]可选地,所述根据通过转换得到的各个特征向量,生成局部特征表示集合,包括:
[0020]按照K近邻方式,计算每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度;
[0021]以每个所述特征向量以及该特征向量的K个近邻特征向量分别为节点,以每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度为边权重,构建K近邻图。
[0022]可选地,所述将所述全局特征表示集合和所述局部特征表示集合,输入预先经过半监督训练的语音分类模型,根据所述语音分类模型输出的语音分类结果,对所述未标注语音数据进行标注,包括:
[0023]按照所述局部特征表示集合对应的权重,对所述全局特征表示集合和所述局部特征表示集合进行加权融合,得到融合特征表示集合;
[0024]将所述融合特征表示集合输入预先经过半监督训练的语音分类模型,得到语音分类结果,并根据所述语音分类结果,对所述未标注语音数据进行标注。
[0025]可选地,所述将所述已标注语音数据和所述未标注语音数据转换为各自对应的特征向量,包括:
[0026]对所述已标注语音数据和所述未标注语音数据进行MFCC特征提取,得到所述已标注语音数据和所述未标注语音数据各自对应的特征向量;或
[0027]将所述已标注语音数据和所述未标注语音数据输入预先训练的特征提取模型,得到所述已标注语音数据和所述未标注语音数据各自对应的特征向量。
[0028]本申请实施例第二方面,提供了一种语音分类系统,所述系统包括:
[0029]获取模块,用于获取已标注语音数据和未标注语音数据;
[0030]转换模块,用于将所述已标注语音数据和所述未标注语音数据转换为各自对应的特征向量;
[0031]生成模块,根据通过转换得到的各个特征向量,生成全局特征表示集合和局部特征表示集合,所述全局特征表示集合中的元素用于表征任两个所述特征向量之间的相似度,所述局部特征表示集合中的元素用于表征每个所述特征向量与其他多个所述特征向量之间的相似度;
[0032]输入模块,用于将所述全局特征表示集合和所述局部特征表示集合,输入预先经过半监督训练的语音分类模型,根据所述语音分类模型输出的语音分类结果,对所述未标注语音数据进行标注。
[0033]可选地,所述根据通过转换得到的各个特征向量,生成全局特征表示集合,所述生成模块,包括:
[0034]第一计算子模块,用于计算每两个所述特征向量之间的相似度;
[0035]获得子模块,用于将每两个所述特征向量之间的相似度确定为所述全局特征表示集合中的一个元素,得到全局特征表示集合。
[0036]可选地,所述根据通过转换得到的各个特征向量,生成全局特征表示集合,所述生成模块,包括:
[0037]第二计算子模块,用于按照L1范数方式,计算每两个所述特征向量之间的相似度;
[0038]第一构建子模块,用于以每个所述特征向量为节点,以每两个所述特征向量之间的相似度为边权重,构建L1范数图。
[0039]可选地,所述根据通过转换得到的各个特征向量,生成局部特征表示集合,所述生成模块,包括:
[0040]第一确定子模块,用于针对每个所述特征向量,按照相似度从大到小的顺序,将与该特征向量之间的相似度排前K的K个特征向量,确定为该所述特征向量的K个近邻特征向量,K为大于1的整数;
[0041]第二获得子模块,用于将每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度确定为所述局部特征表示集合中的一个元素,得到局部特征表示集合。
[0042]可选地,所述根据通过转换得到的各个特征向量,生成局部特征表示集合,所述生成模块,包括:
[0043]第三计算子模块,用于按照K近邻方式,计算每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度;
[0044]第二构建子模块,用于以每个所述特征向量以及该特征向量的K个近邻特征向量分别为节点,以每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度为边权重,构建K近邻图。
[0045]可选地,所述将所述全局特征表示集合和所述局部特征表示集合,输入预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音分类方法,其特征在于,所述方法包括:获取已标注语音数据和未标注语音数据;将所述已标注语音数据和所述未标注语音数据转换为各自对应的特征向量;根据通过转换得到的各个特征向量,生成全局特征表示集合和局部特征表示集合,所述全局特征表示集合中的元素用于表征任两个所述特征向量之间的相似度,所述局部特征表示集合中的元素用于表征每个所述特征向量与其他多个所述特征向量之间的相似度;将所述全局特征表示集合和所述局部特征表示集合,输入预先经过半监督训练的语音分类模型,根据所述语音分类模型输出的语音分类结果,对所述未标注语音数据进行标注。2.根据权利要求1所述的语音分类方法,其特征在于,所述根据通过转换得到的各个特征向量,生成全局特征表示集合,包括:计算每两个所述特征向量之间的相似度;将每两个所述特征向量之间的相似度确定为所述全局特征表示集合中的一个元素,得到全局特征表示集合。3.根据权利要求1所述的语音分类方法,其特征在于,所述根据通过转换得到的各个特征向量,生成全局特征表示集合,包括:按照L1范数方式,计算每两个所述特征向量之间的相似度;以每个所述特征向量为节点,以每两个所述特征向量之间的相似度为边权重,构建L1范数图。4.根据权利要求1所述的语音分类方法,其特征在于,所述根据通过转换得到的各个特征向量,生成局部特征表示集合,包括:针对每个所述特征向量,按照相似度从大到小的顺序,将与该特征向量之间的相似度排前K的K个特征向量,确定为该所述特征向量的K个近邻特征向量,K为大于1的整数;将每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度确定为所述局部特征表示集合中的一个元素,得到局部特征表示集合。5.根据权利要求1所述的语音分类方法,其特征在于,所述根据通过转换得到的各个特征向量,生成局部特征表示集合,包括:按照K近邻方式,计算每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度;以每个所述特征向量以及该特征向量的K个近邻特征向量分别为节点,以每个所述特征向量与该特征向量的K个近邻特征向量之间的相似度为边权重,构建K近邻图。6....

【专利技术属性】
技术研发人员:张云斌
申请(专利权)人:长城汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1