多标签语音活动检测方法、装置及存储介质制造方法及图纸

技术编号:28493605 阅读:12 留言:0更新日期:2021-05-19 22:21
本发明专利技术涉及一种人工智能,揭露一种多标签语音活动检测方法,包括:基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据;根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据,确定含噪特征数据;基于所述含噪特征数据训练神经网络模型,直至所述神经网络模型收敛在预设范围内,形成语音活动检测模型;基于所述语音活动检测模型对待检测语音信号进行检测,以获取与所述待检测语音信号对应的输出标签。本发明专利技术可以提高语音活动检测的效率和准确度。动检测的效率和准确度。动检测的效率和准确度。

【技术实现步骤摘要】
多标签语音活动检测方法、装置及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种多标签语音活动检测的方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能和计算机技术的快速发展,大企业的人工客服电话系统已开始逐渐升级为智能客服系统,由语音对话系统与用户进行对话沟通,解决用户问题,同时降低企业客服人力成本,提高效率。
[0003]然而,在智能客服语音对话系统中,各种生活场景的噪音,包含稳态噪声,冲击噪声,非稳态噪声及非相干的多人说话干扰噪声等,在很大程度上影响了智能语音系统中语音识别的准确度,影响正常的交互和用户体验。目前,在语音识别过程中,构建有效的语音活动检测模型和语音降噪算法,可改善上述情况。
[0004]但是,传统的语音活动检测算法多采用能量,过零率或其他语音特征,并辅以分类模型进行检测,在真实的噪声场景下,其鲁棒性较差。同时,对于语音降噪算法而言,传统或者深度学习的语音降噪算法,对于不同的噪声参数和泛化能力不同,使用同一参数,对于失配场景降噪失效,反而影响到语音识别的准确度。

技术实现思路

[0005]本专利技术提供一种多标签语音活动检测方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决传统语音活动检测方式存在的鲁棒性差、检测准确度低等问题。
[0006]为实现上述目的,本专利技术提供的一种多标签语音活动检测方法,包括:
[0007]基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据;
[0008]根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据,确定含噪特征数据;
[0009]基于所述含噪特征数据训练神经网络模型,直至所述神经网络模型收敛在预设范围内,形成语音活动检测模型;
[0010]基于所述语音活动检测模型对待检测语音信号进行检测,以获取与所述待检测语音信号对应的输出标签。
[0011]可选地,基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据的过程包括:
[0012]获取包含有标注和无标注的噪声种子模型的训练数据;
[0013]基于所述训练数据训练噪声分类模型,直至所述噪声分类模型收敛至预设范围内,形成所述噪声种子模型;
[0014]通过所述噪声种子模型从预设无标注数据中筛选噪声数据;
[0015]对筛选出的噪声数据添加对应的噪声标签,形成所述有标注噪声数据。
[0016]可选地,所述根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数
据,确定含噪特征数据的过程包括:
[0017]根据预设比例确定所述预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据的数据量占比;
[0018]对所述预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据进行混响及加噪处理,以获取所述含噪特征数据。
[0019]可选地,所述基于所述含噪特征数据训练多层一维卷积模型,直至所述多层一维卷积模型收敛在预设范围内,形成语音活动检测模型的过程包括:
[0020]提取所述含噪特征数据的特征信息;
[0021]基于所述特征信息训练多层一维卷积模型,直至所述多层一维卷积模型收敛在预设范围内,形成所述语音活动检测模型。
[0022]可选地,所述提取所述含噪特征数据的特征信息的过程包括:
[0023]将所述含噪特征数据转换至时域,获取与所述含噪特征数据对应的时域语音信号;
[0024]对所述时域语音信号进行分帧及加窗处理,确定处理后的时域语音信号;
[0025]获取所述处理后的时域语音信号的每一帧的梅尔倒谱系数;其中,所述梅尔倒谱系数作为所述特征信息。
[0026]可选地,所述基于所述语音活动检测模型对待检测语音信号进行检测,以获取与所述待检测语音信号对应的输出标签的过程包括:
[0027]获取所述语音活动检测模型的参数矩阵;同时,
[0028]对所述待检测语音信号进行分帧及加窗处理,提取所述待检测语音信号的特征矩阵;
[0029]基于所述特征矩阵及所述参数矩阵,获取与所述待检测语音信号的当前帧相对应的各输出标签及各输出标签的得分。
[0030]可选地,还包括在获取与所述待检测语音信号对应的输出标签之后,
[0031]对所述输出标签进行窗口策略处理,以获取与所述待检测语音信号对应的标签参数及状态信息。
[0032]为了解决上述问题,本专利技术还提供一种多标签语音活动检测装置,所述装置包括:
[0033]有标注噪声数据确定单元,用于基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据;
[0034]含噪特征数据确定单元,用于根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据,确定含噪特征数据;
[0035]语音活动检测模型形成单元,用于基于所述含噪特征数据训练神经网络模型,直至所述神经网络模型收敛在预设范围内,形成语音活动检测模型;
[0036]输出标签获取单元,用于基于所述语音活动检测模型对待检测语音信号进行检测,以获取与所述待检测语音信号对应的输出标签。
[0037]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0038]存储器,存储至少一个指令;及
[0039]处理器,执行所述存储器中存储的指令以实现上述所述的多标签语音活动检测方法。
[0040]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的多标签语音活动检测方法。
[0041]本专利技术实施例基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据;根据预设语音数据、预设无标注噪声数据及有标注噪声数据,确定含噪特征数据;基于含噪特征数据训练神经网络模型,直至神经网络模型收敛在预设范围内,形成语音活动检测模型;基于语音活动检测模型对待检测语音信号进行检测,以获取与待检测语音信号对应的输出标签,鲁棒性强、使用范围广、检测精度高,能够提供灵活的语音交互,优化用户体验。
附图说明
[0042]图1为本专利技术一实施例提供的多标签语音活动检测方法的流程示意图;
[0043]图2为本专利技术一实施例提供的多标签语音活动检测装置的模块示意图;
[0044]图3为本专利技术一实施例提供的实现多标签语音活动检测方法的电子设备的内部结构示意图;
[0045]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0046]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0047]本专利技术提供一种多标签语音活动检测方法。参照图1所示,为本专利技术一实施例提供的多标签语音活动检测方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
[0048]在本实施例中,多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多标签语音活动检测方法,应用于电子装置,其特征在于,所述方法包括:基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据;根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据,确定含噪特征数据;基于所述含噪特征数据训练神经网络模型,直至所述神经网络模型收敛在预设范围内,形成语音活动检测模型;基于所述语音活动检测模型对待检测语音信号进行检测,以获取与所述待检测语音信号对应的输出标签。2.如权利要求1所述的多标签语音活动检测方法,其特征在于,基于预设的噪声种子模型,从预设无标注数据中确定有标注噪声数据的过程包括:获取包含有标注和无标注的噪声种子模型的训练数据;基于所述训练数据训练噪声分类模型,直至所述噪声分类模型收敛至预设范围内,形成所述噪声种子模型;通过所述噪声种子模型从预设无标注数据中筛选噪声数据;对筛选出的噪声数据添加对应的噪声标签,形成所述有标注噪声数据。3.如权利要求1所述的多标签语音活动检测方法,其特征在于,所述根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据,确定含噪特征数据的过程包括:根据预设比例确定所述预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据的数据量占比;对所述预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据进行混响及加噪处理,以获取所述含噪特征数据。4.如权利要求1所述的多标签语音活动检测方法,其特征在于,所述基于所述含噪特征数据训练多层一维卷积模型,直至所述多层一维卷积模型收敛在预设范围内,形成语音活动检测模型的过程包括:提取所述含噪特征数据的特征信息;基于所述特征信息训练多层一维卷积模型,直至所述多层一维卷积模型收敛在预设范围内,形成所述语音活动检测模型。5.如权利要求4所述的多标签语音活动检测方法,其特征在于,所述提取所述含噪特征数据的特征信息的过程包括:将所述含噪特征数据转换至时域,获取与所述含噪特征数据对应的时域语音信号;对所述时域语音信号进行分帧及加窗...

【专利技术属性】
技术研发人员:赵建平马骏王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1