多标签语音活动检测方法、装置及存储介质制造方法及图纸

技术编号：28493605 阅读：12 留言：0更新日期：2021-05-19 22:21

本发明专利技术涉及一种人工智能，揭露一种多标签语音活动检测方法，包括：基于预设的噪声种子模型，从预设无标注数据中确定有标注噪声数据；根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据，确定含噪特征数据；基于所述含噪特征数据训练神经网络模型，直至所述神经网络模型收敛在预设范围内，形成语音活动检测模型；基于所述语音活动检测模型对待检测语音信号进行检测，以获取与所述待检测语音信号对应的输出标签。本发明专利技术可以提高语音活动检测的效率和准确度。动检测的效率和准确度。动检测的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
多标签语音活动检测方法、装置及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种多标签语音活动检测的方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着人工智能和计算机技术的快速发展,大企业的人工客服电话系统已开始逐渐升级为智能客服系统，由语音对话系统与用户进行对话沟通，解决用户问题，同时降低企业客服人力成本，提高效率。
[0003]然而，在智能客服语音对话系统中，各种生活场景的噪音,包含稳态噪声,冲击噪声，非稳态噪声及非相干的多人说话干扰噪声等，在很大程度上影响了智能语音系统中语音识别的准确度，影响正常的交互和用户体验。目前，在语音识别过程中，构建有效的语音活动检测模型和语音降噪算法，可改善上述情况。
[0004]但是，传统的语音活动检测算法多采用能量，过零率或其他语音特征，并辅以分类模型进行检测，在真实的噪声场景下，其鲁棒性较差。同时，对于语音降噪算法而言，传统或者深度学习的语音降噪算法，对于不同的噪声参数和泛化能力不同，使用同一参数，对于失配场景降噪失效,反而影响到语音识别的准确度。

技术实现思路

[0005]本专利技术提供一种多标签语音活动检测方法、装置、电子设备及计算机可读存储介质，其主要目的在于解决传统语音活动检测方式存在的鲁棒性差、检测准确度低等问题。
[0006]为实现上述目的，本专利技术提供的一种多标签语音活动检测方法，包括：
[0007]基于预设的噪声种子模型，从预设无标注数据中确定有标注噪声数据；
[000...

【技术保护点】

【技术特征摘要】
1.一种多标签语音活动检测方法，应用于电子装置，其特征在于，所述方法包括：基于预设的噪声种子模型，从预设无标注数据中确定有标注噪声数据；根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据，确定含噪特征数据；基于所述含噪特征数据训练神经网络模型，直至所述神经网络模型收敛在预设范围内，形成语音活动检测模型；基于所述语音活动检测模型对待检测语音信号进行检测，以获取与所述待检测语音信号对应的输出标签。2.如权利要求1所述的多标签语音活动检测方法，其特征在于，基于预设的噪声种子模型，从预设无标注数据中确定有标注噪声数据的过程包括：获取包含有标注和无标注的噪声种子模型的训练数据；基于所述训练数据训练噪声分类模型，直至所述噪声分类模型收敛至预设范围内，形成所述噪声种子模型；通过所述噪声种子模型从预设无标注数据中筛选噪声数据；对筛选出的噪声数据添加对应的噪声标签，形成所述有标注噪声数据。3.如权利要求1所述的多标签语音活动检测方法，其特征在于，所述根据预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据，确定含噪特征数据的过程包括：根据预设比例确定所述预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据的数据量占比；对所述预设语音数据、所述预设无标注噪声数据及所述有标注噪声数据进行混响及加噪处理，以获取所述含噪特征数据。4.如权利要求1所述的多标签语音活动检测方法，其特征在于，所述基于所述含噪特征数据训练多层一维卷积模型，直至所述多层一维卷积模型收敛在预设范围内，形成语音活动检测模型的过程包括：提取所述含噪特征数据的特征信息；基于所述特征信息训练多层一维卷积模型，直至所述多层一维卷积模型收敛在预设范围内，形成所述语音活动检测模型。5.如权利要求4所述的多标签语音活动检测方法，其特征在于，所述提取所述含噪特征数据的特征信息的过程包括：将所述含噪特征数据转换至时域，获取与所述含噪特征数据对应的时域语音信号；对所述时域语音信号进行分帧及加窗...

【专利技术属性】
技术研发人员：赵建平，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人