一种语言类别识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：33528852 阅读：16 留言：0更新日期：2022-05-19 01:55

本公开关于一种语言类别识别方法、装置、电子设备和存储介质，该方法可以获取待处理语音信息对应的语音特征信息，将语音特征信息输入到动态扩展网络中进行动态特征扩展，得到第一语言特征信息，第一语言特征信息表征待处理语音信息的上下文特征信息，基于第一语言特征信息，对待处理语音信息进行语言识别，得到待处理语音信息对应的目标语言类别。该方法可以在对语音特征信息进行动态特征扩展时，扩展到语音特征信息的上下文信息，使得动态扩展网络在进行特征提取时，可以提取到语音特征信息以及语音特征信息相关的上下文中的第一语言特征信息，从而提高了第一语言特征信息的区分性，以及语言识别的有效性。以及语言识别的有效性。以及语言识别的有效性。

全部详细技术资料下载

【技术实现步骤摘要】
一种语言类别识别方法、装置、电子设备和存储介质

[0001]本公开涉及语言识别
，尤其涉及一种语言类别识别方法、装置、电子设备和存储介质。

技术介绍

[0002]语言类别识别是指从一段说话语音中识别出语种的类别或方言的类别，如日语、韩语、普通话、粤语等。语言类别识别技术的应用非常广泛，不仅可以作为多语言语音识别和多语言翻译系统的前端预处理模块，也可以用于定向广告和生物特征验证。近年来，随着深度学习技术的兴起，语种识别在工业界和学术界都得到广泛的关注。相关技术中，将语音特征信息先通过帧级别的网络模块，然后经过池化层得到段级别的语言特征，经过线性层通道维度整合后再进行分类，得到语言类别，其中，帧级别的网络模型得到的语言特征较为单一，从而导致不同的语言特征信息之间的区分性不明显。

技术实现思路

[0003]本公开提供一种语言类别识别方法、装置、电子设备和存储介质，以至少解决相关技术中不同的语言特征信息之间的区分性不明显的问题。本公开的技术方案如下：
[0004]根据本公开实施例的第一方面，提供一种语言类别识别方法，所述方法包括：
[0005]获取待处理语音信息对应的语音特征信息；
[0006]将所述语音特征信息输入到动态扩展网络中进行动态特征扩展，得到第一语言特征信息，所述第一语言特征信息表征所述待处理语音信息的上下文特征信息；
[0007]基于所述第一语言特征信息，对所述待处理语音信息进行语言识别，得到所述待处理语音信息对应的目标语言类别。
[0008]作为一...

【技术保护点】

【技术特征摘要】
1.一种语言类别识别方法，其特征在于，所述方法包括：获取待处理语音信息对应的语音特征信息；将所述语音特征信息输入到动态扩展网络中进行动态特征扩展，得到第一语言特征信息，所述第一语言特征信息表征所述待处理语音信息的上下文特征信息；基于所述第一语言特征信息，对所述待处理语音信息进行语言识别，得到所述待处理语音信息对应的目标语言类别。2.根据权利要求1所述的语言类别识别方法，其特征在于，所述动态扩展网络包括注意力计算层和动态扩展层，所述将所述语音特征信息输入到动态扩展网络中进行动态特征扩展，得到第一语言特征信息包括：将所述语音特征信息输入到所述注意力计算层中进行注意力计算，得到注意力特征信息；将所述语音特征信息和所述注意力特征信息输入到所述动态扩展层中进行动态特征扩展，得到所述第一语言特征信息。3.根据权利要求2所述的语言类别识别方法，其特征在于，所述动态扩展层包括至少一个特征扩展层和特征融合层，每个特征扩展层中的扩展尺寸信息不同，所述将所述语音特征信息和所述注意力特征信息输入到所述特征扩展层中进行动态特征扩展，得到所述第一语言特征信息包括：将所述语音特征信息和所述注意力特征信息输入到每个特征扩展层中，基于每个特征扩展层对应的扩展尺寸信息对所述语音特征信息和所述注意力特征信息进行特征扩展，得到至少一个特征扩展结果，所述每个特征扩展结果对应的特征扩展程度不同；将所述至少一个特征扩展结果输入到所述特征融合层中进行特征融合，得到所述第一语言特征信息。4.根据权利要求1所述的语言类别识别方法，其特征在于，所述动态扩展网络为按序排列的多个扩展网络，所述将所述语音特征信息输入到动态扩展网络中进行动态特征扩展，得到第一语言特征信息包括：在当前扩展网络为第一个扩展网络的情况下，将所述语音特征信息输入到所述第一个扩展网络中进行动态特征扩展，得到所述第一个扩展网络对应的语言特征信息，所述当前扩展网络为每一次执行特征扩展的扩展网络；在所述当前扩展网络为非第一个扩展网络的情况下，将所述当前扩展网络对应的上一语言特征信息，输入到所述当前扩展网络中进行动态特征扩展，得到所述当前扩展网络对应的语言特征信息；基于每一个扩展网络对应的语言特征信息，得到第二语言特征信息；所述基于所述第一语言特征信息，对所述待处理语音信息进行语言识别，得到所述待处理语音信息对应的目标语言类别包括：基于所述第二语言特征信息，对所述待处理语音信息进行语言识别，得到所述待处理语音信息对应的...

【专利技术属性】
技术研发人员：许云飞，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人