一种基于MVGG-CTC的关键词搜索方法技术

技术编号：30324772 阅读：57 留言：0更新日期：2021-10-10 00:03

一种基于MVGG

全部详细技术资料下载

【技术实现步骤摘要】
一种基于MVGG
‑
CTC的关键词搜索方法

[0001]本专利技术属于语音识别
，具体涉及一种基于MVGG
‑
CTC的关键词搜索方法。

技术介绍

[0002]随着网络通信技术的迅速发展，音视频媒体已经成为一种主流的信息传播形式，其高效流通和快速交互等特点越来越突显。舆论信息的传播和交互已达到前所未有的程度，在给人们带来便捷的同时，其中不良舆论信息的传播所产生的负面影响也越来越显著，诸如色情、恐怖、暴力等舆论信息的传播不仅违背公序良俗，也为社会公共安全带来巨大威胁和隐患，这也是我国相关部门所重点关注的问题。如何在保证信息自由流通的同时有效地加强监测和坚决防止不良舆论信息的传播，以及有效引导化解舆论危机对维护社会稳定、促进国家发展具有重要的现实意义，也是摆在信息科学工作者面前的新课题、新挑战。
[0003]对于音视频媒体舆论信息的监控，最有效的方法就是对其音频的关键词进行实时监测并建立关键词搜索系统，其中关键词搜索系统是针对连续语音数据进行自动识别并监测是否包含敏感关键词，并对含有关键词的语音片段建立关键词倒排索引，以便后期人工核实。该方法包含了语音信号预处理和特征提取、语言模型和声学模型的建立、语言解码器以及倒排索引的构建等等，其中:
[0004]1)语音信号预处理和特征提取是为了对语音信号数据进行前端预处理，包括特征提取、静音检测以及混合多环境混响的语音增强三部分组成，其中语音信号特征提取常采用语谱图特征、FilterBank(滤波器组)特征、MFCC(梅尔倒...

【技术保护点】

【技术特征摘要】
1.一种基于MVGG
‑
CTC的关键词搜索方法，其特征在于，所述方法包括步骤：获取语音数据；对所述语音数据进行预处理；将所述语音数据输入MVGG
‑
CTC模型中训练；构建语音模型和词典；将所述MVGG
‑
CTC模型输出的拼音序列转化为连续文字；利用倒排索引构建语音关键词搜索库；在所述语音关键词搜索库中输入关键词进行检索；获取所述语音关键词搜索库输出的检索结果。2.根据权利要求1所述的基于MVGG
‑
CTC的关键词搜索方法，其特征在于，所述对所述语音数据进行预处理包括步骤：对所述语音数据进行特征提取；对所述语音数据进行静音检测；对所述语音数据进行多环境混响增强。3.根据权利要求1所述的基于MVGG
‑
CTC的关键词搜索方法，其特征在于，所述将所述语音数据输入MVGG
‑
CTC模型中训练包括步骤：构建MVGG模型；构建连接...

【专利技术属性】
技术研发人员：江海，刘俊南，王化，薛辉，齐心，
申请(专利权)人：因诺微科技天津有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人