The invention discloses a speech recognition corpus generation method based on TTS, which is characterized by: importing original voice data into data pool; importing text annotation and TTS voice data into data pool simultaneously by TTS converter; analyzing and processing voice data and text annotation in data pool to generate corpus; exporting corpus from data pool and storing corpus into data pool. The corpus separates the voice part of the backup corpus from the text annotation part, sends the voice part back to the data pool, and sends the text annotation part back to the TTS converter. The method and system of generating speech recognition corpus based on TTS make the generation and update of corpus no longer depend on manual adding corpus, because it can work uninterruptedly, improve work efficiency, reduce the cost of manual recording, and greatly reduce the work pressure of staff.
【技术实现步骤摘要】
一种基于TTS的语音识别语料库生成方法及系统
本专利技术属于智能语音
,特别涉及一种基于TTS的语音识别语料库生成方法及系统。
技术介绍
语言是人类进行信息交流的最主要、最常用、最直接的方式。语音智能识别技术既计算机自动语音识别技术是实现人-机对话的一项重大突破,近年来发展十分迅速,其应用也逐步得到推广。语音识别技术的识别度跟其自身的语料库大小密切相关,语音识别时需要在其语料库中搜索到对应的语料,然后才能识别出语音的内容。一旦语料库过小,在进行语音识别时找不到对应的语料,自然就会识别不出语音的内容,导致识别度低。因此,人们都在尽最大的努力扩大语料库,以提高语音识别的识别度。目前,扩大语料库的办法都是人为手动去向语料库中添加语料,需要更新语料库时,就会聘请很多人,让这些人进行说话,然后将这些话录音下来,再将这些语音分别与对应的文字标注绑定在一起,形成语料,最后将这些语料存进语料库中。这样做有很多缺点,首先工作效率低,其次成本较高,最后当语料库更新频繁时会大大增加工作人员的工作量。
技术实现思路
针对上述问题,本专利技术提供了一种基于TTS的语音识别语料库生成方法及系统。一种基于TTS的语音识别语料库生成方法,所述生成方法包括:向数据池导入原始语音数据;TTS转换器同时导入文字标注和TTS语音数据给数据池;数据池对其中的语音数据和文字标注进行分析和处理,生成语料;数据池导出语料,语料存进语料库并生成备份语料;语料库将备份语料的语音部分和文字标注部分分离,语音部分送回数据池,文字标注部分送回TTS转换器。进一步地,所述数据池具有以下功能:接收外界语音数据;存储 ...
【技术保护点】
1.一种基于TTS的语音识别语料库生成方法,其特征在于,所述生成方法包括:向数据池导入原始语音数据;TTS转换器同时导入文字标注和TTS语音数据给数据池;数据池对其中的语音数据和文字标注进行分析和处理,生成语料;数据池导出语料,语料存进语料库并生成备份语料;语料库将备份语料的语音部分和文字标注部分分离,语音部分送回数据池,文字标注部分送回TTS转换器。
【技术特征摘要】
1.一种基于TTS的语音识别语料库生成方法,其特征在于,所述生成方法包括:向数据池导入原始语音数据;TTS转换器同时导入文字标注和TTS语音数据给数据池;数据池对其中的语音数据和文字标注进行分析和处理,生成语料;数据池导出语料,语料存进语料库并生成备份语料;语料库将备份语料的语音部分和文字标注部分分离,语音部分送回数据池,文字标注部分送回TTS转换器。2.根据权利要求1所述的生成方法,其特征在于,所述数据池具有以下功能:接收外界语音数据;存储语音;改变数据池内语音的属性;将TTS语音与数据池内的语音匹配到一起;将文字标注绑定到数据池内的语音上。3.根据权利要求1或2所述的生成方法,其特征在于,所述TTS转换器同时导入到数据池的文字标注和TTS语音具有相同内容,所述TTS转换器同时导入到数据池的文字标注和TTS语音绑定在一起。4.根据权利要求2所述的生成方法,其特征在于,所述外界语音数据包括外界的录音和设备传输的语音,所述外界的录音需要提前经过噪音过滤处理,所述外界的录音或设备传输的语音需要不断更新。5.根据权利要求2所述的生成方法,其特征在于,所述语音的属性包括语速、语调。6.根据权利要求2所述的生成方法,其特征在于,所述TTS语音和所述文字标注为所述TTS转换器同时导入到所述数据池的TTS语音和文字标注。7.根据权利要求2所述的生成方法,其...
【专利技术属性】
技术研发人员:虞焰兴,徐勇,
申请(专利权)人:安徽声讯信息技术有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。