一种语音识别的口语文本生成方法技术

技术编号：33802636 阅读：33 留言：0更新日期：2022-06-16 10:08

本发明专利技术公开了一种语音识别的口语文本生成方法，包括步骤S1：进行端点检测获得声音信号并对声音信号进行初步去噪；步骤S2：通过语音识别引擎将去噪后的声音信号转换为机器语言；步骤S3：通过语音识别模型与分离模型对机器语言联合训练；步骤S4：进行后端识别处理；步骤S5：生成口语文本;本发明专利技术有效解决了目前口语生成文本不够准确的问题，相较于普通的口语文本生成方法具有高准确性；更接近于人的口语叙述方式，可辨别性高；具有多种口语文本的生成，可供使用者选择，选择度高；进行自我学习，语义识别随使用时间稳定性和准确度均有提高。语义识别随使用时间稳定性和准确度均有提高。语义识别随使用时间稳定性和准确度均有提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别的口语文本生成方法

[0001]本专利技术涉及口语文本生成方式，尤其涉及一种语音识别的口语文本生成方法。

技术介绍

[0002]随着计算机技术和网络技术的发展和广泛应用，存在着很多需要进行语音识别的情况。一般来说，语言分为口语和书面语，当前情况下的语音识别系统多对书面语进行阐述或者而且，伴随着使用人员的范围增加，逐字识别的方法显然不适用于目前的网络环境，然而目前存在识别效率低。一般来说，口语比书面语更加依赖语言环境以及更难转换为机器语言。
[0003]现有的文本转换方法在将书面语转换为口语时，一般是直接在书面文本上添加了口语中常见的副语言信息，转换后的口语化文本并不符合语言的表达习惯，有时在书面文本中出现了口语化的副语言信息反而会让用户感到生硬，拗口，表达不流畅等感觉，影响用户体验。
[0004]现有的文本转换方式对文本并没有进行系统化的学习，只是机械性地增加口语化的阐述方式。
[0005]对于真正口语的情况来说显得不够真实。并且进行语义转换的同时也存在一定障碍。
[0006]例如，一种在中国专利文献上公开的“将书面文本转换为口语文本的方法及系统”，其公告号“CN201710987858.5”，包括一种将书面文本转换为口语文本的方法及系统，通过副词等方式对书面语的语言习惯进行训练然后转换为口语文本，缺少对整体性以及语言习惯的考究，不够自然准确。

技术实现思路

[0007]本专利技术主要解决现有的语音识别的口语文本生成方式中存在的精确度不够以及对于现有的口语文...

【技术保护点】

【技术特征摘要】
1.一种语音识别的口语文本生成方法，其特征在于，包括以下步骤：步骤S1：进行端点检测获得声音信号并对声音信号进行初步去噪；步骤S2：通过语音识别引擎将去噪后的声音信号转换为机器语言；步骤S3：通过语音识别模型与分离模型对机器语言联合训练；步骤S4：进行后端识别处理；步骤S5：生成口语文本。2.根据权利要求1所述的一种语音识别的口语文本生成方法，其特征在于，所述步骤S1包括以下步骤：步骤S11：对输入的音频流进行分析，确定语音的起始和终止的位置进行语音识别；步骤S12：识别语音中的噪声并进行消除。3.根据权利要求1所述的一种语音识别的口语文本生成方法，其特征在于，所述步骤3包括以下步骤：步骤S31：深度全序列卷积神经网络，使用多个卷积层对整句语音进行建模；步骤S32：进行word
‑
embedding语义建模，筛选语义不顺语句；步骤S33：采用加噪训练方式引入口语噪音形式，构建书面语与口语文本对应关系。4.根据权利要求3所述的一种语音识别的口语文本生成方法，其特征在于，所述步骤S33中的构建书面语与口语文本对应关系为：通过在书面语上手动引入口语噪声，所述口语噪声包括回读、倒装、语气词、强调以及反复，生成海量的...

【专利技术属性】
技术研发人员：沈红峰，方景辉，陈超，姚强，龚利武，张健，潘白浪，张炜，施文杰，万家建，顾一星，朱晓晨，薛天琛，陆夕蒙，张嘉辉，张桂玲，黄悦华，
申请(专利权)人：平湖市通用电气安装有限公司国网浙江省电力有限公司嘉兴供电公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人