语音识别中符号添加方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：19483276 阅读：36 留言：0更新日期：2018-11-17 10:57

本发明专利技术公开了一种语音识别中符号添加方法、装置、计算机设备及存储介质，所述方法包括：对获取到的待识别语音进行语音识别，同步检测待识别语音中的静音段，判断静音段的时长是否超过第一时长；在静音段的时长超过第一时长时，输出静音段之前的文本序列，并根据静音段的时长在文本序列中对应位置插入逗号或句号；对获取到的静音段之后的待识别语音进行语音识别，同时根据预设的判别模型修正已插入至文本序列中的逗号或句号。本发明专利技术用于提升语音识别中符号的输出效率与准确度，以达到提升语音识别效率、准确断句以及准确表达情感的目的。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别中符号添加方法、装置、计算机设备及存储介质
本专利技术涉及语音识别领域，具体涉及一种语音识别中符号添加方法、装置、计算机设备及存储介质。
技术介绍
目前，在语音识别过程中，对自动添加标点符号的研究并不多，大都是对语音进行识别时，中间有停顿的地方识别为逗号，结束时自动添加句号，整个句子被视为陈述语气，这种识别方式会造成句子的停顿错误，一个单句被误拆分为多个不连通的词语组合，而在某些情形下不能表达出讲话者的语气和情感。因此，当前缺少一种能够解决语音识别自动补全符号的方法，以达到正常的断句以及情感的正常表达。
技术实现思路
本专利技术实施例提供一种语音识别中符号添加方法、装置、计算机设备及存储介质，用于提升语音识别中符号的输出效率与准确度，以达到提升语音识别效率、准确断句以及准确表达情感的目的。第一方面，本专利技术案例提供一种语音识别中符号添加方法，包括：获取待识别语音，对所述待识别语音进行语音识别，并同步检测所述待识别语音中的静音段，判断所述静音段的时长是否超过第一时长；在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并根据所述静音段的时长，在所述文本序列中对应于所述静音段的位置插入逗号或句号；获取所述静音段之后的待识别语音并对其进行语音识别，同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。第二方面，本专利技术实例提供一种语音识别中符号添加装置，包括：检测模块，用于获取待识别语音，对所述待识别语音进行语音识别，并同步检测所述待识别语音中的静音段，判断所述静音段的时长是否超过第一时长；输出模块，用于在所述静音段的时长超过所述...

【技术保护点】
1.一种语音识别中符号添加方法，其特征在于，包括：获取待识别语音，对所述待识别语音进行语音识别，并同步检测所述待识别语音中的静音段，判断所述静音段的时长是否超过第一时长；在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并根据所述静音段的时长，在所述文本序列中对应于所述静音段的位置插入逗号或句号；获取所述静音段之后的待识别语音并对其进行语音识别，同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。

【技术特征摘要】
1.一种语音识别中符号添加方法，其特征在于，包括：获取待识别语音，对所述待识别语音进行语音识别，并同步检测所述待识别语音中的静音段，判断所述静音段的时长是否超过第一时长；在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并根据所述静音段的时长，在所述文本序列中对应于所述静音段的位置插入逗号或句号；获取所述静音段之后的待识别语音并对其进行语音识别，同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。2.如权利要求1所述的语音识别中符号添加方法，所述在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并根据所述静音段的时长，在所述文本序列中对应于所述静音段的位置插入逗号或句号，其特征在于，包括：在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并判断所述静音段的时长是否超过第二时长，其中，所述第二时长大于所述第一时长；在所述静音段的时长不超过所述第二时长时，将逗号插入至所述静音段对应的位置；在所述静音段的时长超过所述第二时长时，将句号插入至所述静音段对应的位置。3.如权利要求1所述的语音识别中符号添加方法，所述在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并根据所述静音段的时长，在所述文本序列中对应于所述静音段的位置插入逗号或句号，其特征在于，包括：在所述静音段的时长超过所述第一时长时，输出所述静音段之前的文本序列，并在所述文本序列之后自动生成一个断句标识；获取所述静音段之后的待识别语音并对其进行语音识别，同时判断静音段的时长是否超过第二时长，其中，所述第二时长大于所述第一时长；在所述静音段的时长不超过所述第二时长时，将所述断句标识替换为逗号；在所述静音段的时长超过所述第二时长时，将所述断句标识替换为句号。4.如权利要求1所述语音识别中符号添加的方法，所述获取所述静音段之后的待识别语音并对其进行语音识别，同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号，其特征在于，包括：获取包含不同语气类型语句的训练文本，根据所述训练文本生成判别模型；所述判别模型用于获取语句末端插入的语气符号的输出概率；获取所述静音段之后的待识别语音并对其进行语音识别，同时按文本序列的输出顺序，检测已输出的所述文本序列中是否存在逗号或句号；在检测到已输出的所述文本序列中存在逗号或句号时，通过所述判别模型顺次对检测到的逗号或句号进行修正。5.如权利要求4所述的语音识别中符号添加方法，所述在检测到已输出的所述文本序列中存在逗号或句号时，通过所述判别模型顺次对检测...

【专利技术属性】
技术研发人员：彭捷，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人