语音识别中符号添加方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:19483276 阅读:36 留言:0更新日期:2018-11-17 10:57
本发明专利技术公开了一种语音识别中符号添加方法、装置、计算机设备及存储介质,所述方法包括:对获取到的待识别语音进行语音识别,同步检测待识别语音中的静音段,判断静音段的时长是否超过第一时长;在静音段的时长超过第一时长时,输出静音段之前的文本序列,并根据静音段的时长在文本序列中对应位置插入逗号或句号;对获取到的静音段之后的待识别语音进行语音识别,同时根据预设的判别模型修正已插入至文本序列中的逗号或句号。本发明专利技术用于提升语音识别中符号的输出效率与准确度,以达到提升语音识别效率、准确断句以及准确表达情感的目的。

【技术实现步骤摘要】
语音识别中符号添加方法、装置、计算机设备及存储介质
本专利技术涉及语音识别领域,具体涉及一种语音识别中符号添加方法、装置、计算机设备及存储介质。
技术介绍
目前,在语音识别过程中,对自动添加标点符号的研究并不多,大都是对语音进行识别时,中间有停顿的地方识别为逗号,结束时自动添加句号,整个句子被视为陈述语气,这种识别方式会造成句子的停顿错误,一个单句被误拆分为多个不连通的词语组合,而在某些情形下不能表达出讲话者的语气和情感。因此,当前缺少一种能够解决语音识别自动补全符号的方法,以达到正常的断句以及情感的正常表达。
技术实现思路
本专利技术实施例提供一种语音识别中符号添加方法、装置、计算机设备及存储介质,用于提升语音识别中符号的输出效率与准确度,以达到提升语音识别效率、准确断句以及准确表达情感的目的。第一方面,本专利技术案例提供一种语音识别中符号添加方法,包括:获取待识别语音,对所述待识别语音进行语音识别,并同步检测所述待识别语音中的静音段,判断所述静音段的时长是否超过第一时长;在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号;获取所述静音段之后的待识别语音并对其进行语音识别,同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。第二方面,本专利技术实例提供一种语音识别中符号添加装置,包括:检测模块,用于获取待识别语音,对所述待识别语音进行语音识别,并同步检测所述待识别语音中的静音段,判断所述静音段的时长是否超过第一时长;输出模块,用于在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号;修正模块,用于获取所述静音段之后的待识别语音并对其进行语音识别,同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音识别中符号添加方法的步骤。第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音识别中符号添加方法的步骤。本专利技术提供的语音识别中符号添加方法、装置、计算机设备及存储介质,在同步检测到静音段的时长超过第一时长时,在文本序列中对应于静音段的位置,根据所述静音段的时长插入逗号或句号,可以实时输出标点符号,达到准确断句的目的,以及提升语音识别的效率。而根据预设的判别模型修正已插入至所述文本序列中的句号或逗号,在达到准确断句基础上,准确判断语句的语气类型以及表达出语句的情感。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中语音识别中符号添加方法的应用环境示意图;图2是本专利技术一实施例中语音识别中符号添加方法的流程图;图3是本专利技术一实施例中语音识别中符号添加方法的步骤S20的流程图;图4是本专利技术另一实施例中语音识别中符号添加方法的步骤S20的流程图;图5是本专利技术一实施例中语音识别中符号添加方法的步骤S30的流程图;图6是本专利技术一实施例中语音识别中符号添加方法的步骤S303流程图;图7是本专利技术一实施例中语音识别中符号添加装置的原理框图;图8是本专利技术一实施例中语音识别中符号添加装置的输出模块的原理框图;图9是本专利技术一实施例中语音识别中符号添加装置的修正模块的原理框图;图10是本专利技术一实施例中计算机设备的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供的语音识别中符号添加方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种语音识别中符号添加方法,以该方法应用在图1中的服务器为例进行说明,包括以下步骤:S10、获取待识别语音,对所述待识别语音进行语音识别,并同步检测所述待识别语音中的静音段,判断所述静音段的时长是否超过第一时长。其中,所述待识别语音可以从一段录音,一段无字幕的视频语音,一段音乐或者一段语音对话等不同的语音型式中获取;所述静音段可以位于所述待识别语音中的一个语句的前端、末尾或中间位置。具体的,对所述待识别语音进行语音识别过程中,同步检测所述待识别语音中的静音段,判断所述静音段的时长是否超过第一时长。所述第一时长可以根据需求进行设置,在所述静音段的时长超过(大于)所述第一时长时,默认所述静音段位于所述待识别语音中的一个语句的末尾位置,此时语句需要进行停顿,而在所述静音段对应的位置可以插入标点符号;在所述静音段的时长不超过(小于或等于)所述第一时长时,默认所述静音段位于所述待识别语音中的一个语句的中间位置,此时该语音段不影响待识别语音对应的文本序列的输出,而在所述静音段对应的位置,可以通过语音识别连续输出对应于所述待识别语音的文本序列,无需插入标点符号进行间隔或者停顿。可理解的,对所述待识别语音进行语音识别,同步对所述待识别语音中的静音段进行检测,也即,对所述待识别语音进行语音识别生成对应的文本序列,以及在符合要求的静音段的位置插入标点符号,均可实时输出。S20、在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号。具体的,将待识别语音转化为文本序列的过程中,同步对所述待识别语音中的静音段进行检测,在所述静音段的时长超过(大于)所述第一时长时,默认所述静音段位于所述待识别语音中的一个语句的末尾位置,此时语音段需要进行停顿,而在所述静音段对应的位置可以插入标点符号,进一步地,可以判断所述静音段的时长是否超过第二时长,根据所述第二时长判断所述插入的标点符号是逗号还是句号。可理解地,在所述静音段的时长未超过所述第一时长时(对应于步骤S40),默认所述静音段仅为一个语句中字词之间的正常间隔,而不是两个语句之间的停顿,此时无需插入标点符号,仅需连续输出文本序列即可。S30、获取所述静音段之后的待识别语音并对其进行语音识别,同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。可理解的,获取所述静音段之后的待识别语言并对其进行语音识别,此时已经输出所述静音段之前的文本序列以及文本序列中插入的逗号或句号。为了更好的达到语句的情感表达,在已经完成正常断句的基础上,可以将已经插入的逗号或句号进行修正。综上所述,本专利技术提供的语音识别中符号添加方法对所本文档来自技高网...

【技术保护点】
1.一种语音识别中符号添加方法,其特征在于,包括:获取待识别语音,对所述待识别语音进行语音识别,并同步检测所述待识别语音中的静音段,判断所述静音段的时长是否超过第一时长;在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号;获取所述静音段之后的待识别语音并对其进行语音识别,同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。

【技术特征摘要】
1.一种语音识别中符号添加方法,其特征在于,包括:获取待识别语音,对所述待识别语音进行语音识别,并同步检测所述待识别语音中的静音段,判断所述静音段的时长是否超过第一时长;在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号;获取所述静音段之后的待识别语音并对其进行语音识别,同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号。2.如权利要求1所述的语音识别中符号添加方法,所述在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号,其特征在于,包括:在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并判断所述静音段的时长是否超过第二时长,其中,所述第二时长大于所述第一时长;在所述静音段的时长不超过所述第二时长时,将逗号插入至所述静音段对应的位置;在所述静音段的时长超过所述第二时长时,将句号插入至所述静音段对应的位置。3.如权利要求1所述的语音识别中符号添加方法,所述在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并根据所述静音段的时长,在所述文本序列中对应于所述静音段的位置插入逗号或句号,其特征在于,包括:在所述静音段的时长超过所述第一时长时,输出所述静音段之前的文本序列,并在所述文本序列之后自动生成一个断句标识;获取所述静音段之后的待识别语音并对其进行语音识别,同时判断静音段的时长是否超过第二时长,其中,所述第二时长大于所述第一时长;在所述静音段的时长不超过所述第二时长时,将所述断句标识替换为逗号;在所述静音段的时长超过所述第二时长时,将所述断句标识替换为句号。4.如权利要求1所述语音识别中符号添加的方法,所述获取所述静音段之后的待识别语音并对其进行语音识别,同时根据预设的判别模型修正已插入至所述文本序列中的逗号或句号,其特征在于,包括:获取包含不同语气类型语句的训练文本,根据所述训练文本生成判别模型;所述判别模型用于获取语句末端插入的语气符号的输出概率;获取所述静音段之后的待识别语音并对其进行语音识别,同时按文本序列的输出顺序,检测已输出的所述文本序列中是否存在逗号或句号;在检测到已输出的所述文本序列中存在逗号或句号时,通过所述判别模型顺次对检测到的逗号或句号进行修正。5.如权利要求4所述的语音识别中符号添加方法,所述在检测到已输出的所述文本序列中存在逗号或句号时,通过所述判别模型顺次对检测...

【专利技术属性】
技术研发人员:彭捷
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1