面向智能机器人系统的多语言文本混合朗读方法及系统技术方案

技术编号:14191844 阅读:89 留言:0更新日期:2016-12-15 10:50
本发明专利技术公开了一种面向智能机器人系统的多语言文本混合朗读方法及系统,该方法包括智能机器人端将获取的待混合朗读输出的多语言文本发送至云服务器;云服务器根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,并将标注的结果反馈回至智能机器人端;智能机器人端根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出。该方法解决了现有技术中混合朗读灵活性低,成本高以及准确性低的问题,改善了用户体验。

Method and system for multi language mixed reading of intelligent robot system

The invention discloses an intelligent robot system with multi language text reading method and system, the method includes the intelligent robot end will get the multi language text is sent to the server to read the output of the hybrid cloud; cloud server according to the types of the multi language text markup language speech synthesis engine different, and will the marked results feedback back to the end of the intelligent robot; intelligent robot end reading output of the multi language text to speech synthesis engine calls the corresponding feedback information. The method solves the problems of low flexibility, high cost and low accuracy, and improves the user experience in the prior art.

【技术实现步骤摘要】

本专利技术属于智能机器人领域,尤其涉及一种面向智能机器人系统的多语言文本混合朗读方法及系统
技术介绍
随着智能机器人的广泛应用,其被越来越多的用于多语言混合交叉次序朗读的应用中。智能机器人的语音输出主要通过文本转语音(Text To Speech,TTS)技术来实现。现有的多语种混合交叉次序朗读,大部分都是通过一个TTS引擎来实现,例如常见的中英文混合朗读。上述方案中存在的问题是,为了实现中英文混合朗读,必须选用支持中文、英文朗读TTS引擎,同时这种支持多语言混合朗读的引擎往往会发生交叉朗读错误的现象,因此缺乏灵活性。另外,支持混合朗读的语种较少,例如中英混合TTS引擎常见、但是中俄、中日等混合TTS引擎较少。并且支持TTS混合朗读的引擎成本较高。
技术实现思路
本专利技术所要解决的技术问题之一是需要提供一种用于实现多语言文本的多语言混合朗读的方法。为了解决上述技术问题,本申请的实施例首先提供了一种面向智能机器人系统的多语言文本混合朗读方法,包括智能机器人端将获取的待混合朗读输出的多语言文本发送至云服务器;云服务器根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,并将标注的结果反馈回至智能机器人端;智能机器人端根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出。优选地,所述云服务器根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,包括:根据所述多语言文本的语言类型将文本划分为至少一个文本段;基于各文本段的语言类型标注与该段文本相对应的语音合成引擎的类型。优选地,所述语音合成引擎为单一语种的语音合成引擎。优选地,所述将标注的结果反馈回至智能机器人端,包括:将所述各文本段及与该段文本相对应的语音合成引擎的类型封装为数组,其中,每个文本段对应于数组中的一个数组元素;将所述数组反馈回至智能机器人端。优选地,所述智能机器人端根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出,包括:依次读取所述数组的各数组元素,并对所述数据元素进行解析;根据解析结果中标注的语音合成引擎的类型调用相应的语音合成引擎;利用调用的语音合成引擎对所述多语言文本进行朗读输出。本申请的实施例还提供了一种面向智能机器人系统的多语言文本混合朗读系统,包括:传输模块,位于智能机器人端,其将获取的待混合朗读输出的多语言文本发送至云服务器;标注反馈模块,位于云服务器,其根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,并将标注的结果反馈回至智能机器人端;朗读输出模块,位于智能机器人端,其根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出。优选地,所述标注反馈模块在根据所述多语言文本的语言类型标注不同的语音合成引擎的类型时,根据所述多语言文本的语言类型将文本划分为至少一个文本段,并基于各文本段的语言类型标注与该段文本相对应的语音合成引擎的类型。优选地,所述语音合成引擎为单一语种的语音合成引擎。优选地,所述标注反馈模块在将标注的结果反馈回至智能机器人端时,将所述各文本段及与该段文本相对应的语音合成引擎的类型封装为数组,其中,每个文本段对应于数组中的一个数组元素;并所述数组反馈回至智能机器人端。优选地,所述朗读输出模块在根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出时,依次读取所述数组的各数组元素,并对所述数据元素进行解析;根据解析结果中标注的语音合成引擎的类型调用相应的语音合成引擎;利用调用的语音合成引擎对所述多语言文本进行朗读输出。与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:通过根据语言类型对待朗读输出的多语言文本进行分段,并针对划分得到的文本段分别调用不同的单一语种的语音合成引擎来完成多语言的混合朗读输出,解决了现有技术中混合朗读灵活性低,成本高以及准确性低的问题,改善了用户体验。本专利技术的其他优点、目标,和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本申请的技术方案或现有技术的进一步理解,并且构成说明书的一部分。其中,表达本申请实施例的附图与本申请的实施例一起用于解释本申请的技术方案,但并不构成对本申请技术方案的限制。图1为根据本专利技术第一实施例的面向智能机器人系统的多语言文本混合朗读方法的流程示意图;图2为根据本专利技术第二实施例的面向智能机器人系统的多语言文本混合朗读方法的流程示意图;图3为根据本专利技术第三实施例的面向智能机器人系统的多语言文本混合朗读方法的流程示意图;图4为根据本专利技术第四实施例的面向智能机器人系统的多语言文本混合朗读系统的结构示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成相应技术效果的实现过程能充分理解并据以实施。本申请实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。第一实施例:图1为根据本专利技术一实施例的面向智能机器人系统的多语言文本混合朗读方法的流程示意图,如图所示,该方法包括:步骤S110、智能机器人端将获取的待混合朗读输出的多语言文本发送至云服务器。步骤S120、云服务器根据多语言文本的语言类型标注不同的语音合成引擎的类型,并将标注的结果反馈回至智能机器人端。步骤S130、智能机器人端根据反馈的信息调用相应的语音合成引擎对多语言文本进行朗读输出。在步骤S110中,通过智能机器人端接收待混合朗读输出的多语言文本,可以通过内部的数据库获取,也可以由用户通过智能机器人端的接收装置输入。在本专利技术实施例中,对多语言文本的处理是在云服务器中完成的,因此智能机器人端随后将待混合朗读输出的多语言文本发送至云服务器。在步骤S120中,云服务器对接收到的多语言文本进行处理。通过对多语言文本进行分析得到文本中所包含的语言类型,并对应多语言文本的语言类型标注不同的语音合成引擎的类型。假设在本实施例的多语言文本中包含至少两种以上的语言的文字,现有技术中,一般通过调用对应于支持多种语言朗读的TTS混合合成引擎来实现的。而在本专利技术的实施例中,在调用TTS合成引擎对多语言文本进行朗读之前,先对多语言文本的内容进行分析。具体为,根据多语言文本的语言类型将文本划分为至少一个文本段,再基于各文本段的语言类型标注与该段文本相对应的TTS语音合成引擎的类型。通过划分得到的对多语言文本,每个文本段内部都只包含单一的一种语言类型,因此分别对各文本段进行朗读,可以只调用单一语种的TTS语音合成引擎来完成朗读。由于不再需要调用多语言语音合成引擎,因此有利于改善TTS语音合成的准确度以及提高朗读质量。进一步地,在步骤S120中,在云服务器完成多语言文本的文本段的划分以及语音合成引擎的标注之后,将标注的结果反馈回至智能机器人端。具体为,云服务器将划分得到的各文本段及与该段文本相对应的语音合成引擎的类型封装为数组,其中,每个文本段对应于数组中的一个数组元素。再将由多语言文本的全部文本段以及与该段文本相对应的语音合成引擎的类本文档来自技高网...
面向智能机器人系统的多语言文本混合朗读方法及系统

【技术保护点】
一种面向智能机器人系统的多语言文本混合朗读方法,包括:智能机器人端将获取的待混合朗读输出的多语言文本发送至云服务器;云服务器根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,并将标注的结果反馈回至智能机器人端;智能机器人端根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出。

【技术特征摘要】
1.一种面向智能机器人系统的多语言文本混合朗读方法,包括:智能机器人端将获取的待混合朗读输出的多语言文本发送至云服务器;云服务器根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,并将标注的结果反馈回至智能机器人端;智能机器人端根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出。2.根据权利要求1所述的方法,其特征在于,所述云服务器根据所述多语言文本的语言类型标注不同的语音合成引擎的类型,包括:根据所述多语言文本的语言类型将文本划分为至少一个文本段;基于各文本段的语言类型标注与该段文本相对应的语音合成引擎的类型。3.根据权利要求1或2所述的方法,其特征在于,所述语音合成引擎为单一语种的语音合成引擎。4.根据权利要求2所述的方法,其特征在于,所述将标注的结果反馈回至智能机器人端,包括:将所述各文本段及与该段文本相对应的语音合成引擎的类型封装为数组,其中,每个文本段对应于数组中的一个数组元素;将所述数组反馈回至智能机器人端。5.根据权利要求4所述的方法,其特征在于,所述智能机器人端根据反馈的信息调用相应的语音合成引擎对所述多语言文本进行朗读输出,包括:依次读取所述数组的各数组元素,并对所述数据元素进行解析;根据解析结果中标注的语音合成引擎的类型调用相应的语音合成引擎;利用调用的语音合成引擎对所述多语言文本进行朗读输出。6.一种面向智能机器人系统的多语言文本...

【专利技术属性】
技术研发人员:王合心
申请(专利权)人:北京光年无限科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1