语音合成方法、装置、存储介质和计算机设备制造方法及图纸

技术编号：20921861 阅读：25 留言：0更新日期：2019-04-20 10:49

本申请涉及一种语音合成方法、装置、计算机可读存储介质和计算机设备，所述方法包括：获取目标文本；确定所述目标文本包括的多个角色；根据所述目标文本中角色的相关文本，确定所述多个角色各自所属的角色类型；按照所述角色相应的角色类型为所述角色匹配相应的音色类别；在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音。本申请提供的方案可以大大扩展文字内容的表达。

Speech synthesis methods, devices, storage media and computer equipment

The present application relates to a speech synthesis method, device, computer readable storage medium and computer equipment. The methods include: acquiring target text; determining multiple roles included in the target text; determining the respective role types of the roles according to the relevant text of the roles in the target text; and identifying the roles according to the corresponding role types of the roles. When the target text is transformed into speech, the speech content in the target text is transformed into speech according to the matching timbre category of the corresponding roles. The scheme provided in this application can greatly expand the expression of text content.

全部详细技术资料下载

【技术实现步骤摘要】
语音合成方法、装置、存储介质和计算机设备
本申请涉及文字语音转换
，特别是涉及一种语音合成方法、装置、计算机可读存储介质和计算机设备。
技术介绍
随着计算机技术的发展，出现了文字语音转换技术。文字语音转换技术主要是将计算机内的文本转换成连续自然的语音。传统的将文字转化成语音的方式，通常是采用TTS(TextToSpeech)技术，根据文本合成相应的语音。然而，传统的将文字转化成声音的方式，通常全篇只有一个嗓音，并且多为女性。当需转换的文字内容非常多，比如播报书籍或故事时，采用单一的嗓音会局限对文字内容的表达。
技术实现思路
基于此，有必要针对传统的将文字转化成声音的方式局限了文字内容的表达的技术问题，提供一种语音合成方法、装置、计算机可读存储介质和计算机设备。一种语音合成方法，包括：获取目标文本；确定所述目标文本包括的多个角色；根据所述目标文本中角色的相关文本，确定所述多个角色各自所属的角色类型；按照所述角色相应的角色类型为所述角色匹配相应的音色类别；在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音。一种语音合成装置，包括：获取模块，用于获取目标文本；确定模块，用于确定所述目标文本包括的多个角色；所述确定模块还用于根据所述目标文本中角色的相关文本，确定所述多个角色各自所属的角色类型；匹配模块，用于按照所述角色相应的角色类型为所述角色匹配相应的音色类别；转化模块，用于在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音。一种计算机可读存储介质，存储有计算机程...

【技术保护点】
1.一种语音合成方法，包括：获取目标文本；确定所述目标文本包括的多个角色；根据所述目标文本中角色的相关文本，确定所述多个角色各自所属的角色类型；按照所述角色相应的角色类型为所述角色匹配相应的音色类别；在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音。

【技术特征摘要】
1.一种语音合成方法，包括：获取目标文本；确定所述目标文本包括的多个角色；根据所述目标文本中角色的相关文本，确定所述多个角色各自所属的角色类型；按照所述角色相应的角色类型为所述角色匹配相应的音色类别；在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音。2.根据权利要求1所述的方法，其特征在于，所述获取目标文本包括：接收语音合成请求；所述语音合成请求携带语音数据；对所述语音数据进行语音识别，得到目标文本关键词；依据所述目标文本关键词，查找与所述目标文本关键词相对应的目标文本。3.根据权利要求1所述的方法，其特征在于，所述根据所述目标文本中角色的相关文本，确定所述多个角色各自所属的角色类型，包括：确定所述目标文本中分别与各所述角色相关的相关文本；从预设角色类型库中，分别查找与各所述角色的相关文本相匹配的预设角色类型；将查找到的预设角色类型，作为相应角色所属的角色类型。4.根据权利要求1所述的方法，其特征在于，所述在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音，包括：在将所述目标文本转化成语音时，确定所述目标文本中当前待转化的文本的内容；在当前待转化的文本的内容为说话内容时，将所述说话内容按照对应的角色所匹配的音色类别转化为说话语音；在当前待转化的文本的内容为旁白内容时，将所述旁白内容按预设音色类别转化为旁白语音。5.根据权利要求1所述的方法，其特征在于，所述在将所述目标文本转化成语音时，将所述目标文本中的说话内容按照对应的角色所匹配的音色类别转化为说话语音，包括：在将所述目标文本转化成语音时，确定所述目标文本中当前待转化的文本的内容；在当前待转化的文本的内容为说话内容时，定位所述当前待转化的文本的邻近文本；根据所述邻近文本确定与所述说话内容对应的角色；将所述说话内容按照对应的角色所匹配的音色类别转化为说话语音。6.根据权利要求5所述的方法，其特征在于，所述在当前待转化的文本的内容为说话内容时，定位所述当前待转化的文本的邻近文本，包括：在当前待转化的文本的内容为说话内容时，查找在所述当前待转化的文本之前、且与所述当前待转化的文本属于同个整句的第一文本；当查找到所述第一文本、且所述第一文本包括对话词时，将所述第一文本作为所述当前待转化的文本的邻近文本；否则，将在所述当前待转化的文本之后、且与所述当前待转化的文本属于同个整句的第二文本，作为所述当前待转化的文本的邻近文本。7.根据权利要求5所述的方法，其特征在于，所述根据所述邻近文本确定与所述说话内容对应的角色，包括：当所述邻近文本中包括多个角色时，判断所述多个角色的角色指代词之间是否存在被动类型对话词；当所述多个角色的角色指代词之间存在被动...

【专利技术属性】
技术研发人员：樊邵婷，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人