一种语音合成模型训练平台制造技术

技术编号:37369826 阅读:9 留言:0更新日期:2023-04-27 07:15
本申请提供了一种语音合成模型训练平台;所述平台包括:前端模块,用于创建训练任务;后端模块,用于获取前端模块创建的训练任务,若查询到存在图形处理器(GPU)的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。本申请提供的语音合成模型训练平台,在创建训练任务确定之后,用户将不用再进行任何操作,直接等待最后的训练结果即可,解决了语音模型训练流程复杂的问题,提高了训练准确率。高了训练准确率。高了训练准确率。

【技术实现步骤摘要】
一种语音合成模型训练平台


[0001]本申请涉及语音合成
,尤其涉及一种语音合成模型训练平台。

技术介绍

[0002]使用传统方式进行语音模型训练时,通常需要标注人员进行填写训练任务的相关信息后交给算法团队进行训练。该过程不仅步骤较多,效率较低,而且需要确保每一步都没有失误才能保证最后的训练成功。若中间过程出现错误,则会导致训练失败的情况发生。
[0003]因此,有必要设计一种提高模型任务训练效率和准确率的方案。

技术实现思路

[0004]本申请实施例提供一种语音合成模型训练平台,可以提高语音合成模型的训练任务的训练效率以及准确率。
[0005]本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供一种语音合成模型训练平台,包括:
[0007]前端模块,用于创建训练任务;
[0008]后端模块,用于获取前端模块创建的训练任务,若查询到存在GPU的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;
[0009]算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。
[0010]在上述方案中,所述前端模块,具体用于:
[0011]根据用户名和标注任务名称生成训练任务名称;
[0012]确定发音人名称、确定采样率、确定发音人风格、确定发音人性别、确定是否重读。在上述方案中,所述前端模块还用于显示以下至少一项训练任务的任务列表:
[0013]正在准备训练的任务列表、正在训练中的任务列表、训练成功完成的任务列表、训练完成失败的任务列表和已经取消训练的任务列表中至少一项。
[0014]在上述方案中,所述前端模块还用于:
[0015]对训练成功完成的训练任务输出试听语音。
[0016]在上述方案中,所述前端模块还用于:
[0017]对训练成功完成的训练任务,接收自定义文本的输入;
[0018]基于所述自定义文本和训练任务的训练结果所对应的发音人的声音,输出与自定义文本对应的语音。
[0019]在上述方案中,所述前端模块还用于:
[0020]取消正在准备训练的训练任务。
[0021]在上述方案中,所述后端模块还用于:
[0022]若未查询到图形处理器(Graphic Processing Unit,GPU)的空闲核心,则等待第一时间后,再次查询所述图像处理器GPU是否存在空闲核心。
[0023]在上述方案中,所述后端模块还用于:
[0024]获取算法模块中的所述训练任务的训练结果;
[0025]对所述训练结果进行解析,得到解析结果;
[0026]将所述解析结果发送给前端模块。
[0027]在上述方案中,所述后端模块还用于:
[0028]在所述训练任务结束之后,释放所述空闲核心。
[0029]在上述方案中,所述后端模块还用于:
[0030]对正在训练中的训练任务进行超时判断,若所述训练任务的训练时间超过预设的时间阈值,则将所述训练任务标记为训练完成失败的训练任务。
[0031]本申请实施例提供的语音合成模型训练平台,前端模块,用于创建训练任务;后端模块,用于获取前端模块创建的训练任务,若查询到存在GPU的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。本申请提供的语音合成模型训练平台,用户可通过可视化的方式,在创建训练任务之后,将不用再进行任何操作,等待最后的训练结果即可。实现了一键完成训练任务,解决了语音模型训练流程复杂、错误率较高的问题,提高了训练准确率。
附图说明
[0032]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0033]图1是本申请实施例提供的语音合成模型训练平台的一种可选结构示意图;
[0034]图2是本申请实施例提供的语音合成模型训练平台的一种可选处理流程示意图;
[0035]图3是本申请实施例提供的语音合成模型训练平台的另一种可选处理流程示意图。
具体实施方式
[0036]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0037]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0038]在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
[0039]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0040]下面将介绍本申请实施例提供的一种语音合成模型训练平台,参见图1。
[0041]在图1中,语音合成模型训练平台100包括前端模块101、后端模块102和算法模块103。
[0042]在一些实施例中,前端模块101用于创建训练任务。
[0043]其中,前端模块101可以使标注人员通过界面可视化的方式执行训练任务的相应操作。标注人员通过点击新建训练任务按钮,在弹出的新建页面中选择标注任务的名称之后,系统根据标注人员的用户名和运营人选择的标注任务的名称,自动生成训练任务名称。此外,标注人员还需在弹出的新建页面中,填写发音人名称、填写采样率、填写发音人风格、填写发音人性别、填写是否重读等信息。在新建页面填写完毕后,点击确定按钮,训练任务会进入正在准备训练的任务列表中。
[0044]前端模块101还用于显示不同状态的训练任务的任务列表。其中,不同状态的训练任务的任务列表包括:正在准备训练的任务列表、正在训练中的任务列表、训练成功完成的任务列表、训练完成失败的任务列表和已经取消训练的任务列表中至少一项。
[0045]前端模块101可以针对训练成功完成的训练任务,播放该任务的训练结果对应的语音试听结果。还可以对成功完成的训练任务,输入自定义文本,基于自定文本的内容,试听该文本对应的训练任务的训练结果中的发音人的声音。
[0046]前端模块101中,还可以对正在准备训练的任务通过点击取消按钮进行取消,被取消的任务将从正在准备训练的任务列表进入已经取消训练的任务列表中。
[0047]在一些实施例中,后端模块102用于在新建训练任务后,若查询到存在GPU的空闲核心,则将空闲核心的计算资源分配给该训练任务。若未查询到GPU存在空闲核心,则等待第一时间后,再次查询GPU是否存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音合成模型训练平台,其特征在于,所述平台包括:前端模块,用于创建训练任务;后端模块,用于获取前端模块创建的训练任务,若查询到存在图形处理器GPU的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。2.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块,具体用于:根据用户名和标注任务名称生成训练任务名称;确定发音人名称、确定采样率、确定发音人风格、确定发音人性别、确定是否重读。3.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于显示以下至少一项训练任务的任务列表:正在准备训练的任务列表、正在训练中的任务列表、训练成功完成的任务列表、训练完成失败的任务列表和已经取消训练的任务列表。4.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于:对训练成功完成的训练任务输出试听语音。5.根据权利要求1所述的语音合成模型训练平台,其特征在于,所述前端模块还用于:对训练成功完成的...

【专利技术属性】
技术研发人员:王正江明奇杨喜鹏殷昊陈云琳
申请(专利权)人:上海墨百意信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1