模板化语音合成方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:37056130 阅读:21 留言:0更新日期:2023-03-29 19:33
本发明专利技术公开了一种模板化语音合成方法、装置、设备及计算机可读存储介质。该模板化语音合成方法包括:获取待进行语音合成的话术的目标模板编号和变量信息;获取所述目标模板编号对应的模板语音文件;根据所述变量信息合成得到变量语音文件;对所述模板语音文件和所述变量语音文件进行合并,得到合成语音文件。本发明专利技术能够降低语音合成成本。明能够降低语音合成成本。明能够降低语音合成成本。

【技术实现步骤摘要】
模板化语音合成方法、装置、设备及计算机可读存储介质


[0001]本专利技术涉及语音合成
,尤其涉及一种模板化语音合成方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]智能语音技术是最早落地的人工智能技术,已经广泛应用于多个行业。智能语音技术是实现人与机器通信的重要纽带,智能语音技术落地期的到来使得传统的客服行业朝向智能化转型,智能语音将代替人工客服,缓解客服业务的压力,实现降本增效,从而优化客户体验,加强核心竞争力。
[0003]金融行业在数字化转型的浪潮之中,智能语音技术的落地正当其时。各金融机构纷纷开始投入打造智能语音客服,通过将各业务流程节点的话术输入至机器人中,在进入业务流程的各节点时,通过调用语音合成算法接口,将话术转换为语音文件,进而自动播报。然而,大部分公司并无自研的语音合成算法能力,在SAAS(Software

as

a

Service,软件即服务)服务模式流行的当下,很多中小公司会优先选择购买SAAS服务进行调用。而关于语音合成算法服务的收费,市面上主流的人工智能算法头部企业均按照字数收费且每次合成不能超过300个字。在金融场景下,用户办理一个业务流程,需要转换的合同注意事项、风险告知书等话术文本相对较长,合成成本过高。

技术实现思路

[0004]本专利技术的主要目的在于提供一种模板化语音合成方法、装置、设备及计算机可读存储介质,旨在降低语音合成成本。
[0005]为实现上述目的,本专利技术提供一种模板化语音合成方法,所述模板化语音合成方法包括:
[0006]获取待进行语音合成的话术的目标模板编号和变量信息;
[0007]获取所述目标模板编号对应的模板语音文件;
[0008]根据所述变量信息合成得到变量语音文件;
[0009]对所述模板语音文件和所述变量语音文件进行合并,得到合成语音文件。
[0010]优选地,所述获取所述目标模板编号对应的模板语音文件的步骤包括:
[0011]检测预设数据库中是否存在所述目标模板编号对应的模板语音文件;
[0012]若不存在,则获取所述目标模板编号对应的目标模板文本,对所述目标模板文本进行语音合成处理,得到模板语音文件。
[0013]优选地,所述变量信息包括变量名称和变量值,所述根据所述变量信息合成得到变量语音文件的步骤包括:
[0014]分别对各变量值进行语音合成处理,得到变量语音片段;
[0015]获取各变量名称对应的位置信息,并根据所述位置信息生成对应的第一位置标识;
[0016]将各变量语音片段分别与对应的第一位置标识进行关联,以得到变量语音文件。
[0017]优选地,所述分别对各变量值进行语音合成处理,得到变量语音片段的步骤包括:
[0018]根据所述变量信息获取目标客户的业务办理信息;
[0019]根据所述业务办理信息确定目标语音合成算法;
[0020]通过所述目标语音合成算法分别对各变量值进行语音合成处理,得到变量语音片段。
[0021]优选地,所述对所述模板语音文件和所述变量语音文件进行合并,得到合成语音文件的步骤包括:
[0022]获取所述变量语音文件中各变量语音片段及其对应的第一位置标识;
[0023]获取所述模板语音文件中各模板音频片段及其对应的第二位置标识;
[0024]根据所述第一位置标识和所述第二位置标识对各变量语音片段和各模板音频片段进行合并,得到合成语音文件。
[0025]优选地,所述模板化语音合成方法还包括:
[0026]获取模板话术;
[0027]从所述模板话术中提取得到模板文本;
[0028]生成模板编号,将所述模板文本与所述模板编号进行关联存储。
[0029]优选地,所述模板化语音合成方法还包括:
[0030]接收模板更新请求,根据所述模板更新请求获取待更新模板编号和待更新模板话术;
[0031]从所述待更新模板话术中提取得到待更新模板文本;
[0032]根据所述待更新模板编号确定当前模板文本,并将所述当前模板文本更新为所述待更新模板文本;
[0033]删除所述待更新模板编号对应的模板语音文件。
[0034]此外,为实现上述目的,本专利技术还提供一种模板化语音合成装置,所述模板化语音合成装置包括:
[0035]第一获取模块,用于获取待进行语音合成的话术的目标模板编号和变量信息;
[0036]第二获取模块,用于获取所述目标模板编号对应的模板语音文件;
[0037]语音合成模块,用于根据所述变量信息合成得到变量语音文件;
[0038]音频合并模块,用于对所述模板语音文件和所述变量语音文件进行合并,得到合成语音文件。
[0039]此外,为实现上述目的,本专利技术还提供一种模板化语音合成设备,所述模板化语音合成设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的模板化语音合成程序,所述模板化语音合成程序被所述处理器执行时实现如上所述的模板化语音合成方法的步骤。
[0040]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有模板化语音合成程序,所述模板化语音合成程序被处理器执行时实现如上所述的模板化语音合成方法的步骤。
[0041]本专利技术提供一种模板化语音合成方法、装置、设备及计算机可读存储介质,通过获取待进行语音合成的话术的目标模板编号和变量信息,然后获取目标模板编号对应的模板
语音文件,同时根据变量信息合成得到变量语音文件;进而对模板语音文件和变量语音文件进行合并,得到合成语音文件。即,将话术分为模板和变量两部分,模板部分对应的模板语音文件无需每次合成,只需对变量部分进行语音合成得到变量语音文件,进而对模板语音文件和变量语音文件进行合并,即可得到合成语音文件,以用于播报。通过上述方式,可大大减少语音合成量,从而可降低语音合成成本。同时,由于变量部分通常比较简短,不会超过提供语音合成算法的企业规定的每次合成字数上限值,从而无需多次调用算法接口,因此可进一步节省合成时间,提高响应效率,提升用户的使用体验。
附图说明
[0042]图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;
[0043]图2为本专利技术模板化语音合成方法第一实施例的流程示意图;
[0044]图3为本专利技术模板化语音合成装置第一实施例的功能模块示意图。
[0045]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0046]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0047]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图。
[0048]本专利技术实施例模板化语音合成设备可以是PC(Personal Comput本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模板化语音合成方法,其特征在于,所述模板化语音合成方法包括:获取待进行语音合成的话术的目标模板编号和变量信息;获取所述目标模板编号对应的模板语音文件;根据所述变量信息合成得到变量语音文件;对所述模板语音文件和所述变量语音文件进行合并,得到合成语音文件。2.如权利要求1所述的模板化语音合成方法,其特征在于,所述获取所述目标模板编号对应的模板语音文件的步骤包括:检测预设数据库中是否存在所述目标模板编号对应的模板语音文件;若不存在,则获取所述目标模板编号对应的目标模板文本,对所述目标模板文本进行语音合成处理,得到模板语音文件。3.如权利要求1所述的模板化语音合成方法,其特征在于,所述变量信息包括变量名称和变量值,所述根据所述变量信息合成得到变量语音文件的步骤包括:分别对各变量值进行语音合成处理,得到变量语音片段;获取各变量名称对应的位置信息,并根据所述位置信息生成对应的第一位置标识;将各变量语音片段分别与对应的第一位置标识进行关联,以得到变量语音文件。4.如权利要求3所述的模板化语音合成方法,其特征在于,所述分别对各变量值进行语音合成处理,得到变量语音片段的步骤包括:根据所述变量信息获取目标客户的业务办理信息;根据所述业务办理信息确定目标语音合成算法;通过所述目标语音合成算法分别对各变量值进行语音合成处理,得到变量语音片段。5.如权利要求3所述的模板化语音合成方法,其特征在于,所述对所述模板语音文件和所述变量语音文件进行合并,得到合成语音文件的步骤包括:获取所述变量语音文件中各变量语音片段及其对应的第一位置标识;获取所述模板语音文件中各模板音频片段及其对应的第二位置标识;根据所述第一位置标识...

【专利技术属性】
技术研发人员:张鹏飞井绪海夏溧牟焱文
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1