一种人声复刻方法和人声复刻系统技术方案

技术编号:38001046 阅读:6 留言:0更新日期:2023-06-30 10:14
本发明专利技术涉及一种人声复刻方法,包括以下步骤:接收待复刻人声数据;从人声数据库中调用与待复刻人声数据匹配度最高的第一人声数据;基于待复刻人声数据进行声音复刻训练,获得第二人声数据;若声音复刻训练未完成,则基于第一人声数据合成复刻音频,若声音复刻训练已完成,则基于第二人声数据合成复刻音频;输出复刻音频。本发明专利技术还提出了一种人声复刻系统。本发明专利技术具有以下特点:进行快速合成和精致合成,能够利用快速合成的复刻音频快速的对汽车的播报声音进行替换,从复刻速度上提升用户的使用体验,能够利用精致合成的复刻音频来保证汽车的播报声音与用户喜好的人声的高相似度,从复刻相似度上提升用户的使用体验。复刻相似度上提升用户的使用体验。复刻相似度上提升用户的使用体验。

【技术实现步骤摘要】
一种人声复刻方法和人声复刻系统


[0001]本专利技术涉及汽车,具体涉及一种人声复刻方法和人声复刻系统。

技术介绍

[0002]车载语音交互能为用户控制车辆带来极大的帮助,然而当前车载智能语音系统,在同一个车型中,语音助手的声音、音色等特征都是相同的,或仅有很少的选项可供选择,存在难以满足用户的多样化和个性需求的技术问题。
[0003]现有技术中的人声复刻技术能够通过声音复刻训练模型对采集的人声样本进行复刻,但是利用声音复刻训练耗时较长,在用户有将自己喜欢的人声设置成语音助手的声音时,在用户完成人声样本采集后,需要等待较长时间(20分钟左右),在声音复刻训练完成后,才能够将复刻的人声设置成语音助手的声音,存在难以快速将用户喜好的人声设置成语音助手的声音的技术问题,用户的体验较差。

技术实现思路

[0004]本专利技术的目的是提出一种人声复刻方法和人声复刻系统,以减轻或消除至少一个上述的技术问题。
[0005]本专利技术所述的一种人声复刻方法,包括以下步骤:接收待复刻人声数据;从人声数据库中调用与所述待复刻人声数据匹配度最高的第一人声数据;基于所述待复刻人声数据进行声音复刻训练,获得第二人声数据;若所述声音复刻训练未完成,则基于所述第一人声数据合成复刻音频,若所述声音复刻训练已完成,则基于所述第二人声数据合成复刻音频;输出所述复刻音频。
[0006]可选的,所述从人声数据库中调用与所述待复刻人声数据匹配度最高的第一人声数据包括以下步骤:分析和提取所述待复刻人声数据的人声特征,从人声数据库中调用与所述人声特征匹配度最高的第一人声数据。
[0007]可选的,所述分析和提取所述待复刻人声数据的人声特征包括以下步骤:截取所述待复刻人声数据中的一部分人声数据作为待分析人声数据,分析和提取所述待分析人声数据的人声特征。
[0008]可选的,还包括以下步骤:接收待播报文案;判断所述声音复刻训练是否完成,若是,则基于所述第二人声数据和所述待播报文案合成复刻音频,否则基于所述第一人声数据和所述待播报文案合成复刻音频;输出所述复刻音频。
[0009]本专利技术所述的一种人声复刻系统,包括云端服务器,所述云端服务器用于:接收待
复刻人声数据;从人声数据库中调用与所述待复刻人声数据匹配度最高的第一人声数据;基于所述待复刻人声数据进行声音复刻训练,获得第二人声数据;若所述声音复刻训练未完成,则基于所述第一人声数据合成复刻音频,若所述声音复刻训练已完成,则基于所述第二人声数据合成复刻音频;输出所述复刻音频。
[0010]可选的,所述云端服务器包括快速合成模块和精致合成模块;所述快速合成模块用于从人声数据库中调用与所述待复刻人声数据匹配度最高的第一人声数据,基于所述第一人声数据合成复刻音频;所述精致合成模块用于基于所述待复刻人声数据进行声音复刻训练,获得第二人声数据,基于所述第一人声数据合成复刻音频。
[0011]可选的,还包括麦克风、车机和扬声器;所述麦克风用于获取用户输入的待复刻人声数据;所述车机用于向所述云端服务器发送所述待复刻人声数据,接收所述云端服务器输出的复刻音频,控制所述扬声器播报所述复刻音频;所述扬声器用于播报所述复刻音频。
[0012]本专利技术具有以下特点:进行快速合成和精致合成,能够利用快速合成的复刻音频快速的对汽车的播报声音进行替换,从复刻速度上提升用户的使用体验,能够利用精致合成的复刻音频来保证汽车的播报声音与用户喜好的人声的高相似度,从复刻相似度上提升用户的使用体验。
附图说明
[0013]图1为具体实施方式中所述的人声录入过程的流程图;图2为具体实施方式中所述的人声合成过程的流程图;图3为具体实施方式中所述的人声复刻系统的示意图。
具体实施方式
[0014]以下将参照附图和优选实施例来说明本专利技术的实施方式,本领域技术人员可由本说明书中所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。应当理解,优选实施例仅为了说明本专利技术,而不是为了限制本专利技术的保护范围。
[0015]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0016]本专利技术提出的一种人声复刻方法,包括以下步骤:接收待复刻人声数据;从人声数据库中调用与待复刻人声数据匹配度最高的第一人声数据;基于待复刻人声数据进行声音复刻训练,获得第二人声数据;若声音复刻训练未完成,则基于第一人声数据合成复刻音频,若声音复刻训练已完成,则基于第二人声数据合成复刻音频;输出复刻音频。采用上述的技术方案,进行快速合成和精致合成,能够利用快速合成的复刻音频快速的对汽车的播报声音进行替换,从复刻速度上提升用户的使用体验,能够利用精致合成的复刻音频来保
证汽车的播报声音与用户喜好的人声的高相似度,从复刻相似度上提升用户的使用体验。
[0017]在一些实施例中,从人声数据库中调用与待复刻人声数据匹配度最高的第一人声数据包括以下步骤:分析和提取待复刻人声数据的人声特征,从人声数据库中调用与人声特征匹配度最高的第一人声数据。作为一种具体示例,人声特征为声纹,从人声数据库中找到并调用与待复刻人声数据的声纹最相似的第一人声数据。
[0018]在一些实施例中,分析和提取待复刻人声数据的人声特征包括以下步骤:截取待复刻人声数据中的一部分人声数据作为待分析人声数据,分析和提取待分析人声数据的人声特征。采用上述的技术方案,能够提升分析和提取的速度,能够提升人声复刻速度。作为一种具体示例,在人声录入过程会录入三句话,在快速合成模块仅分析和提取三句话中的一句话的人声特征。
[0019]在一些实施例中,人声复刻方法还包括以下步骤:接收待播报文案;判断声音复刻训练是否完成,若是,则基于第二人声数据和待播报文案合成复刻音频,否则基于第一人声数据和待播报文案合成复刻音频;输出复刻音频。作为一种具体示例,第一人声数据和第二人声数据包含响度数据、音调数据和音色数据。
[0020]作为一种具体实施例,人声复刻方法应用于人声复刻系统,人声复刻系统包括云端服务器、麦克风、车机和扬声器,云端服务器中设置有快速合成模块和精致合成模块;人声复刻方法包括人声录入过程和人声合成过程。
[0021]如图1所示,人声录入过程包括以下步骤:S101:由车机的屏幕进入车机端的人声录入界面;S102:车机的屏幕显示人声录入文案,用户朗读人声录入文案,朗读音频被麦克风拾取,然后朗读音频送入车机;S103:车机对朗读音频进行识别,并将识别结果与人声录入文案进行对比分析,判断朗读音频是否满足要求,若不满足要求,则引导用户重新录入朗读音频,直至朗读音频满足要求;S104:车机通过网络将待复刻人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人声复刻方法,其特征在于,包括以下步骤:接收待复刻人声数据;从人声数据库中调用与所述待复刻人声数据匹配度最高的第一人声数据;基于所述待复刻人声数据进行声音复刻训练,获得第二人声数据;若所述声音复刻训练未完成,则基于所述第一人声数据合成复刻音频,若所述声音复刻训练已完成,则基于所述第二人声数据合成复刻音频;输出所述复刻音频。2.根据权利要求1所述的人声复刻方法,其特征在于,所述从人声数据库中调用与所述待复刻人声数据匹配度最高的第一人声数据包括以下步骤:分析和提取所述待复刻人声数据的人声特征,从人声数据库中调用与所述人声特征匹配度最高的第一人声数据。3.根据权利要求2所述的人声复刻方法,其特征在于,所述分析和提取所述待复刻人声数据的人声特征包括以下步骤:截取所述待复刻人声数据中的一部分人声数据作为待分析人声数据,分析和提取所述待分析人声数据的人声特征。4.根据权利要求1所述的人声复刻方法,其特征在于,还包括以下步骤:接收待播报文案;判断所述声音复刻训练是否完成,若是,则基于所述第二人声数据和所述待播报文案合成复刻音频,否则基于所述第一人声数据和所述待播报文案合成复刻音...

【专利技术属性】
技术研发人员:赵喜江陈立涛孙澳张迅
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1