语音消息处理方法、装置及电子设备制造方法及图纸

技术编号:35101936 阅读:21 留言:0更新日期:2022-10-01 17:09
本申请公开了一种语音消息处理方法、装置及电子设备,属于计算机技术领域。该方法包括:获取待处理语音消息以及所述待处理语音消息对应的目标修正程度;根据所述目标修正程度确定相似程度阈值;通过语音修正模型,确定所述待处理语音消息与关键语音消息之间的相似程度,基于所述相似程度和所述相似程度阈值,对所述关键语音消息进行个性化语音修正,获得目标语音消息;所述关键语音消息与所述待处理语音消息相对应;其中,所述语音修正模型是利用目标对象的样本语音训练得到的;所述目标对象为所述待处理语音消息对应的消息录制对象;所述目标语音消息具有所述待处理语音消息的语音特性以及所述目标对象的声纹特性。音特性以及所述目标对象的声纹特性。音特性以及所述目标对象的声纹特性。

【技术实现步骤摘要】
语音消息处理方法、装置及电子设备


[0001]本申请属于计算机
,具体涉及一种语音消息处理方法、装置及电子设备。

技术介绍

[0002]随着科技的不断提升,人们使用电子设备的频率也越来越高,人们联系时经常会使用到一些应用程序中的语音消息功能,语音消息带来极大便捷的同时,其还具有生动且带有较强的用户特色,在传播中信息损失较小等特点。
[0003]但在使用过程中,用户在发送多条时长较长的语音消息时,若录制时中间出错,就需要反复录制新的消息,存在语音消息发送时长较长,从语音消息中获取有效信息效率低的问题。

技术实现思路

[0004]本申请实施例提供一种语音消息处理方法、装置及电子设备,能够解决现有技术中发送语音消息时,若录制中间出错需要反复录制新的消息,存在语音消息发送时长较长,从语音消息中获取有效信息效率低的问题。
[0005]第一方面,本申请实施例提供了一种语音消息处理方法,所述方法包括:
[0006]获取待处理语音消息以及所述待处理语音消息对应的目标修正程度;
[0007]根据所述目标修正程度确定相似程度阈值;
[0008]通过语音修正模型,确定所述待处理语音消息与关键语音消息之间的相似程度,基于所述相似程度和所述相似程度阈值,对所述关键语音消息进行个性化语音修正,获得目标语音消息;所述关键语音消息与所述待处理语音消息相对应;
[0009]其中,所述语音修正模型是利用目标对象的样本语音训练得到的;所述目标对象为所述待处理语音消息对应的消息录制对象;所述目标语音消息具有所述待处理语音消息的语音特性以及所述目标对象的声纹特性。
[0010]第二方面,本申请实施例提供了一种语音消息处理装置,所述装置包括:
[0011]获取模块,用于获取待处理语音消息以及所述待处理语音消息对应的目标修正程度;
[0012]确定模块,用于根据所述目标修正程度确定相似程度阈值;
[0013]修正模块,用于通过语音修正模型,确定所述待处理语音消息与关键语音消息之间的相似程度,基于所述相似程度和所述相似程度阈值,对所述关键语音消息进行个性化语音修正,获得目标语音消息;所述关键语音消息与所述待处理语音消息相对应;
[0014]其中,所述语音修正模型是利用目标对象的样本语音训练得到的;所述目标对象为所述待处理语音消息对应的消息录制对象;所述目标语音消息具有所述待处理语音消息的语音特性以及所述目标对象的声纹特性。
[0015]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理
器执行时实现如第一方面所述的方法的步骤。
[0016]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0017]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0018]在本申请实施例中,首先获取待处理语音消息以及待处理语音消息对应的目标修正程度,然后根据目标修正程度确定相似程度阈值,最后通过利用目标对象的样本语音训练得到的语音修正模型,确定待处理语音消息与关键语音消息之间的相似程度,基于相似程度和相似程度阈值,对关键语音消息进行个性化语音修正,获得目标语音消息。本申请实施例通过获取的目标修正程度确定出相似程度阈值,利用语音修正模型对关键语音消息进行个性化语音修正,可以得到具有待处理语音消息的语音特性以及目标对象的声纹特性的目标语音消息,可以避免用户在录制语音消息出错时重复录制,提高获取语音信息的效率,同时还可以使得最终得到的目标语音消息与用户录制语音消息时的语气、语调、语速等信息均相同,使得最终得到的语音消息更像消息录制本人说的话,提升语音消息处理的准确性。
附图说明
[0019]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0020]图1是本申请的一个实施例提供的一种语音消息处理方法的流程图;
[0021]图2是本申请的一个实施例提供的一种获取待处理语音消息的示意图;
[0022]图3是本申请的一个实施例提供的一种选择目标修正程度的示意图;
[0023]图4是本申请的一个实施例提供的另一种选择目标修正程度的示意图;
[0024]图5是本申请的一个实施例提供的语音修正模型的结构示意图;
[0025]图6是本申请的一个实施例提供的语音网络的结构示意图;
[0026]图7是本申请的一个实施例提供的语音修正模型训练时的输入和输出的简单结构示意图;
[0027]图8是本申请的一个实施例提供的语音消息处理方法的整体流程示意图;
[0028]图9是本申请的一个实施例提供的一种语音消息处理装置的结构示意图;
[0029]图10是本申请的一个实施例提供的一种电子设备的结构示意图;
[0030]图11是本申请的一个实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
[0031]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0032]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互
换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0033]在一些实施例中,用户在发送时长较长的语音消息时,可能会在录制的中间出现一些错误,导致需要用户反复录制才能生成待发送的语音消息,这就使得用户发送语音消息花费的时间较长,但其中的有效信息较少,这就导致从这些语音消息中获取信息的效率较低。为了解决上述问题,本申请实施例提出了一种语音消息处理方法、装置及电子设备,在用户发送语音消息的场景中,用户在录制错误时,可以继续录制,无需重新录制,在录制结束后,利用本申请提供的语音消息处理方法,将录制的至少一条语音消息转化成目标语音消息,该目标语音消息具有消息录制用户的声纹特性,并且该目标语音消息具有与录制的至少一条语音消息相同的语音特性,例如用户录制的至少一条语音消息是开心的语气,得到的目标语音消息也是开心的语气,最后将该目标语音消息显示到会话界面中,使得用户得到的是内容简洁、具有消息录制对象声纹特性、与至少一条语音消息相同语音特性的语音消息,减少本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音消息处理方法,其特征在于,包括:获取待处理语音消息以及所述待处理语音消息对应的目标修正程度;根据所述目标修正程度确定相似程度阈值;通过语音修正模型,确定所述待处理语音消息与关键语音消息之间的相似程度,基于所述相似程度和所述相似程度阈值,对所述关键语音消息进行个性化语音修正,获得目标语音消息;所述关键语音消息与所述待处理语音消息相对应;其中,所述语音修正模型是利用目标对象的样本语音训练得到的;所述目标对象为所述待处理语音消息对应的消息录制对象;所述目标语音消息具有所述待处理语音消息的语音特性以及所述目标对象的声纹特性。2.根据权利要求1所述的方法,其特征在于,所述关键语音消息的获取步骤包括:通过语音转换模型,将所述待处理语音消息转换为消息文本;通过文本提取模型,从所述消息文本中提取关键内容,得到关键文本;通过文本转换模型,将所述关键文本转换为所述关键语音消息。3.根据权利要求2所述的方法,其特征在于,所述通过文本提取模型,从所述消息文本中提取关键内容,得到关键文本之前,还包括:根据所述目标修正程度确定内容精简程度;所述通过文本提取模型,从所述消息文本中提取关键内容,得到关键文本包括:通过与所述内容精简程度相匹配的文本提取模型,从所述消息文本中提取关键内容,得到所述关键文本。4.根据权利要求2所述的方法,其特征在于,所述通过语音修正模型,确定所述待处理语音消息与关键语音消息之间的相似程度,包括:通过语音修正模型的语音网络,获取所述关键语音消息的语音特征,以及所述待处理语音消息的语音特征;通过语音修正模型的文本网络,基于所述关键语音消息的语音特征,获取所述关键语音消息的文本语音组合特征,并基于所述待处理语音消息的语音特征,获取所述待处理语音消息的文本语音组合特征;通过语音修正模型的相似度评估网络,基于所述关键语音消息的文本语音组合特征,以及所述待处理语音消息的文本语音组合特征,确定所述关键语音消息与所述待处理语音消息之间的相似程度。5.根据权利要求2所述的方法,其特征在于,所述基于所述相似程度和所述相似程度阈值,对所述关键语音消息进行个性化语音修正,获得目标语音消...

【专利技术属性】
技术研发人员:雷夏飞
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1