System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能体声音输出处理方法、装置及设备制造方法及图纸_技高网

一种智能体声音输出处理方法、装置及设备制造方法及图纸

技术编号:41792615 阅读:10 留言:0更新日期:2024-06-24 20:18
本申请公开了一种智能体声音输出处理方法、装置及设备,通过获取智能体的目标行为策略信息、当前场景种类信息以及本体状态信息,分别确定声音播放指标以及至少一个目标原始音源,保证声音效果的确定性,并根据声音播放指标对目标原始音源进行拼接结构化处理,增强了声音表达的随机性和丰富性,解决了当前智能设备声音输出的技术实现中,采用预设应答会让声音的表达具有强烈的固定性,缺乏变化,采用合成方式输出声音内容,合成效果是否与预期相符具有较大的不确定性,容易影响用户体验的技术问题。

【技术实现步骤摘要】

本申请涉及智能设备,尤其涉及一种智能体声音输出处理方法、装置及设备


技术介绍

1、当前很多智能设备相关产品都会配备声音进行播放。目前市面上主要有两种声音播放方式:

2、一种是预置声音,在确定的情况下,播放确定的声音,如商场的服务机器人、扫地机器人、智能音箱的语音功能应答等,在预设的触发条件下播放预置声音,包括语言、音乐、特效音等。

3、另一种方式是通过生成的方式进行表达,根据外界的输入条件进行分析,生成想表达的内容,结合设定的音色库进行合成,最后通过声音设备进行播放,如虚拟人、智能ai设备等。

4、但当前智能设备声音输出的技术实现中,若采用预设应答会让声音的表达具有强烈的固定性,缺乏变化;若采用合成方式输出声音内容,虽然丰富性和随机性更强,但合成效果是否与预期相符具有较大的不确定性,容易影响用户体验。


技术实现思路

1、本申请提供了一种智能体声音输出处理方法、装置及设备,解决了当前智能设备声音输出的技术实现中,采用预设应答会让声音的表达具有强烈的固定性,缺乏变化,采用合成方式输出声音内容,合成效果是否与预期相符具有较大的不确定性,容易影响用户体验的技术问题。

2、有鉴于此,本申请第一方面提供了一种智能体声音输出处理方法,所述方法包括:

3、s1、获取目标行为策略信息、当前场景种类信息以及本体状态信息;

4、s2、根据所述目标行为策略信息确定声音播放指标,所述声音播放指标包括播放时长以及播放起始点;

>5、s3、根据所述当前场景种类信息以及所述本体状态信息确定预设音源库中的至少一个目标原始音源;

6、s4、根据所述声音播放指标对至少一个所述目标原始音源进行拼接结构化处理,生成待输出声音文件。

7、所述步骤s3具体包括:

8、根据所述当前场景种类信息以及所述本体状态信息,从预设音源库中定位至少一个目标原始音源,所述目标原始音源包括帧头、主体以及尾部;

9、当包含两个或两个以上所述目标原始音源时,随机选择两个或两个以上所述目标原始音源的一个帧头、主体以及尾部进行拼接组合,生成新的目标原始音源。

10、可选地,所述步骤s4具体包括:

11、若所述声音播放指标的播放时长与所述目标原始音源的播放时长的比值小于第一预设阈值,则对所述目标原始音源的尾部进行插值与幅频特性的滤波,生成新的音源文件。

12、可选地,所述步骤s4具体包括:

13、若所述声音播放指标的播放时长与所述目标原始音源的播放时长的比值不小于第一预设阈值,但小于第二预设阈值,则以所述目标原始音源的主体的播放时长为,在所述目标原始音源的主体与尾部之间插入无声间隔,并计算所述目标原始音源的主体的重复次数,按照所述重复次数插入所述目标原始音源的主体,生成新的音源文件。

14、可选地,所述步骤s4具体包括:

15、若所述声音播放指标的播放时长与所述目标原始音源的播放时长的比值大于第二预设阈值,则随机选择两个或两个以上所述目标原始音源,以无声音频为间隔,拼接生成新的音源文件。

16、可选地,其特征在于,所述步骤s4还包括:

17、根据所述本体状态信息对新的音源文件进行变调和/或变速处理,生成待输出声音文件。

18、可选地,所述根据所述本体状态信息对新的音源文件进行变调处理具体为:

19、按照第一预设公式对新的音源文件的声音基频ω进行调整,所述第一预设公式为:

20、

21、其中,αn为声音基频ω随时间tn的变化,表示不同的本体状态信息,取值范围为(-0.5~+0.5),an/bn表示不同频率下声音波形的振幅系数,代表声音强度。

22、可选地,所述根据所述本体状态信息对新的音源文件进行变速处理具体为:

23、按照第二预设公式对新的音源文件的播放速度进行调整,所述第二预设公式为:

24、

25、其中,s表示播放速度,s>1表示播放速度加快,s<1表示播放速度放慢,s的取值范围为(0.8,1.2)。

26、本申请第二方面提供一种智能体声音输出处理装置,所述装置包括:

27、获取单元,用于获取目标行为策略信息、当前场景种类信息以及本体状态信息;

28、第一确定单元,用于根据所述目标行为策略信息确定声音播放指标,所述声音播放指标包括播放时长以及播放起始点;

29、第二确定单元,用于根据所述当前场景种类信息以及所述本体状态信息确定预设音源库中的至少一个目标原始音源;

30、处理单元,用于根据所述声音播放指标对至少一个所述目标原始音源进行拼接结构化处理,生成待输出声音文件。

31、本申请第三方面提供一种智能体声音输出处理设备,所述设备包括处理器以及存储器:

32、所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

33、所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的智能体声音输出处理方法的步骤。

34、本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的智能体声音输出处理方法的步骤。

35、从以上技术方案可以看出,本申请实施例具有以下优点:

36、本申请中,提供了一种智能体声音输出处理方法、装置及设备,通过获取智能体的目标行为策略信息、当前场景种类信息以及本体状态信息,分别确定声音播放指标以及至少一个目标原始音源,保证声音效果的确定性,并根据声音播放指标对目标原始音源进行拼接结构化处理,增强了声音表达的随机性和丰富性,解决了当前智能设备声音输出的技术实现中,采用预设应答会让声音的表达具有强烈的固定性,缺乏变化,采用合成方式输出声音内容,合成效果是否与预期相符具有较大的不确定性,容易影响用户体验的技术问题。

本文档来自技高网...

【技术保护点】

1.一种智能体声音输出处理方法,其特征在于,包括:

2.根据权利要求1所述的智能体声音输出处理方法,其特征在于,所述步骤S3具体包括:

3.根据权利要求2所述的智能体声音输出处理方法,其特征在于,所述步骤S4具体包括:

4.根据权利要求2所述的智能体声音输出处理方法,其特征在于,所述步骤S4具体包括:

5.根据权利要求2所述的智能体声音输出处理方法,其特征在于,所述步骤S4具体包括:

6.根据权利要求3至5任一项所述的智能体声音输出处理方法,其特征在于,所述步骤S4还包括:

7.根据权利要求6所述的智能体声音输出处理方法,其特征在于,所述根据所述本体状态信息对新的音源文件进行变调处理具体为:

8.根据权利要求6所述的智能体声音输出处理方法,其特征在于,所述根据所述本体状态信息对新的音源文件进行变速处理具体为:

9.一种智能体声音输出处理装置,其特征在于,包括:

10.一种智能体声音输出处理设备,其特征在于,所述设备包括处理器以及存储器:

【技术特征摘要】

1.一种智能体声音输出处理方法,其特征在于,包括:

2.根据权利要求1所述的智能体声音输出处理方法,其特征在于,所述步骤s3具体包括:

3.根据权利要求2所述的智能体声音输出处理方法,其特征在于,所述步骤s4具体包括:

4.根据权利要求2所述的智能体声音输出处理方法,其特征在于,所述步骤s4具体包括:

5.根据权利要求2所述的智能体声音输出处理方法,其特征在于,所述步骤s4具体包括:

6.根据权利要求3至5任一项所...

【专利技术属性】
技术研发人员:张孚阳魏强万思琦金友芝张明哲
申请(专利权)人:北京萌友智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1