一种智能体声音输出处理方法、装置及设备制造方法及图纸

技术编号：41792615 阅读：20 留言：0更新日期：2024-06-24 20:18

本申请公开了一种智能体声音输出处理方法、装置及设备，通过获取智能体的目标行为策略信息、当前场景种类信息以及本体状态信息，分别确定声音播放指标以及至少一个目标原始音源，保证声音效果的确定性，并根据声音播放指标对目标原始音源进行拼接结构化处理，增强了声音表达的随机性和丰富性，解决了当前智能设备声音输出的技术实现中，采用预设应答会让声音的表达具有强烈的固定性，缺乏变化，采用合成方式输出声音内容，合成效果是否与预期相符具有较大的不确定性，容易影响用户体验的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能设备，尤其涉及一种智能体声音输出处理方法、装置及设备。

技术介绍

1、当前很多智能设备相关产品都会配备声音进行播放。目前市面上主要有两种声音播放方式：

2、一种是预置声音，在确定的情况下，播放确定的声音，如商场的服务机器人、扫地机器人、智能音箱的语音功能应答等，在预设的触发条件下播放预置声音，包括语言、音乐、特效音等。

3、另一种方式是通过生成的方式进行表达，根据外界的输入条件进行分析，生成想表达的内容，结合设定的音色库进行合成，最后通过声音设备进行播放，如虚拟人、智能ai设备等。

4、但当前智能设备声音输出的技术实现中，若采用预设应答会让声音的表达具有强烈的固定性，缺乏变化；若采用合成方式输出声音内容，虽然丰富性和随机性更强，但合成效果是否与预期相符具有较大的不确定性，容易影响用户体验。

技术实现思路

1、本申请提供了一种智能体声音输出处理方法、装置及设备，解决了当前智能设备声音输出的技术实现中，采用预设应答会让声音的表达具有强烈的固定性，缺乏变化，采用合成方式输出声音内容，合成效果是否与预期相符具有较大的不确定性，容易影响用户体验的技术问题。

2、有鉴于此，本申请第一方面提供了一种智能体声音输出处理方法，所述方法包括：

3、s1、获取目标行为策略信息、当前场景种类信息以及本体状态信息；

4、s2、根据所述目标行为策略信息确定声音播放指标，所述声音播放指标包括播放时长以及播放起始点；