System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种语速调节方法、系统及装置制造方法及图纸_技高网

一种语速调节方法、系统及装置制造方法及图纸

技术编号:41809450 阅读:5 留言:0更新日期:2024-06-24 20:28
一种语速调节方法、系统及装置,用以按照适合用户的语速生成语音,以提升用户的人机交互体验。其中方法包括:语音对话装置向终端设备发送第一语音,并接收来自终端设备的语速反馈信息,根据该语速反馈信息,向终端设备发送第二语音,第二语音的语速和第一语音的语速不同。采用该语速调节方法,通过按照语速反馈信息调节后续向终端设备发送的语音的语速,能使该语音的语速匹配用户的真实需求,有助于提升用户的人机交互体验。

【技术实现步骤摘要】

本申请涉及语音对话,提供了一种语速调节方法、系统及装置


技术介绍

1、语音对话机器人,也称为对话式人工智能机器人,能通过语音对话的方式实现人机交互,捕捉语境并提供智能响应。随着智能语音技术的发展,语音对话机器人以其持久的工作时间、平稳的对话态度和极快的响应速度等优点,逐渐应用在客服服务、自动化操作、智能家居控制及无人驾驶等领域。

2、然而,目前市面上的语音对话机器人在对话的语速设计上仍存在一些缺陷,常常使得用户对与语音对话机器人的通话流程感到不满,更有甚者,还可能会使得用户与语音对话机器人的通话流程无法再继续进行下去,不利于提高用户的人机交互体验。

3、因此,目前对语音对话机器人的语速设计方面还有待进一步研究。


技术实现思路

1、本申请提供一种语速调节方法、装置及系统,用以按照适合用户的语速生成语音,以提升用户的人机交互体验。

2、第一方面,本申请提供一种语速调节方法,该方法适用于语音对话装置,语音对话装置可以是语音对话机器人,也可以是芯片或电路,比如封装在语音对话机器人中的芯片或电路。该方法包括:语音对话装置向终端设备发送第一语音,并接收来自终端设备的语速反馈信息,根据该语速反馈信息,向终端设备发送第二语音,其中,第二语音的语速和第一语音的语速不同。

3、在第一方面给出的语速调节方法中,语速反馈信息示例性地可以是用户在听到终端设备播放的第一语音后根据自己的听觉感受反馈的,比如用户若感觉播报语速过快则可以在语速反馈信息中指示语速过快,如此,语音对话装置根据该语速反馈信息即可调低后续播报的语音的语速,即第二语音的语速,以满足用户想听得更慢的听觉要求。可见,采用该语速调节方法,语音对话装置能按照与用户的实际需求相匹配的合适语速生成语音,进而有助于提升用户的人机交互体验。

4、需要说明的是,上述第二语音可以认为是语音对话装置在接收到终端设备本次发送的语速反馈信息之后、在接收到终端设备重新发送的语速反馈信息之前所发送给终端设备的全部语音。也即是说,再未重新指示语速调节的情况下,语音对话装置可以根据终端设备本次发送的语速反馈信息调节后续向终端设备发送的全部语音的语速,以便于用户能按照满足自己的语速收听后续的全部语音。

5、一种可能的设计中,语速反馈信息可以是用户通过语音方式反馈给终端设备的。比如,用户在感觉第一语音的播报语速过快时,可以发出“降低语速”的直接式反馈语音,也可以发出“太快了,没听清”或者“没听清,请再说一遍”等的暗含式反馈语音,语音对话装置接收到终端设备转发的该语音后,通过解析该语音即可确定该如何调节语速。通过该设计,用户在具有语速调节的需求时可直接发出语音,而无需再执行其它额外的操作,如此可提高用户指示语速调节的便捷性。

6、一种可能的设计中,当语速反馈信息指示语速过快时,可按照如下方式进行语速调节:

7、分支一,若第一语音中仅携带非关键信息,则第二语音中的非关键信息的语速低于第一语音中的非关键信息的语速。也即是说,在只向用户播报了非关键信息的情况下,用户指示语速过快,意味着用户想聚焦于非关键信息的获取,此时,通过调低后续播报时非关键信息的语速,能满足用户对于听清非关键信息的要求。

8、在分支一的进一步示例中,假设语音对话装置在向终端设备发送第一语音之前还向终端设备发送了第四语音,在向终端设备发送第二语音之后还向终端设备发送了第五语音,且第四语音和第五语音中都包含关键信息,则第五语音中的关键信息的语速低于第四信息中的关键信息的语速。也即是说,在只向用户播报了非关键信息的情况下,用户指示语速过快,大概率意味着语音对话装置用于合成语音的语速对于该用户来说整体不合适,因此,通过调低后续播报的全部信息(即关键信息和非关键信息)的语速,能便于用户通过更慢的语速听清全部内容。

9、分支二,若第一语音中携带关键信息,则第二语音中的关键信息的语速低于第一语音中的关键信息的语速。其中,第一语音中携带关键信息,可以是指第一语音中携带关键信息但不携带非关键信息,也可以是指第一语音中既携带关键信息又携带非关键信息。该方式中,在向用户播报了关键信息的情况下,用户指示语速过快,意味着用户想聚焦于关键信息的获取,此时,通过调低后续播报时关键信息的语速,能满足用户对于听清关键信息的要求。

10、在方式二的进一步示例中,第二语音中的非关键信息的语速和第一语音中的非关键信息的语速相同。也即是说,在向用户播报了关键信息的情况下,用户指示语速过快,则可以只调低后续播报的关键信息的语速,而不调低后续播报的非关键信息的语速,如此,相比于第一语音来说,第二语音中的关键信息能以更慢的速度被播报给用户,而非关键信息则仍然保持原速,如此有助于用户更有针对性地聚焦到关键信息。

11、需要说明的是,上述示例仅调低关键信息的语速,这只是一种可选地实施方式,其它实施方式中,也可以同步调低非关键信息的语速,也即是说,第二语音中的关键信息的语速低于第一语音中的关键信息的语速,且,第二语音中的非关键信息的语速低于第一语音中的非关键信息的语速,以便于用户既能聚焦到关键信息又能聚焦到非关键信息。

12、在上述设计中,通过对语音中的关键信息和非关键信息进行拆分,使得语音对话装置能针对于关键信息的语速和非关键信息的语速进行独立调节,进而可提高语速调节的灵活性。

13、一种可能的设计中,第二语音的语速可以有多种可能,比如:

14、一种可能的情况下,第二语音中仅携带关键信息,该情况下,第二语音是使用当前会话对应的关键信息的配置语速合成待合成文本后得到的,即第二语音的语速为当前会话对应的关键信息的配置语速;

15、另一种可能的情况下,第二语音中仅携带非关键信息,该情况下,第二语音是使用当前会话对应的非关键信息的配置语速合成待合成文本后得到的,即第二语音的语速为当前会话对应的非关键信息的配置语速;

16、再一种可能的情况下,第二语音中既携带关键信息又携带非关键信息,该情况下,第二语音是使用当前会话对应的关键信息的配置语速合成待合成文本的关键信息以及使用当前会话对应的非关键信息的配置语速合成待合成文本的非关键信息后得到的,即第二语音中的关键信息的语速为当前会话对应的关键信息的配置语速,且第二语音中的非关键信息的语速为当前会话对应的非关键信息的配置语速。

17、在上述设计中,通过对待合成文本中的关键信息和非关键信息进行拆分,并按照各自对应的配置语速合成得到第二语音,能实现对第二语音的语速合成进行灵活控制。比如,当第二语音中既包含关键信息又包含非关键信息时,该种语音合成方式能使用户收听到具有不同语速的语音内容,这有助于提高用户的听觉感受,且还能便于用户聚焦到自己感兴趣的内容。

18、一种可能的设计中,第一语音中的关键信息的语速和非关键信息的语速可以配置为如下内容中的一项:

19、配置方式一,第一语音中的关键信息的语速低于第一语音中的非关键信息的语速。也本文档来自技高网...

【技术保护点】

1.一种语速调节方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

3.如权利要求1或2所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

4.如权利要求3所述的方法,其特征在于,所述第二语音中的非关键信息的语速和所述第一语音中的非关键信息的语速相同。

5.如权利要求1至4中任一项所述的方法,其特征在于,

6.如权利要求1至4中任一项所述的方法,其特征在于,

7.如权利要求1至4中任一项所述的方法,其特征在于,

8.如权利要求1至7中任一项所述的方法,其特征在于,所述第一语音中的关键信息的语速低于所述第一语音中的非关键信息的语速,或者,所述第一语音中的关键信息的语速和所述第一语音中的非关键信息的语速相同。

9.如权利要求3至5、7、8中任一项所述的方法,其特征在于,所述关键信息为从业务系统中获取到的用户信息。

10.一种语速调节方法,其特征在于,包括:

11.如权利要求10所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

12.如权利要求10或11所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

13.如权利要求12所述的方法,其特征在于,所述第二语音中的非关键信息的语速和所述第一语音中的非关键信息的语速相同。

14.如权利要求10至13中任一项所述的方法,其特征在于,

15.如权利要求10至13中任一项所述的方法,其特征在于,

16.如权利要求10至13中任一项所述的方法,其特征在于,

17.如权利要求10至16中任一项所述的方法,其特征在于,所述第一语音中的关键信息的语速低于所述第一语音中的非关键信息的语速,或者,所述第一语音中的关键信息的语速和所述第一语音中的非关键信息的语速相同。

18.如权利要求12至14、16、17中任一项所述的方法,其特征在于,所述关键信息为从业务系统中获取到的用户信息。

19.一种语音对话系统,其特征在于,包括:对话任务引擎和语音合成引擎;

20.如权利要求19所述的系统,其特征在于,还包括:语音识别引擎;

21.如权利要求19或20所述的系统,其特征在于,所述第一会话信息中还包括待播报文本,所述第二语音是所述语音合成引擎按照当前会话对应的关键信息的配置语速合成所述待播报文本中的关键信息以及按照当前会话对应的非关键信息的配置语速合成所述待播报文本中的非关键信息后得到的。

22.如权利要求21所述的系统,其特征在于,所述待播报文本中的关键信息通过所述对话任务引擎进行标注。

23.如权利要求21或22所述的系统,其特征在于,所述第一会话信息中还包括所述当前会话的标识,所述当前会话的标识用于所述语音合成引擎获取所述当前会话对应的非关键信息的配置语速和关键信息的配置语速。

24.如权利要求21至23中任一项所述的系统,其特征在于,当所述语速反馈信息指示语速过快,且所述第一语音中仅携带非关键信息时,所述语速调节指令用于指示调低所述当前会话对应的非关键信息的配置语速和关键信息的配置语速。

25.如权利要求21至24中任一项所述的系统,其特征在于,当所述语速反馈信息指示语速过快,且所述第一语音中携带关键信息时,所述语速调节指令用于指示调低所述当前会话对应的关键信息的配置语速。

26.如权利要求24或25所述的系统,其特征在于,在调节之前的所述当前会话的配置语速中,所述关键信息的配置语速低于所述非关键信息的配置语速,或者,所述关键信息的配置语速和所述非关键信息的配置语速相同。

27.如权利要求21至26中任一项所述的系统,其特征在于,所述关键信息为从业务系统中获取到的用户信息。

28.一种语音对话装置,其特征在于,包括处理器、收发器和存储器,所述存储器存储计算机程序指令,所述处理器运行所述计算机程序指令,以通过调用所述收发器实现如权利要求1至权利要求9中任一项所述的方法。

29.一种终端设备,其特征在于,包括处理器、存储器和收发器,所述存储器存储计算机程序指令,所述处理器运行所述计算机程序指令,以通过调用所述收发器实现如权利要求10至权利要求18中任一项所述的方法。

30.一种语速调节系统,其特征在于,包括语音对话装置和终端设备,所述语音对话装置用于实现如权利要求1至权利要求9中任一项所述的方法,所述终端设备用于实现如权利要求10至权利要求18中任一项所述的方法。

31.一种...

【技术特征摘要】

1.一种语速调节方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

3.如权利要求1或2所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

4.如权利要求3所述的方法,其特征在于,所述第二语音中的非关键信息的语速和所述第一语音中的非关键信息的语速相同。

5.如权利要求1至4中任一项所述的方法,其特征在于,

6.如权利要求1至4中任一项所述的方法,其特征在于,

7.如权利要求1至4中任一项所述的方法,其特征在于,

8.如权利要求1至7中任一项所述的方法,其特征在于,所述第一语音中的关键信息的语速低于所述第一语音中的非关键信息的语速,或者,所述第一语音中的关键信息的语速和所述第一语音中的非关键信息的语速相同。

9.如权利要求3至5、7、8中任一项所述的方法,其特征在于,所述关键信息为从业务系统中获取到的用户信息。

10.一种语速调节方法,其特征在于,包括:

11.如权利要求10所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

12.如权利要求10或11所述的方法,其特征在于,当所述语速反馈信息指示语速过快时:

13.如权利要求12所述的方法,其特征在于,所述第二语音中的非关键信息的语速和所述第一语音中的非关键信息的语速相同。

14.如权利要求10至13中任一项所述的方法,其特征在于,

15.如权利要求10至13中任一项所述的方法,其特征在于,

16.如权利要求10至13中任一项所述的方法,其特征在于,

17.如权利要求10至16中任一项所述的方法,其特征在于,所述第一语音中的关键信息的语速低于所述第一语音中的非关键信息的语速,或者,所述第一语音中的关键信息的语速和所述第一语音中的非关键信息的语速相同。

18.如权利要求12至14、16、17中任一项所述的方法,其特征在于,所述关键信息为从业务系统中获取到的用户信息。

19.一种语音对话系统,其特征在于,包括:对话任务引擎和语音合成引擎;

20.如权利要求19所述的系统,其特征在于,还包括:语音识别引擎;

21.如权利要求19或20所述的系统,其特征在于,所述第一会话信息中还包括待播报文本,所述第二语音是所述语音...

【专利技术属性】
技术研发人员:揭扬季定业梅明丽王学明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1