在根据实施例的系统中包括的存储器,可以被配置为存储自动语音识别(ASR)模块和自然语言理解(NLU)模块,并且存储器被配置为存储指令,该指令在被执行时,使处理器:通过麦克风接收用于调用基于语音的智能辅助服务的唤醒话语;在唤醒话语之后,通过麦克风接收第一用户话语;使用NLU模块处理第一用户话语;基于处理后的第一用户话语生成第一响应;在接收到唤醒话语之后选定的时间间隔内,通过麦克风接收第二用户话语;使用ASR模块,提取第二用户话语的文本;当第二用户话语的文本中包括选定词或选定短语时,使用NLU模块处理第二用户话语以生成第二响应;以及当第二用户话语的文本中不包括选定词或选定短语时,不生成对第二用户话语的响应。的响应。的响应。
【技术实现步骤摘要】
【国外来华专利技术】提供基于语音识别的服务的电子装置和系统
[0001]本公开涉及用于提供语音识别服务的技术。
技术介绍
[0002]由于电子装置具有各种功能和高性能,所以语音识别技术正越来越多地被应用于电子装置。应用了语音识别技术的电子装置可以基于用户的话语来识别用户的意图(功能请求),并且可以根据用户的意图来提供响应。当接收到唤醒话语(例如,“嗨Bixby”)或按钮输入时,电子装置可以运行指定的应用(智能应用)或提供语音识别服务的智能辅助服务,可以通过指定的应用接收用户话语,并且可以在根据基于用户话语的用户意图提供单个响应后终止指定的应用。之后,电子装置需要再次接收唤醒话语或按钮输入以提供语音识别服务。
[0003]以上信息仅作为背景信息提供,以帮助理解本公开。关于以上内容中的任何内容是否可以用作关于本公开的现有技术,没有做出任何确定,也没有做出任何断言。
技术实现思路
[0004]技术问题
[0005]因此,出于通过使用语音识别服务来请求多种功能的目的,用户需要重复地交替执行唤醒话语(或按钮输入)和用户话语,这是不便的。
[0006]问题的解决方案
[0007]根据本公开的一方面,一种系统可以包括:麦克风;扬声器;至少一个处理器,所述至少一个处理器可操作地连接到所述麦克风和所述扬声器;以及至少一个存储器,所述至少一个存储器可操作地连接到所述处理器。所述存储器可以被配置为存储自动语音识别(ASR)模块和自然语言理解(NLU)模块,并且所述存储器可以被配置为存储指令,所述指令在被执行时,使所述处理器:通过所述麦克风,接收用于调用基于语音的智能辅助服务的唤醒话语;在所述唤醒话语之后,通过所述麦克风接收第一用户话语;使用所述NLU模块处理所述第一用户话语;基于处理后的第一用户话语生成第一响应;在接收到所述唤醒话语之后选定的时间间隔内,通过所述麦克风接收第二用户话语;使用所述ASR模块,提取所述第二用户话语的文本;当所述第二用户话语的文本中包括选定词或选定短语时,使用所述NLU模块处理所述第二用户话语以生成第二响应;以及当所述第二用户话语的文本中不包括选定词或选定短语时,不生成对所述第二用户话语的响应。
[0008]根据本公开的另一方面,一种系统可以包括:用户界面;麦克风;扬声器;至少一个处理器,所述至少一个处理器可操作地连接到所述用户界面、所述麦克风和所述扬声器;以及至少一个存储器,所述至少一个存储器可操作地连接到所述处理器。所述存储器可以被配置为存储自动语音识别(ASR)模块和自然语言理解(NLU)模块,并且所述存储器可以被配置为存储指令,所述指令在被执行时,使所述处理器:通过所述用户界面,接收用于调用基于语音的智能辅助服务的用户输入;在接收到所述用户输入之后,通过所述麦克风接收第
一用户话语;使用所述NLU模块处理所述第一用户话语;基于处理后的第一用户话语生成第一响应;在接收到所述用户输入之后选定的时间间隔内,通过所述麦克风接收第二用户话语;使用所述ASR模块,提取所述第二用户话语的文本;当所述第二用户话语的文本中包括选定词或选定短语时,使用所述NLU模块处理所述第二用户话语以生成第二响应;以及当所述第二用户话语中不包括选定词或选定短语时,不生成对所述第二用户话语的响应。
[0009]根据本公开的另一方面,一种电子装置可以包括:通信电路;输入电路;麦克风;可操作地连接到所述通信电路、所述输入电路和所述麦克风的处理器;以及可操作地连接到所述处理器的存储器。所述存储器可以存储指令,所述指令在被执行时,使所述处理器:当通过所述麦克风接收到用于调用语音识别服务的唤醒话语时,执行能够提供语音识别服务的智能应用;使用所述智能应用,通过所述麦克风接收第一用户话语;使用所述智能应用,执行基于所述第一用户话语确定的第一动作;在从执行所述第一动作的时间点开始选定的时间内,通过所述麦克风接收第二用户话语;使用所述智能应用,确定在所述选定时间内是否识别出基于所述第二用户话语的选定的词或短语;当在所述选定时间内基于所述第二用户话语识别出选定词或选定短语时,使用所述智能应用执行基于所述第二用户话语确定的第二动作;以及当在所述选定时间内未识别出所述第二用户话语中的选定词或选定短语时,终止所述智能应用。
[0010]通过以下结合附图公开了本公开的各种实施例的详细描述,本公开的其他方面、优点和显着特征对于本领域技术人员将变得更加明显。
[0011]专利技术的有益效果
[0012]本公开的各方面将至少解决上述问题和/或缺点,并至少提供下述优点。因此,本公开的一方面在于提供一种提供语音识别服务的电子装置和系统,该语音识别服务能够在一个唤醒话语之后提供分别对应于多个用户话语的多个响应。
附图说明
[0013]通过以下结合附图的描述,本公开的某些实施例的上述和其他方面、特征和优点将变得更加明显,其中:
[0014]图1是根据实施例的集成智能系统的配置图;
[0015]图2是根据实施例的电子装置的框图;
[0016]图3a示出了根据实施例的在未设置对话模式的使用的情况下的用于电子装置的语音识别服务的操作模式;
[0017]图3b示出了根据实施例的在未设置对话模式的使用的情况下的语音识别服务的示例;
[0018]图4a示出了根据实施例的在设置了对话模式的使用的情况下的用于电子装置的语音识别服务的操作模式;
[0019]图4b示出了根据实施例的在设置了对话模式的使用的情况下的语音识别服务的示例;
[0020]图5a示出了根据实施例的用于设置对话模式的使用的UI屏幕;
[0021]图5b示出了根据实施例的用于设置对话模式的时间的UI屏幕;
[0022]图5c示出了根据实施例的用于设置对话模式的触发词的UI屏幕的示例;
[0023]图5d示出了根据实施例的用于设置对话模式的触发词的UI屏幕的另一示例;
[0024]图6示出了根据实施例的处理器的组件的示例;
[0025]图7示出了根据实施例的处理器的组件的另一示例;
[0026]图8示出了根据实施例的由集成智能系统进行的语音识别服务提供方法;
[0027]图9示出了根据实施例的由电子装置进行的语音识别服务提供方法;
[0028]图10示出了根据各种实施例的在网络环境中的电子装置的框图;
[0029]图11是示出了根据实施例的集成智能系统的框图;
[0030]图12是示出了根据实施例的概念和动作之间的关系信息被存储在数据库中的形式的图;以及
[0031]图13是示出根据实施例的用户终端显示用于处理通过智能应用接收到的语音输入的屏幕的视图。
具体实施方式
[0032]图1是根据实施例的集成智能系统的配置图。
[0033]参照图1,根据实施例,当通过麦克风接收唤醒话语(例如,嗨Bixby)时,电子装置20可以运行提供语音识别服务的智能应用(或智能代理)或智能辅助服务。唤醒话语可以包括特定词、特定短语或特本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种系统,所述系统包括:用户界面;麦克风;扬声器;至少一个处理器,所述至少一个处理器可操作地连接到所述用户界面、所述麦克风和所述扬声器;以及至少一个存储器,所述至少一个存储器可操作地连接到所述处理器,其中,所述存储器被配置为存储自动语音识别(ASR)模块和自然语言理解(NLU)模块,并且其中,所述存储器被配置为存储指令,所述指令在被执行时,使所述处理器:通过所述麦克风,接收用于调用基于语音的智能辅助服务的唤醒话语;在所述唤醒话语之后,通过所述麦克风接收第一用户话语;使用所述NLU模块处理所述第一用户话语;基于处理后的第一用户话语生成第一响应;在接收到所述唤醒话语之后选定的时间间隔内,通过所述麦克风接收第二用户话语;使用所述ASR模块,提取所述第二用户话语的文本;基于所述第二用户话语的文本中包括选定词或选定短语,使用所述NLU模块处理所述第二用户话语以生成第二响应;以及基于所述第二用户话语的文本中不包括所述选定词或选定短语,不生成对所述第二用户话语的响应。2.根据权利要求1所述的系统,其中,所述指令使所述处理器:提供被配置为接收所述选定词或选定短语的用户界面;或通过所述处理器的操作确定所述选定词或选定短语。3.根据权利要求1所述的系统,其中,所述指令使所...
【专利技术属性】
技术研发人员:河志宪,安纽现,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。