控制执行多语音处理的人工智能系统的方法技术方案

技术编号:18785795 阅读:28 留言:0更新日期:2018-08-29 07:45
本发明专利技术提供一种控制执行多语音处理的人工智能系统的方法。本说明书涉及一种控制基于人工智能技术执行多语言处理的人工智能系统的方法。控制执行多语言处理的人工智能系统的方法包括:通过麦克风接收语音信息;基于预设参考来确定语音信息的语言;基于确定结果,从处理不同语言的多个语音识别服务器选择特定语音识别服务器;以及将语音信息发送到所选择的特定语音识别服务器。

Method of controlling artificial intelligence system for multi voice processing

The invention provides a method for controlling an artificial intelligence system for carrying out multi voice processing. This specification relates to a method of controlling an AI system that performs multilingual processing based on AI technology. Artificial intelligence systems that control the execution of multilingual processing include: receiving voice information through a microphone; determining the language of the voice information based on a preset reference; selecting a specific voice recognition server from multiple voice recognition servers that process different languages based on the determination result; and sending voice information to the selected speech information Specific voice recognition server.

【技术实现步骤摘要】
控制执行多语音处理的人工智能系统的方法
本说明书涉及一种控制基于人工智能技术执行多语言处理的人工智能系统的方法。
技术介绍
人工智能是计算机工程和信息
,其研究一种代替人类智能的使计算机思考、学习、自我发展等的方法。这意味着一种使计算机模仿人类智能行为的方法。此外,人工智能本身并不存在,但与其他计算机科学领域直接或间接相关。特别是现在,通过将人工智能引入信息
,正在积极地尝试解决信息技术许多领域出现的问题。例如,人工智能已经被应用于自然语言处理的领域,用于诸如自动翻译的系统的实际使用。此外,诸如英语、汉语、韩语和西班牙语的各种语言命令可以被输入到诸如机场和地铁的挤满使用各种语言的人群的地方的公共设备。在输入各种语言命令的情况下,对于单个服务器来说在技术上难以将所有语言转换成文本并分析转换的语言的含义。例如,商业服务器基本上根据每种语言使用不同的语音识别/自然语言处理模型。
技术实现思路
因此,详细描述的一个方面是为了提供一种控制人工智能系统的方法,该人工智能系统执行多语言处理,能够根据输入的语音信息的语言将语音信息发送到不同的服务器,并且能够接收处理结果。为了实现这些和其他优点并根据本说明书的目的,如在此具体化和广泛描述的,提供一种控制多语言音频处理系统的方法,该方法包括:经由麦克风接收语音信息;基于预设的参考语言信息确定所接收的语音信息中的至少一个语言;基于所确定的至少一个语言从多个语音识别服务器选择特定语音识别服务器,其中多个语音识别服务器对应于不同的语言并且特定语音识别服务器对应于至少一个确定的语言;以及生成包括所接收的语音信息的查询并且将查询发送到所选择的特定语音识别服务器。根据本专利技术的控制执行多语言处理的人工智能系统的方法可具有以下优点。根据本专利技术的至少一个实施例,由于根据发音的类型(语言类型)语音信息被发送到不同的服务器,因此可以首先在客户端步骤(clientstep)中分配最佳服务器。这可以允许提供快速/精确的服务。根据另一实施例,用户可以通过输入特定请求(语言转换请求)来选择要执行语言处理的服务器。根据在下文中给出的详细描述,本申请的应用的进一步范围将变得更加显然。然而,应理解的是,仅通过说明给出指示本公开的优选实施例的特定示例和详细描述,因为对本领域的技术人员来说从详细描述中本公开的精神和范围内的各种变化和修改将变得显然。附图说明附图被包括以提供对本公开的进一步理解,并且被并入且组成本说明书的一部分,附图图示示例性实施例并且连同描述一起用于解释本公开的原理。在附图中:图1A是图示根据本专利技术的移动终端的框图;图1B和1C是根据本专利技术的从不同方向看到的移动终端的概念图;图2是用于解释根据本专利技术的控制执行多语言处理的人工智能系统的方法的流程图;图3是用于解释根据本专利技术的控制执行多语言处理的人工智能系统的方法的概念图;图4是用于解释当一个语音信息包括多个语言时控制人工智能系统的方法的概念图;图5是用于解释控制使用存储器执行多语言处理的人工智能系统的方法的概念图;以及图6是用于解释当另外输入语言转换请求时控制人工智能系统的方法的概念图。具体实施方式参考附图,现在将根据在此公开的示例性实施例详细地给出描述。为了参考附图简要描述,相同的或者等效的组件可以被设有相同或者相似的附图标记,并且其描述将不会被重复。通常,诸如“模块”和“单元”的后缀可以被用于指代元件或者组件。这样的后缀的使用在此旨在仅有助于说明书的描述,并且后缀本身旨在没有给予任何特定意义或者功能。在本公开中,为了简要,通常已经省略了在相关领域中对于普通技术人员来说公知的那些。附图被用于帮助容易地理解各种技术特征并且应理解附图没有限制在此提出的实施例。正因如此,本公开应被解释为延伸到除了在附图中特别陈述的之外的任何改变、等同物以及替代。将要理解的是,尽管在此可以使用术语第一、第二等等以描述各种元件,但是这些元件不应被这些术语限制。这些术语通常仅被用于区分一个元件与另一元件。将要理解的是,当元件被称为“连接”另一元件时,元件能够与另一元件连接或者也可以存在中间元件。相反地,当元件被称为“直接地连接”另一元件时,则不存在中间元件。单数表示可以包括复数表示,除非根据上下文其表示明确不同的意义。在此使用诸如“包括”或者“具有”的术语并且应理解它们旨在指示在本说明书中公开的特征、数目、步骤、功能、数个组件或者组合的存在,并且也应理解可以同样地利用更多或者更少的特征、数目、步骤、功能、数个组件或者其组合。可以使用各种不同类型的终端实现在此提出的移动终端。这样的终端的示例包括蜂窝电话、智能电话、用户装置、膝上型计算机、数字广播终端、个人数字助手(PDA)、便携式多媒体播放器(PMP)、导航仪、便携式计算机(PC)、板式PC、平板PC、超级本、可佩戴装置(例如,智能手表、智能眼镜、头戴式显示器(HMD))等等。仅通过非限制性示例,将会参考特定类型的移动终端进行进一步的描述。然而,这样的教导同等地应用于其他类型的终端,诸如在上面注明的那些类型。另外,这样的教导也可以被应用于诸如数字TV、桌上型计算机等等的固定终端。图1A是图示根据本专利技术的移动终端的框图。并且图1B和1C是根据本专利技术的从不同方向看到的移动终端的概念图。示出移动终端100,其具有诸如无线通信单元110、输入单元120、人工智能(AI)单元130、感测单元140、输出单元150、接口单元160、存储器170、控制器180、以及电源单元190的各种组件。要理解的是,不要求实现所有图示的组件,并且可以替换地实现更多或者更少的组件。更加详细地,无线通信单元110通常包括一个或者多个模块,其允许诸如在移动终端100和无线通信系统之间的无线通信的通信、在移动终端100和另一移动终端之间的通信、在移动终端100与外部服务器之间通信。此外,无线通信单元110通常包括将移动终端100连接到一个或者多个网络的一个或者多个模块。无线通信单元110可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114、以及位置信息模块115中的一个或者多个。输入单元120包括:用于获得图像或者视频的相机121;麦克风122,该麦克风122是一种用于输入音频信号的音频输入装置;以及用于允许用户输入信息的用户输入单元123(例如,触摸键、机械键等等)。数据(例如,音频、视频、图像等等)通过输入单元120被获得并且可以根据装置参数、用户命令、以及其组合通过控制器180分析和处理。人工智能单元130起到基于人工智能技术处理信息的作用,并且可以包括至少一个模块,用于执行信息的学习、信息的推理、信息的感知以及自然语言的处理中的至少一个。人工智能单元130可以使用机器学习技术来执行诸如存储在移动终端中的信息、与移动终端有关的周围环境信息、存储在可通信的外部存储器中的信息等的大量信息(大数据)的学习、推理和处理中的至少一个。并且,人工智能单元130可以基于使用机器学习技术学习的信息来预测(或推断)移动终端的至少一个可执行操作,并且控制移动终端以执行至少一个预测操作之中最可行的操作。机器学习技术是基于至少一个算法来收集和学习大量信息并且基于所学习的信息来确定和预测信息的技术。信息的学习是掌握信息本文档来自技高网...

【技术保护点】
1.一种控制多语言音频处理系统的方法,所述方法包括:经由麦克风接收语音信息;基于预设的参考语言信息,确定接收到的语音信息中的至少一个语言;基于确定的至少一个语言,从多个语音识别服务器选择特定语音识别服务器,其中所述多个语音识别服务器对应于不同的语言,并且所述特定语音识别服务器对应于所述至少一个确定的语言;以及生成包括所述接收到的语音信息的查询并且将所述查询发送到所述选择的特定语音识别服务器。

【技术特征摘要】
2017.02.20 KR 10-2017-00225301.一种控制多语言音频处理系统的方法,所述方法包括:经由麦克风接收语音信息;基于预设的参考语言信息,确定接收到的语音信息中的至少一个语言;基于确定的至少一个语言,从多个语音识别服务器选择特定语音识别服务器,其中所述多个语音识别服务器对应于不同的语言,并且所述特定语音识别服务器对应于所述至少一个确定的语言;以及生成包括所述接收到的语音信息的查询并且将所述查询发送到所述选择的特定语音识别服务器。2.根据权利要求1所述的方法,其中,所述预设的参考语言信息被存储在所述系统的客户端的存储器中,并且所述客户端确定所述接收到的语音信息中的至少一个语言以选择所述特定语音识别服务器。3.根据权利要求1所述的方法,进一步包括:将所述语音信息分离成多个音素以确定所述接收到的语音信息的语言。4.根据权利要求3所述的方法,进一步包括:确定所述多个音素中的每个的语言。5.根据权利要求4所述的方法,其中:所述多个音素被确定为包括多个语言;以及所述选择的特定语音识别服务器被配置成处理混合语言语音信息。6.根据权利要求1所述的方法,其中,所述确定的至少一个语言对应于单一语言,以及所述选择的特定语音识别服务器被配置成仅处理单一语言中的语音信息。7.根据权利要求1所述的方法,进一步包括:从所述特定语音识别服务器接收对所述生成的查询的响应;基于接收到的响应来生成对所述接收到的语音信息的回复信息;以及响应于所述接收到的语音信息,输出生成的回复。8.根据权利要求7所述的方法,其中,所述输出的生成的回复是以音频输出的形式。9.根据权利要求8所述的方法,其中,以确定的所述接收到的语音信息的语言来执...

【专利技术属性】
技术研发人员:郑奎赫
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1