当前位置: 首页 > 专利查询>苹果公司专利>正文

识别提供凭据的语音输入制造技术

技术编号:16271419 阅读:34 留言:0更新日期:2017-09-22 22:59
本发明专利技术提供了用于识别提供一个或多个用户凭据的语音输入的系统和过程。在一个示例性过程中,可以接收语音输入。基于语音输入可识别第一字符、用于识别第二字符的短语、以及字词。响应于该识别,可将第一字符、第二字符和字词转换为文本。可使得利用显示器以对应于第一字符、第二字符和字词在语音输入中的次序的序列来显示文本。

Identify the speech input that provides credentials

The present invention provides a system and process for identifying speech input providing one or more user credentials. In an exemplary process, speech input can be received. A first character based on speech input, a phrase for identifying second characters, and a word. In response to the identification, the first character, second character, and word can be converted to text. The display can be displayed using a sequence corresponding to the order of the first character, the second character, and the word in the speech input.

【技术实现步骤摘要】
识别提供凭据的语音输入相关申请的交叉引用本申请要求2016年9月16日提交的标题为“IDENTIFICATIONOFVOICEINPUTSPROVIDINGCREDENTIALS”的美国专利申请序列号15/268,360的优先权,后者要求2016年3月14日提交的标题为“IDENTIFICATIONOFVOICEINPUTSPROVIDINGCREDENTIALS”的美国临时专利申请序列号62/308,090的优先权。这些专利申请中每一者的内容据此全文以引用方式并入以用于所有目的。
本专利技术整体涉及语音识别,并且更具体地涉及识别提供凭据的语音输入。
技术介绍
常规地,认证通常需要用户提供诸如用户名和密码的凭据。可以使用诸如计算机、平板电脑、移动设备、电视机、多媒体设备、机顶盒等设备来执行认证。语音识别越来越受到口述和控制设备的欢迎。凭据可以包括字符、字词、短语、命令等的混合。这种混合输入使得难以准确地识别用户语音。因此,需要增强使用语音的凭据的准确输入。
技术实现思路
提供了用于识别提供一个或多个凭据的语音输入的系统和过程。根据一个或多个实施例,一种方法包括在具有显示器、一个或多个处理器和存储器的用户设备处接收语音输入。该方法还包括基于该语音输入,识别第一字符、用于识别第二字符的短语,和字词。该方法还包括,响应于该识别,将所述第一字符、第二字符和字词转换为文本;以及使得利用所述显示器以对应于所述第一字符、第二字符和字词在所述语音输入中的次序的序列显示所述文本。附图说明为了更好地理解本专利技术的各种所描述的实施方案,应该结合以下附图参考下面的具体实施方式,在附图中,类似的附图标号指示所有附图中对应的部分。图1是示出根据各种实施例的用于实现数字助理的系统和环境的框图。图2A是示出根据一些实施方案的实现数字助理的客户端侧部分的便携式多功能设备的框图。图2B是示出根据各种实施例的用于事件处理的示例性部件的框图。图3示出了根据各种实施例的实现数字助理的客户端侧部分的便携式多功能设备。图4是根据各种实施例的具有显示器和触敏表面的示例性多功能设备的框图。图5A示出了根据各种实施例的便携式多功能设备上的应用程序菜单的示例性用户界面。图5B示出了根据各种实施例的具有与显示器分开的触敏表面的多功能设备的示例性用户界面。图6A示出了根据各种实施例的个人电子设备。图6B是示出根据各种实施例的个人电子设备的框图。图7A是示出根据各种实施例的数字助理系统或其服务器部分的框图。图7B示出了根据各种实施例的图7A所示数字助理的功能。图7C示出了根据各种实施例的知识本体的一部分。图8A-图8B示出了根据各种实施例的设备的示例性架构的框图。图9示出了根据各种实施例的示例性自动语音识别模块的框图。图10A-图10F示出了根据各种实施例的用于输入凭据的语音输入识别功能。图11A-图11D示出了根据各种实施例的用于输入凭据的语音输入识别功能。图12A-图12D示出了根据各种实施例的用于识别语音输入的示例性过程的流程图。图13示出了根据各种实施例的电子设备的框图。具体实施方式在以下对本公开和实施方案的描述中将引用附图,在附图中以举例的方式示出了可被实施的特定实施方案。应当理解,在不脱离本公开的范围的情况下,可实践其他实施方案和实施例并且可做出变化。需要用于识别语音输入的技术。如本文所述,用于识别语音输入的技术被期望用于各种目的,例如输入通常包括字符、字词、短语和/或命令的混合的凭据。此类技术允许用户不用手就能输入凭据,因此是有利的。此外,此类用于识别语音输入的技术可以使用户不必用手向设备逐个字符地输入凭据或任何其他信息,这种手动操作可能是耗时而且繁琐的。尽管以下描述使用术语“第一”、“第二”等来描述各种元件,但这些元件不应受术语的限制。这些术语只是用于将一个元件与另一元件区分开。例如,在不脱离各种所述实施例的范围的情况下,第一字符可以被称为第二字符,并且类似地,第二字符可以被称为第一字符。第一字符和第二字符可以都是字符,并且在一些情况下,可以是单独和不同的字符。在本文中对各种所述实施例的描述中所使用的术语只是为了描述特定实施例的目的,而并非旨在进行限制。如在对各种所述实施例的描述和所附权利要求书中所使用的那样,单数形式“一个(“a”,“an”)和“该”旨在也包括复数形式,除非上下文另外明确地指示。还将理解的是,本文中所使用的术语“和/或”是指并且涵盖相关联的所列出的项目中的一个或多个项目的任何和全部可能的组合。还将理解的是,术语“包括”(“includes”,“including”,“comprises”和/或“comprising”)当在本说明书中使用时是指定存在所陈述的特征、整数、步骤、操作、元件和/或部件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其分组。根据上下文,术语“如果”可被解释为意指“当...时”(“when”或“upon”)或“响应于确定”或“响应于检测到”。类似地,根据上下文,短语“如果确定...”或“如果检测到[所陈述的条件或事件]”可被解释为意指“在确定...时”或“响应于确定...”或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。1.系统和环境图1示出了根据各种实施例的系统100的框图。在一些实施例中,系统100可实现数字助理。术语“数字助理”、“虚拟助理”、“智能自动化助理”或“自动数字助理”可指解译口头和/或文本形式的自然语言输入以推断用户意图,并基于推断出的用户意图来执行动作的任何信息处理系统。例如,为了按照推断出的用户意图来操作,系统可执行以下内容中的一个或多个:通过设计用以实现所推断出的用户意图的步骤和参数来识别任务流,将来自推断出的用户意图的具体要求输入到任务流中;通过调用程序、方法、服务、API等来执行任务流;以及生成对用户的听觉(例如,语音)和/或视觉形式的输出响应。具体地讲,数字助理可能够接受至少部分地为自然语言命令、请求、声明、讲述和/或询问的形式的用户请求。通常,用户请求可要么寻求数字助理作出信息性回答,要么寻求数字助理执行任务。针对用户请求的令人满意的响应可以是提供所请求的信息性回答、执行所请求的任务,或这两者的组合。例如,用户可向数字助理提出诸如“我现在在哪里?”之类的问题。基于用户的当前位置,数字助理可回答“你在中央公园西门附近。”用户还可请求执行任务,例如“请邀请我的朋友下周来参加我女朋友的生日聚会。”作为响应,数字助理可通过讲出“好的,马上”来确认该请求,然后代表用户将合适的日历邀请发送到用户的电子通讯录中列出的用户朋友中的每个朋友。在执行所请求的任务期间,数字助理可有时在很长时间段内在涉及多次信息交换的持续对话中与用户进行交互。存在与数字助理进行交互以请求信息或执行各种任务的许多其他方法。除提供言语响应并采取经编程的动作之外,数字助理还可提供其他视觉或声音形式的响应,例如,作为文本、警报、音乐、视频、动画等。如图1所示,在一些实施例中,数字助理可根据客户端-服务器模型来实施。数字助理可以包括在用户设备104上执行的客户端侧部分102(后文称作“DA客户端102”)和在服务器系统108上执行的服务器侧部分106(后文称本文档来自技高网...
识别提供凭据的语音输入

【技术保护点】
一种用于识别提供一个或多个用户凭据的语音输入的方法,包括:在具有显示器、一个或多个处理器和存储器的用户设备处:接收语音输入;基于所述语音输入,识别第一字符、用于识别第二字符的短语、以及字词;响应于所述识别,将所述第一字符、所述第二字符和所述字词转换为文本;以及使得利用所述显示器以对应于所述第一字符、所述第二字符和所述字词在所述语音输入中的次序的序列来显示所述文本。

【技术特征摘要】
2016.03.14 US 62/308,090;2016.09.16 US 15/268,3601.一种用于识别提供一个或多个用户凭据的语音输入的方法,包括:在具有显示器、一个或多个处理器和存储器的用户设备处:接收语音输入;基于所述语音输入,识别第一字符、用于识别第二字符的短语、以及字词;响应于所述识别,将所述第一字符、所述第二字符和所述字词转换为文本;以及使得利用所述显示器以对应于所述第一字符、所述第二字符和所述字词在所述语音输入中的次序的序列来显示所述文本。2.根据权利要求1所述的方法,其中所述第一字符包括字母、数字、控制字符或空格中的至少一者。3.根据权利要求2所述的方法,其中所述控制字符包括由标点字词所识别的标点符号。4.根据权利要求1所述的方法,其中所述短语包括用于辅助识别所述第二字符的拼写字词。5.根据权利要求1所述的方法,其中所述字词包括多个字符。6.根据权利要求5所述的方法,其中所述多个字符表示域扩展名或首字母缩略词中的至少一者。7.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:基于存储在所述用户设备中的一个或多个语音识别模型,识别所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者。8.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:向服务器提供表示所述语音输入的数据;以及从所述服务器接收表示所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者的数据,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词包括基于存储在所述服务器中的一个或多个语言模型,识别所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者。9.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:识别所述语音输入的话语;确定所述话语的类型;以及基于所述话语的所确定的类型,获得对应于所述话语的所述第一字符、由所述短语识别的所述第二字符、或所述字词的表示。10.根据权利要求9所述的方法,其中确定所述话语的类型包括执行以下各项中的至少一者:确定所述话语的类型是否对应于字符;确定所述话语的类型是否对应于用于识别字符的短语;以及确定所述话语的类型是否对应于字词。11.根据权利要求10所述的方法,其中确定所述话语的类型是否对应于字符包括:针对所述话语,确定所述话语是否对应于控制字符;根据确定所述话语对应于控制字符,针对所述话语确定所述话语是否对应于标点字词;以及其中基于所述话语的所确定的类型,获得所述字符的表示包括:根据确定所述话语对应于标点字词,获得对应于所述标点字词的标点符号的表示,根据确定所述话语不对应于标点字词,获得不同于标点字词的所述控制字符的表示。12.根据权利要求9所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词进一步包括:获得所述表示的置信水平;确定所述置信水平是否大于或等于阈值;并且其中将所述第一字符、所述第二字符和所述字词转换为文本包括:根据确定所述置信水平大于或等于所述阈值,将对应于所述话语的所述第一字符、由所述短语识别的所述第二字符、或所述字词的所述表示转换为文本;根据确定所述置信水平小于所述阈值,提供一个或多个候选表示、错误消息或它们的组合。13.根据权利要求1所述的方法,还包括:基于所述语音输入,识别至少一个命令,其中所述至少一个命令使得能够编辑所显示的文本。14.根据权利要求13所述的方法,其中识别所述至少一个命令包括:识别至少一个话语;确定所述话语的类型是否对应于命令;并且根据确定所述话语的类型对应于命令,使得发起与用于编辑所显示的文本的所述命令对应的动作。15.根据权利要求14所述的方法,还包括:存储对应于所述至少一个命令的所述话语,并且存储与对应于所述至少一个命令的所述话语相关联的信息。16.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词基于与用户相关联的上下文数据或一个或多个所识别的凭据模型中的至少一者。17.根据权利要求16所述的方法,其中与所述用户相关联的所述上下文数据包括用户语音配置文件。18.根据权利要求16所述的方法,其中所述一个或多个所识别的凭据模型表示一个或多个所识别的凭据格式。19.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词基于注视检测。20.根据权利要求1所述的方法,其中所述语音输入对应于表示用户名的第一用户凭据或表示密码的第二用户凭据中的至少一者。21.根据权利要求1所述的方法,还包括:存储所述语音输入的一个或多个话语,所述一个或多个话语对应于基于所述识别而识别的所述第一字符、用...

【专利技术属性】
技术研发人员:M·艾克巴卡克B·汉森G·埃弗曼
申请(专利权)人:苹果公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1