The present invention provides a system and process for identifying speech input providing one or more user credentials. In an exemplary process, speech input can be received. A first character based on speech input, a phrase for identifying second characters, and a word. In response to the identification, the first character, second character, and word can be converted to text. The display can be displayed using a sequence corresponding to the order of the first character, the second character, and the word in the speech input.
【技术实现步骤摘要】
识别提供凭据的语音输入相关申请的交叉引用本申请要求2016年9月16日提交的标题为“IDENTIFICATIONOFVOICEINPUTSPROVIDINGCREDENTIALS”的美国专利申请序列号15/268,360的优先权,后者要求2016年3月14日提交的标题为“IDENTIFICATIONOFVOICEINPUTSPROVIDINGCREDENTIALS”的美国临时专利申请序列号62/308,090的优先权。这些专利申请中每一者的内容据此全文以引用方式并入以用于所有目的。
本专利技术整体涉及语音识别,并且更具体地涉及识别提供凭据的语音输入。
技术介绍
常规地,认证通常需要用户提供诸如用户名和密码的凭据。可以使用诸如计算机、平板电脑、移动设备、电视机、多媒体设备、机顶盒等设备来执行认证。语音识别越来越受到口述和控制设备的欢迎。凭据可以包括字符、字词、短语、命令等的混合。这种混合输入使得难以准确地识别用户语音。因此,需要增强使用语音的凭据的准确输入。
技术实现思路
提供了用于识别提供一个或多个凭据的语音输入的系统和过程。根据一个或多个实施例,一种方法包括在具有显示器、一个或多个处理器和存储器的用户设备处接收语音输入。该方法还包括基于该语音输入,识别第一字符、用于识别第二字符的短语,和字词。该方法还包括,响应于该识别,将所述第一字符、第二字符和字词转换为文本;以及使得利用所述显示器以对应于所述第一字符、第二字符和字词在所述语音输入中的次序的序列显示所述文本。附图说明为了更好地理解本专利技术的各种所描述的实施方案,应该结合以下附图参考下面的具体实施方式,在附 ...
【技术保护点】
一种用于识别提供一个或多个用户凭据的语音输入的方法,包括:在具有显示器、一个或多个处理器和存储器的用户设备处:接收语音输入;基于所述语音输入,识别第一字符、用于识别第二字符的短语、以及字词;响应于所述识别,将所述第一字符、所述第二字符和所述字词转换为文本;以及使得利用所述显示器以对应于所述第一字符、所述第二字符和所述字词在所述语音输入中的次序的序列来显示所述文本。
【技术特征摘要】
2016.03.14 US 62/308,090;2016.09.16 US 15/268,3601.一种用于识别提供一个或多个用户凭据的语音输入的方法,包括:在具有显示器、一个或多个处理器和存储器的用户设备处:接收语音输入;基于所述语音输入,识别第一字符、用于识别第二字符的短语、以及字词;响应于所述识别,将所述第一字符、所述第二字符和所述字词转换为文本;以及使得利用所述显示器以对应于所述第一字符、所述第二字符和所述字词在所述语音输入中的次序的序列来显示所述文本。2.根据权利要求1所述的方法,其中所述第一字符包括字母、数字、控制字符或空格中的至少一者。3.根据权利要求2所述的方法,其中所述控制字符包括由标点字词所识别的标点符号。4.根据权利要求1所述的方法,其中所述短语包括用于辅助识别所述第二字符的拼写字词。5.根据权利要求1所述的方法,其中所述字词包括多个字符。6.根据权利要求5所述的方法,其中所述多个字符表示域扩展名或首字母缩略词中的至少一者。7.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:基于存储在所述用户设备中的一个或多个语音识别模型,识别所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者。8.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:向服务器提供表示所述语音输入的数据;以及从所述服务器接收表示所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者的数据,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词包括基于存储在所述服务器中的一个或多个语言模型,识别所述第一字符、用于识别所述第二字符的所述短语、或所述字词中的至少一者。9.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、和所述字词包括:识别所述语音输入的话语;确定所述话语的类型;以及基于所述话语的所确定的类型,获得对应于所述话语的所述第一字符、由所述短语识别的所述第二字符、或所述字词的表示。10.根据权利要求9所述的方法,其中确定所述话语的类型包括执行以下各项中的至少一者:确定所述话语的类型是否对应于字符;确定所述话语的类型是否对应于用于识别字符的短语;以及确定所述话语的类型是否对应于字词。11.根据权利要求10所述的方法,其中确定所述话语的类型是否对应于字符包括:针对所述话语,确定所述话语是否对应于控制字符;根据确定所述话语对应于控制字符,针对所述话语确定所述话语是否对应于标点字词;以及其中基于所述话语的所确定的类型,获得所述字符的表示包括:根据确定所述话语对应于标点字词,获得对应于所述标点字词的标点符号的表示,根据确定所述话语不对应于标点字词,获得不同于标点字词的所述控制字符的表示。12.根据权利要求9所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词进一步包括:获得所述表示的置信水平;确定所述置信水平是否大于或等于阈值;并且其中将所述第一字符、所述第二字符和所述字词转换为文本包括:根据确定所述置信水平大于或等于所述阈值,将对应于所述话语的所述第一字符、由所述短语识别的所述第二字符、或所述字词的所述表示转换为文本;根据确定所述置信水平小于所述阈值,提供一个或多个候选表示、错误消息或它们的组合。13.根据权利要求1所述的方法,还包括:基于所述语音输入,识别至少一个命令,其中所述至少一个命令使得能够编辑所显示的文本。14.根据权利要求13所述的方法,其中识别所述至少一个命令包括:识别至少一个话语;确定所述话语的类型是否对应于命令;并且根据确定所述话语的类型对应于命令,使得发起与用于编辑所显示的文本的所述命令对应的动作。15.根据权利要求14所述的方法,还包括:存储对应于所述至少一个命令的所述话语,并且存储与对应于所述至少一个命令的所述话语相关联的信息。16.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词基于与用户相关联的上下文数据或一个或多个所识别的凭据模型中的至少一者。17.根据权利要求16所述的方法,其中与所述用户相关联的所述上下文数据包括用户语音配置文件。18.根据权利要求16所述的方法,其中所述一个或多个所识别的凭据模型表示一个或多个所识别的凭据格式。19.根据权利要求1所述的方法,其中基于所述语音输入,识别所述第一字符、用于识别所述第二字符的所述短语、以及所述字词基于注视检测。20.根据权利要求1所述的方法,其中所述语音输入对应于表示用户名的第一用户凭据或表示密码的第二用户凭据中的至少一者。21.根据权利要求1所述的方法,还包括:存储所述语音输入的一个或多个话语,所述一个或多个话语对应于基于所述识别而识别的所述第一字符、用...
【专利技术属性】
技术研发人员:M·艾克巴卡克,B·汉森,G·埃弗曼,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。