描述了一种用于分布式自然语言处理的系统和对应方法。一组本地数据源存储在移动设备上。移动设备上的本地自然语言理解(NLU)匹配模块执行结合本地数据源的自然语言输入的自然语言处理,以确定一个或多个本地解释候选。移动设备上的本地NLU排名模块处理本地解释候选和来自远程NLU服务器的一个或多个远程解释候选,以确定对应于自然语言输入的最终输出解释。
【技术实现步骤摘要】
【国外来华专利技术】【专利说明】分布式NLU/NLP本申请要求2012年11月12日提交的美国专利申请13/674,191的优先权,该美国专利申请通过引用全部并入本文。
本专利技术涉及一种用于自然语言处理的分布式客户端-服务器系统。
技术介绍
自然语言处理(NLP)和自然语言理解(NLU)涉及使用计算机处理,以从诸如人类产生的语音和文本等自然语言输入提取有意义的信息。此类技术的一个最新应用是在诸如智能手机等移动设备中处理语音和/或文本查询。图1示出处理语音查询输入并从各种顶级网站和内容源获得同步搜索结果的一个此类移动设备应用龙搜索!(Dragon Go !)的一些示例屏幕截图。此类应用要求将自然语言理解组件添加到现有网站搜索算法,以便从输入查询提取语义含义。这可能涉及使用近似串匹配,以发现语义模板结构。一个或多个语义含义可以被分配给每个语义模板。解析规则和分类器训练实例可以被生成并用来训练确定查询解释(有时称为查询意图)的NLU模型。诸如龙搜索!等用于移动设备的复杂NLU应用使用客户端-服务器架构实施,其中NLU处理仅在远程服务器进行。但是,大量的相关数据可能被存储在本地移动设备上,所述大量的相关数据需要上载到远程NLU处理器,以优化NLU结果;例如,会议(标题、内容、参加者)列表、联系人列表、歌曲列表等相关数据。由于包括保密考虑和纯粹的需要上载并保持同步的数据量的各种原因,可以由服务器侧NLU加以利用的数据的数据传送会遇到问题。
技术实现思路
本专利技术的实施例涉及用于分布式自然语言处理的系统和对应的方法。一组本地数据源存储在移动设备上。移动设备上的本地自然语言理解(NLU)匹配模块执行结合所述本地数据源的自然语言输入的自然语言处理,以确定一个或多个本地解释候选。移动设备上的本地NLU排名模块处理本地解释候选和来自远程NLU服务器的一个或多个远程解释候选,以确定对应于自然语言输入的最终输出解释。NLU排名模块可以使用模糊匹配算法,以确定最终输出解释且/或在N最佳列表中对解释候选进行排名。NLU排名模块还可以在确定最终输出解释之前处理被识别为与本地数据源中表示的信息相关的远程解释候选。例如,NLU排名模块还可以使用来自远程NLU服务器的附加补充远程解释数据和来自本地数据源的数据,以确定最终输出解释。移动设备可以向远程NLU服务器转发NLU匹配模块的自然语言处理结果用于扩展远程解释候选。并且本地NLU排名模块还可以考虑来自远程NLU服务器的排名数据,以确定最终输出解释。【附图说明】图1示出用于移动设备的自然语言查询应用的一些示例屏幕截图。图2示出根据本专利技术的实施例所述的分布式自然语言处理系统的示例。图3是示出根据本专利技术的实施例所述的分布式自然语言处理中的各个功能步骤的流程图。【具体实施方式】本专利技术实施例涉及NLU处理的分布式客户端-服务器系统,所述NLU处理利用设备上的数据,在移动设备上进行一些本地处理,且使用服务器可用的数据和资源在服务器上进行一些远程处理。图2示出分布式自然语言处理系统的示例,而且图3是示出根据本专利技术的实施例所述的分布式自然语言处理中的各个功能步骤的流程图。并且“呼叫鲍勃(call bob)”的示例查询可以用于进一步地解释,并且为了进行所述讨论,假设现在电影院上映的最新的电影的名称为“呼叫鲍勃”。移动设备200从用户接收自然语言输入201(步骤301)。移动设备200向远程NLU服务器204转发自然语言输入201 (步骤302),所述远程NLU服务器204使用可用的远程数据资源205执行输入的NLU处理,以确定一个或多个远程解释候选。例如,移动设备200上的相对精简的自然语言理解(NLU)匹配模块202还使用模糊匹配算法执行结合本地数据源203的所述输入的本地NLU处理,以确定一个或多个本地解释候选(步骤303)。本地数据源203通常可包括但不限于设备的所有本地音乐列表、邮件内容、会议内容、联系人列表等。在一些实施例中,由NLU匹配模块202进行的本地NLU处理的部分或全部结果(例如,提及检测结果、语义附接提取、查询意图和/或语义分类结果)也可以向远程NLU服务器204转发,所述远程NLU服务器204可以使用该信息增加其自己的解释。移动设备200上的本地NLU排名模块206从远程NLU服务器204接收远程解释候选(步骤304),并且处理远程解释候选和来自NLU匹配模块202的本地解释候选,以将所组合的解释候选重新排名到所组合的N最佳列表(步骤305),并且确定对应于自然语言输入201的最终输出解释207 (步骤306)。在一些实施例中,远程NLU服务器204可以自己进行部分或全部候选排名,并且向移动设备200提供带有远程解释候选的排名结果的反馈。在此类系统中,可能有用的是,约束NLU服务器204不删除如果其访问了移动设备200上的部分本地数据203,可能会幸存下来的解释候选。也就是,远程解释候选的N最佳列表在此类情况下不需要删除。NLU服务器204可以基于已与示例查询相关联的用于音乐、会议、联系人信息等的NLU训练数据进行训练,从而通过NLU服务器204运行每个此类实例查询,以取得顶级结果。然后,NLU服务器204的训练可以在去除了可能位于本地移动设备200上的音乐、会议、联系人信息等数据的相同训练数据上反复进行,并且每个查询通过NLU服务器204重新运行并取得顶级结果。这样就产生了训练数据和NLU输出,即抽象特征可以从NLU输出构造。并且,如果NLU服务器204的顶级NLU结果对于每个训练查询实例都随伪本地数据的存在而变化,则经过训练的NLU服务器204现在可以在服务器侧识另Ij,如果本地移动设备200上的本地数据203可用,针对每个查询的所述查询是否将易受改变。在实际运行操作期间,如果NLU服务器204识别到给定的解释候选易受到本地数据203影响,则当该解释候选被发送到NLU排名器206用于在移动设备200上的进一步本地处理时,该解释候选被标记(且包含或许有用的其他有用的本地处理信息)。此类系统的一个效果是从NLU服务器204向本地NLU排名器20当前第1页1 2 本文档来自技高网...
【技术保护点】
一种用于分布式自然语言处理的系统,所述系统包括:存储在移动设备上的本地数据源的集合;所述移动设备上的本地自然语言理解NLU匹配模块,所述NLU匹配模块用于结合所述本地数据源对自然语言输入进行自然语言处理,以确定一个或多个本地解释候选;以及所述移动设备上的本地NLU排名模块,所述本地NLU排名模块用于处理所述本地解释候选和来自远程NLU服务器的一个或多个远程解释候选,以确定对应于所述自然语言输入的最终输出解释。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:马蒂厄·赫伯特,让菲利浦·罗比肖,克里斯多佛·M·帕里西安,
申请(专利权)人:纽昂斯通讯公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。