【技术实现步骤摘要】
针对用户操作指令的解析方法及装置
本说明书实施例涉及计算机
,具体地,涉及一种针对用户操作指令的解析方法及装置。
技术介绍
越来越多的行业利用人机交互系统,向用户提供服务。例如,餐饮行业中利用语音点餐系统向用户提供点餐服务,又例如,交通行业中利用智能售票系统向用户提供票务服务。这些人机交互系统通常包括语音识别、自然语言理解、自然语言生成、语音合成等几个主要的功能模块,其中自然语言理解模块是整个系统的核心部分,负责理解用户输入,解析用户操作指令,如解析出用户想在购物车中添加某一商品。然而,目前因自然语言理解模块对用户操作指令的解析能力有限,通常要求用户按照较为简短的、相对固定的句式进行语音输入,使得用户的输入自由度和灵活度受到限制。因此,迫切需要一种合理、可靠的解析算法,可以支持不同用户的复杂多变的输入,同时精准地解析出用户操作指令,从而提高用户体验。
技术实现思路
本说明书中的一个或多个实施例提供一种针对用户操作指令的解析方法,利用预先设定的语义模板集,对用户输入文本进行循环解析,从而实现从用户复杂多变的个性化输入中,精准、高效地解析出一个或多个用户操作指令。第一方面,提供一种针对用户操作指令的解析方法,该方法包括:获取输入文本,其对应于在提供第一服务的过程中接收的用户语音输入。对所述输入文本进行分词处理,得到多个分词,组成分词序列。将所述分词序列中,与所述第一服务中的商品描述相关的若干分词分别转化为预定格式的标记符,得到包括分词和标记符的混合序列。获取预先设定的语义 ...
【技术保护点】
1.一种针对用户操作指令的解析方法,包括:/n获取输入文本,其对应于在提供第一服务的过程中接收的用户语音输入;/n对所述输入文本进行分词处理,得到多个分词,组成分词序列;/n将所述分词序列中,与所述第一服务中的商品描述相关的若干分词分别转化为预定格式的标记符,得到包括分词和标记符的混合序列;/n获取预先设定的语义模板集,所述语义模板集包括对多个语义模板的第一定义,每个语义模板包括多个语义描述符的预定组合排列,且对应于一种操作类型;所述多个语义描述符包括对应于所述标记符的组合的商品描述符;/n基于所述语义模板集,对初始为所述混合序列的当前序列进行循环解析;其中任意一次循环解析包括,从当前序列头部开始,截取出与所述多个语义模板中的某个语义模板匹配的序列部分,至少根据该某个语义模板对应的操作类型和该序列部分中对应于商品描述符的标记符组合,得到解析出的操作指令,并更新当前序列。/n
【技术特征摘要】
1.一种针对用户操作指令的解析方法,包括:
获取输入文本,其对应于在提供第一服务的过程中接收的用户语音输入;
对所述输入文本进行分词处理,得到多个分词,组成分词序列;
将所述分词序列中,与所述第一服务中的商品描述相关的若干分词分别转化为预定格式的标记符,得到包括分词和标记符的混合序列;
获取预先设定的语义模板集,所述语义模板集包括对多个语义模板的第一定义,每个语义模板包括多个语义描述符的预定组合排列,且对应于一种操作类型;所述多个语义描述符包括对应于所述标记符的组合的商品描述符;
基于所述语义模板集,对初始为所述混合序列的当前序列进行循环解析;其中任意一次循环解析包括,从当前序列头部开始,截取出与所述多个语义模板中的某个语义模板匹配的序列部分,至少根据该某个语义模板对应的操作类型和该序列部分中对应于商品描述符的标记符组合,得到解析出的操作指令,并更新当前序列。
2.根据权利要求1所述的方法,其中,所述第一服务为点餐服务或购物服务,在得到解析出的操作指令之后,所述方法还包括:
基于所述操作指令,更新用户的已点商品或购物车。
3.根据权利要求1所述的方法,其中,获取输入文本,包括:
获取所述用户语音输入;
对所述用户语音输入进行语音识别,得到所述输入文本。
4.根据权利要求1所述的方法,其中,所述标记符包括表示商品描述词的第一标记符;
将所述分词序列中,与所述第一服务中的商品描述相关的若干分词转化为预定格式的标记符,包括:
利用商品描述词集合,对所述多个分词进行匹配,得到若干匹配词,其中商品描述词集合基于所述第一服务中可提供的多种商品而预先确定;
将所述分词序列中的所述若干匹配词分别转化为所述第一标记符。
5.根据权利要求4所述的方法,其中,所述标记符还包括用于指示对单品描述中止的中止符;将所述分词序列中,与所述第一服务中的商品描述相关的若干分词转化为预定格式的标记符,还包括:
判断所述分词序列中相邻的两个分词之间是否存在关联;
在判断出所述两个分词之间不存在关联的情况下,在所述两个分词对应的两个第一标记符之间添加所述中止符;
其中,所述商品描述符对应于若干第一标记符和所述中止符的组合。
6.根据权利要求5所述的方法,其中,判断所述两个分词之间是否存在关联,包括:
基于预先确定的对应于多种商品的多个商品描述词子集,判断所述两个分词是否存在于同一商品描述词子集中;
如果所述两个分词未存在于同一商品描述词子集中,则判断出所述两个分词之间不存在关联。
7.根据权利要求5所述的方法,其中,判断所述两个分词之间是否存在关联,包括:
基于预先建立的商品描述词和描述类别标签之间的映射关系,确定所述两个分词对应的两个描述类别标签;
基于预先设定的标签关联规则,确定所述两个描述类别标签之间是否存在关联;
如果所述两个描述类别标签之间不存在关联,则判断出所述两个分词之间不存在关联。
8.根据权利要求7所述的方法,其中,所述映射关系基于多个商品描述词和多个描述类别标签而预先建立,其中多个描述类别标签包括以下中的至少一个:商品种类、商品属性、商品常用名。
9.根据权利要求1所述的方法,其中,所述多个语义描述符还包括以下中的至少一项:若干种操作类型描述符,数量描述符,单位描述符。
10.根据权利要求1所述的方法,其中,所述语义模板集还包括对所述多个第二描述符的第二定义;
所述从当前序列头部开始,截取出与所述多个语义模板中的某个语义模板匹配的序列部分,包括:
基于所述第二定义,从所述当前序列头部开始,依次将各个分词或标记符转化为对应的语义描述符,使得转化得到的第一语义描述符序列,与所述多个语义模板中的第一语义模板相匹配;
将当前序列中与所述第一语义描述符序列对应的部分截取为所述序列部分。
11.根据权利要求10所述的方法,其中,基于所述第二定义,从所述当前序列头部开始,依次将各个分词或标记符转化为对应的语义描述符,使得转化得到的第一语义描述符序列,与所述多个语义模板中的第一语义模板相匹配,包括:
基于所述第二定义,依次将所述当前序列中的分词或标记符分别转化为对应的若干备选语义描述符,从而得到多个语义描述符序列,该多个语义描述符序列与所述多个语义模板中的多个第二语义模板相匹配;
基于所述多个语义描述符序列所对应的多个分词子序列,从所述多个语义描述符序列中确定出所述第一语义描述符序列。
12.根据权利要求11所述的方法,其中,基于所述多个语义描述符序列所对应的多个分词子序列,从所述多个语义描述符序列中确定出所述第一语义描述符序列,包括:
从所述多个分词子序列中,确定出包含分词数量最多的最长分词子序列,并将其对应的语义描述符序列确定为所述第一语义描述符序列。
13.根据权利要求11所述的方法,其中,基于所述多个语义描述符序列所对应的多个分词子序列,从所述多个语义描述符序列中确定出所述第一语义描述符序列,包括:
将所述多个分词子序列分别输入预先训练的关联度预测模型中,得到多个预测关联度;
确定所述预测关联度中的最大值,并将其对应的分词子序列所对应的语义描述符序列,确定为所述第一语义描述符序列。
14.根据权利要求1所述得方法,其中,至少根据该某个语义模板对应的操作类型和该序列部分中对应于商品描述符的标记符组合,得到解析出的操作指令,包括:
至少根据所述标记符组合所对应的原始分词,解析出商品信息;
基于所述操作类型和所述商品信息,得到对应的操作指令。
15.根据权利要求14所述的方法,其中,所述多个语义描述符中还包括数量描述符;至少根据所述标记符组合所对应的原始分词,解析出商品信息,还包括:
根据该序列部分中包含的与数量描述符对应的原始分词,确定商品数量,归入所述商品信息。
16.根据权利要求1所述的方法,其中,更新当前序列,包括:
从所述当前序列中去除与所述某个语义模板匹配的序列部分,得到更新后的当前序列。
17.一种针对用户操作指令的解析装置,包括:<...
【专利技术属性】
技术研发人员:王世镇,刘思叶,周志衡,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。