语法编译方法、语义解析方法以及对应装置制造方法及图纸

技术编号:9143159 阅读:157 留言:0更新日期:2013-09-12 04:42
本发明专利技术提供了一种语法编译方法、语义解析方法以及对应装置,按照语义的常用语句表达采用基于逻辑语法直观语言(LGML)预先定义对应的语法描述文件和词类描述文件,在语法描述文件中由词类、操作符和函数构成常用语句的描述,词类描述文件用于描述词类的具体取值;将语法描述文件和词类描述文件分别按照预设顺序的归约方法生成语法描述文件的语法树和词类描述文件的词类树,将词类树挂接在语法树中对应词类的位置,形成语义的语法树,从而实现语法编译。基于该方式建立的语义的语法树,采用整句匹配、语义映射匹配或者整句匹配和语义映射匹配相结合的方式进行语义解析。

【技术实现步骤摘要】
语法编译方法、语义解析方法以及对应装置
本专利技术涉及计算机应用
,特别涉及一种语法编译方法、语义解析方法以及对应装置。
技术介绍
语音识别和口语语义解析是语音交互产品的两个重要技术,语音识别是将语音的内容转换成文字,口语语义解析是理解口语语音信号承载的信息。语音识别率和口语语义解析的准确度直接影响用户体验。为了提高语音识别率和口语语义解析的准确度,目前主要采用的是W3C(万维网联盟)规范的两种上下文无关语法来构建识别空间,即利用BNF(巴克斯范式)形式的语法或基于XML(可扩展标记语言)格式的语法。人们说话的方式为自然口语,行为、措词和文本输入都有较大差异,例如口语中存在语法不严格和语序颠倒,W3C推荐的BNF语法和XML格式的语法为主流的大词汇量连续语音识别器所应用,但由于BNF和XML的解释层级深,采用这两种语法进行的语义映射和句法理解定义非常复杂,具有可读性差和可维护性差的缺陷,且很难进行相关的语法编译和语义解析。
技术实现思路
有鉴于此,本专利技术提供了一种语法编译方法、语义解析方法以及对应装置,以便于提高可读性和可维护性。具体技术方案如下:一种语法编译方法,按照语义的常用语句表达采用基于逻辑语法直观语言LGML预先定义对应的语法描述文件和词类描述文件,在所述语法描述文件中由词类、操作符和函数构成常用语句的描述,所述词类描述文件用于描述词类的具体取值;将所述语法描述文件和词类描述文件分别按照预设顺序的归约方法生成语法描述文件的语法树和词类描述文件的词类树;将所述词类树挂接在所述语法树中对应词类的位置,形成所述语义的语法树。根据本专利技术一优选实施方式,所述词类描述文件中包含词项,或者除了包含词项外还包含操作符和函数中的至少一种以描述各词项之间的关系。根据本专利技术一优选实施方式所述操作符包括以下至少一种:操作符+表示两个以上的操作数串联;操作符|表示两个以上的操作数并列关系;操作符()表示操作数形成一个不可忽略的组合;操作符[]表示操作数形成一个可忽略的组合;操作符;表示语句结束;操作符:表示词类描述文件中词类的解释关系;操作符“”表示引用了外部词典。根据本专利技术一优选实施方式,所述语法描述文件中的函数包括以下函数中的至少一种:函数&repeat(EXP,min,max)表示把语法片段EXP重复最少min遍,最多max遍;函数&repeat(EXP,n)表示把EXP重复n遍;函数&perm(EXP1,EXP2,…)表示把EXP1,EXP2,…做全排列;函数&grammar(gammar_name)表示语法名称为grammar_name的语法描述文件;函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)实现EXP到语义标签key的映射;其中函数&magic(EXP,key,default)在语法匹配过程中,当EXP与一个文本片段T匹配成功时,key的值为T,否则key的值为default;函数&magic(EXP,key,default,display)在语法匹配过程中,当EXP与一个文本片段T匹配成功时,key的值为display,否则key的值为default。根据本专利技术一优选实施方式,所述词类描述文件中的函数包括以下函数中的至少一种:函数&repeat(EXP,min,max)表示把语法片段EXP重复最少min遍,最多max遍;函数&repeat(EXP,n)表示把EXP重复n遍;函数&perm(EXP1,EXP2,…)表示把EXP1,EXP2,…做全排列。根据本专利技术一优选实施方式,在所述语义的语法树中,叶节点为词类描述文件中的词项或者引用的外部词典,非叶节点为操作符或函数名,非叶节点的操作数为该非叶节点的各子树表示的内容。根据本专利技术一优选实施方式,在所述语义的语法树中所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)作为非叶节点进行标识,保存所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)对应的映射表。一种语义解析方法,该语义解析方法包括:将待解析文本在采用上述语法编译方法得到的语法树上按照所述预设顺序进行匹配,如果所述待解析文本完全与所述语法树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义。根据本专利技术一优选实施方式,在所述匹配的过程中,如果所述待解析文本中某文本片段与所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所标识的子树匹配,则在解析结果中所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所对应的映射表中key的取值为该文本片段或映射表中display的取值。一种语义解析方法,该语义解析方法包括:将待解析文本在采用上述语法编译方法得到的语法树上按照所述预设顺序进行前向最大匹配,如果所述待解析文本中存在文本片段与所述语法树中函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所标识的子树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义。根据本专利技术一优选实施方式,在解析结果中匹配的函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所对应的映射表中key的取值为该文本片段或映射表中display的取值。根据本专利技术一优选实施方式,只有所述待解析文本中存在文本片段与所述语法树中预设的关键函数&magic(EXP,key,default,display)或关键函数&magic(EXP,key,default)所标识的子树匹配,才将所述语法树所对应的语义确定为所述待解析文本的语义。一种语义解析方法,该语义解析方法包括:S1、将待解析文本在采用上述语法编译方法得到的语法树上按照所述预设顺序进行匹配,如果所述待解析文本完全与所述语法树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义;否则执行步骤S2;S2、将所述待解析文本在所述语法树上按照所述预设顺序进行前向最大匹配,如果所述待解析文本中存在文本片段与所述语法树中函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所标识的子树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义。根据本专利技术一优选实施方式,在解析结果中匹配的函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所对应的映射表中key的取值为该文本片段或映射表中display的取值。一种语法编译装本文档来自技高网...
语法编译方法、语义解析方法以及对应装置

【技术保护点】
一种语法编译方法,其特征在于,按照语义的常用语句表达采用基于逻辑语法直观语言LGML预先定义对应的语法描述文件和词类描述文件,在所述语法描述文件中由词类、操作符和函数构成常用语句的描述,所述词类描述文件用于描述词类的具体取值;将所述语法描述文件和词类描述文件分别按照预设顺序的归约方法生成语法描述文件的语法树和词类描述文件的词类树;将所述词类树挂接在所述语法树中对应词类的位置,形成所述语义的语法树。

【技术特征摘要】
1.一种语法编译方法,其特征在于,按照语义的常用语句表达采用基于逻辑语法直观语言LGML预先定义对应的语法描述文件和词类描述文件,在所述语法描述文件中由词类、操作符和函数构成常用语句的描述,其中词类和函数作为操作符的操作数,词类作为独立的操作数或者作为函数中的参数,所述词类描述文件用于描述词类的具体取值;将所述语法描述文件和词类描述文件分别按照预设顺序的归约方法生成语法描述文件的语法树和词类描述文件的词类树;将所述词类树挂接在所述语法树中对应词类的位置,形成所述语义的语法树。2.根据权利要求1所述的语法编译方法,其特征在于,所述词类描述文件中包含词项,或者除了包含词项外还包含操作符和函数中的至少一种以描述各词项之间的关系。3.根据权利要求1或2所述的语法编译方法,其特征在于,所述操作符包括以下至少一种:操作符+表示两个以上的操作数串联;操作符|表示两个以上的操作数并列关系;操作符()表示操作数形成一个不可忽略的组合;操作符[]表示操作数形成一个可忽略的组合;操作符;表示语句结束;操作符:表示词类描述文件中词类的解释关系;操作符“”表示引用了外部词典。4.根据权利要求1所述的语法编译方法,其特征在于,所述语法描述文件中的函数包括以下函数中的至少一种:函数&repeat(EXP,min,max)表示把语法片段EXP重复最少min遍,最多max遍;函数&repeat(EXP,n)表示把EXP重复n遍;函数&perm(EXP1,EXP2,…)表示把EXP1,EXP2,…做全排列;函数&grammar(gammar_name)表示语法名称为grammar_name的语法描述文件;函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)实现EXP到语义标签key的映射;其中函数&magic(EXP,key,default)在语法匹配过程中,当EXP与一个文本片段T匹配成功时,key的值为T,否则key的值为default;函数&magic(EXP,key,default,display)在语法匹配过程中,当EXP与一个文本片段T匹配成功时,key的值为display,否则key的值为default。5.根据权利要求2所述的语法编译方法,其特征在于,所述词类描述文件中的函数包括以下函数中的至少一种:函数&repeat(EXP,min,max)表示把语法片段EXP重复最少min遍,最多max遍;函数&repeat(EXP,n)表示把EXP重复n遍;函数&perm(EXP1,EXP2,…)表示把EXP1,EXP2,…做全排列。6.根据权利要求1所述的方法,其特征在于,在所述语义的语法树中,叶节点为词类描述文件中的词项或者引用的外部词典,非叶节点为操作符或函数名,非叶节点的操作数为该非叶节点的各子树表示的内容。7.根据权利要求4所述的方法,其特征在于,在所述语义的语法树中所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)作为非叶节点进行标识,保存所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)对应的映射表。8.一种语义解析方法,其特征在于,该语义解析方法包括:将待解析文本在采用如权利要求1、2、4、5、6或7任一权项所述语法编译方法得到的语法树上按照所述预设顺序进行匹配,如果所述待解析文本完全与所述语法树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义。9.根据权利要求8所述的解析方法,其特征在于,当采用如权利要求7所述的语法编译方法得到的语法树时,在所述匹配的过程中,如果所述待解析文本中某文本片段与所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所标识的子树匹配,则在解析结果中所述函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所对应的映射表中key的取值为该文本片段或映射表中display的取值。10.一种语义解析方法,其特征在于,该语义解析方法包括:将待解析文本在采用如权利要求7所述语法编译方法得到的语法树上按照所述预设顺序进行前向最大匹配,如果所述待解析文本中存在文本片段与所述语法树中函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所标识的子树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义。11.根据权利要求10所述的方法,其特征在于,在解析结果中匹配的函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所对应的映射表中key的取值为该文本片段或映射表中display的取值。12.根据权利要求10所述的方法,其特征在于,只有所述待解析文本中存在文本片段与所述语法树中预设的关键函数&magic(EXP,key,default,display)或关键函数&magic(EXP,key,default)所标识的子树匹配,才将所述语法树所对应的语义确定为所述待解析文本的语义。13.一种语义解析方法,其特征在于,该语义解析方法包括:S1、将待解析文本在采用如权利要求7所述语法编译方法得到的语法树上按照所述预设顺序进行匹配,如果所述待解析文本完全与所述语法树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义;否则执行步骤S2;S2、将所述待解析文本在所述语法树上按照所述预设顺序进行前向最大匹配,如果所述待解析文本中存在文本片段与所述语法树中函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所标识的子树匹配,则将所述语法树所对应的语义确定为所述待解析文本的语义。14.根据权利要求13所述的方法,其特征在于,在解析结果中匹配的函数&magic(EXP,key,default,display)或函数&magic(EXP,key,default)所对应的映射表中key的取值为该文本片段或映射表中display的取值。15.一种语法编译装置,其特征在于,该语法编译装置包括:文件存储单元,用于存储语义对应的语法描述文件和词类描述文件,所述语法描述文件和词类描述文件是按照语义的常用语句表达采用基于逻辑语法直观语言LGML预先定义的,在所述语法描述文件中由词类、操作符和函数构成常用语句的描述,其中词类和函数作为操作符的操作数,词类作为...

【专利技术属性】
技术研发人员:王育军贾磊万广鲁蒋正翔
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1